동적 프로그래밍기법에 근거한 예측중심의 한국어 형태소 분석

Predictive Morphological Analysis of Korean with Dynamic Programming

  • 발행 : 1994.06.01

초록

본 논문은 단어를 구성하는 모든 가능한 형태소열 생성하는 효율적인 한국어 형태소분석 모델을 제시한다.본 논문의 형태소분석 모델은 결정적인(deterministic) 철자규칙의 적용을 보장하며,복합어나 중의성을 지니는 단어의 경우에도 불필요한 계산을 방지한다.이러한 효율성의 획득은 (1)철자규칙을 해석하는 새로운 방법. (2)입력단어에 적합한 철자규칙만을 적용하는 예측중심의 규칙적용방법.(3)중의성이 있는 단어의 경우 이미 분석된 형태부분의 반복계산을 방지하는 동적 프로그래밍 기법의 사용에 의한 새로운 분석기술에 의하여 이루어진다.본 논문에서는 제시된 형태소 분석 모델은 국민학교 국어교과서에서 무작위로 추출된 413,975개의 단어 를 대상으로 실험되었으며, 실험 결과는 본 모델이 효율적이면서도 견고한 형태소 분석을 보장하는것으로 나타났다.

키워드