Language Model Smoothing for Korean Morpheme Recovery

한국어 형태소 복원을 위한 언어모델의 평탄화(smoothing)

  • Lee, Daniel (Dept. of Information & Industrial Engineering, Chungbuk National University) ;
  • Kim, Bo-Gyum (Dept. of Computer Education, Chungbuk National University) ;
  • Lee, Jae-Sung (Dept. Digital Informatics and Convergence, Chungbuk National University)
  • 이다니엘 (충북대학교 정보산업공학과) ;
  • 김보겸 (충북대학교 컴퓨터교육과) ;
  • 이재성 (충북대학교 디지털정보융합학과)
  • Published : 2012.06.22

Abstract

형태소 복원은 형태소 분석의 한 단계로 문장에 나타난 형태소의 변형 현상을 분석하여 규칙화하고 이를 이용하여 형태소 원형을 복원하는 것이다. 본 논문에서는 형태소 품사 부착 말뭉치로부터 다양한 형태소 변화 규칙을 학습하여 효과적으로 형태소 원형을 복원하기 위한 계산 방법을 비교한다. 이를 위해 계산 모델, 한글 코드, 학습 자료를 다르게 하여 학습하고 그에 따른 성능을 비교 분석한다.

Keywords