m차 Markov 한글 정보원의 효율적인 구현에 관한 연구

A Study of An Efficiant Implementation for the m-th order Markov Hangul Information Source

  • 남기동 (인하대학교 전자계산학과) ;
  • 홍종준 (인하대학교 전자계산학과) ;
  • 김인대 (인하대학교 전자계산학과) ;
  • 이균하 (인하대학교 전자계산학과)
  • Nam, Ki-Dong (Department of Computer Science, Inha University) ;
  • Hong, Jong-Joon (Department of Computer Science, Inha University) ;
  • Kim, En-Dae (Department of Computer Science, Inha University) ;
  • Lee, Kyoon-Ha (Department of Computer Science, Inha University)
  • 발행 : 1991.10.18

초록

본 논문은 한글 정보원을 Markov source로 구현하였을 때 요구되는 terra byte 이상의 방대한 기억 공간의 점유를 해결하기 위해, 이에 대한 통계자료를 조사하고 이를 기초로 기억 공간을 줄일 수 있는 방안을 제안하였다. 제안된 방식에 의해 한글 정보원을 천이확률에 따라서 구현시 paged list 구조로 7차 이상의 Markov 한국어 정보원을 수백 Kbyte의 기억 공간으로 구현 할 수 있었다. 그리고, Markov 한국어 정보원의 활용도를 넓히기 위하여 backward Markov 정보원을 제안하였다. 본 연구에서 제안한 방법은 한글 문장에서 손실된 단어의 수정뿐만이 아니라 기타 Markov source를 한글에 적용하는 모든 분야에 기초적인 자료로 활용될 것으로 기대된다.

키워드