DOI QR코드

DOI QR Code

Semi-Automatic Construction of Morphological Pattern Dictionary using the Method of Morphological Synthesis

형태소 합성 기법을 이용한 형태소 패턴 사전의 반자동 구축

  • 박인철 (호원대학교 컴퓨터게임학부)
  • Received : 2011.10.12
  • Accepted : 2011.11.10
  • Published : 2011.11.30

Abstract

One approach for very high speed korean morphological analysis is to use pre-built morphological results in dictionary. It pays the high cost to build this morphological pattern dictionary manually, besides the dictionary may contain errors. This paper proposes a method to generate morphological patterns automatically using Korean morphological synthesis. The experiment shows that we automatically generate 86% morphological patterns for analyzing Korean sentences. It takes 52.68 seconds for the morphological system using the patterns to analyze 403MB Korean corpus on 2.8GHz Window system.

초고속 한국어 형태소 분석을 위한 하나의 방법은 사전에 형태소 결과를 미리 저장해 놓고 이를 이용하는 것이다. 이러한 형태소 패턴 사전을 수작업으로 구축하려면 많은 비용이 들 뿐만 아니라 적지 않은 오류가 포함될 수 있다. 본 논문은 한국어 형태소 합성을 이용하여 자동으로 형태소 패턴을 생성하는 방법을 제안한다. 실험을 통해, 올바른 형태소 분석을 위해 사용한 형태소 패턴의 86%를 자동으로 생성함을 알 수 있었다. 형태소 패턴을 이용한 형태소 분석기가 403MB의 한국어 코퍼스를 분석하는 데 걸린 시간은 2.8GHz 윈도우 시스템에서 52.68초였다.

Keywords

References

  1. J.H. Kim, C.Y. Ok, "Korean Morphological Analysis using Inflected-Word-Dictionary", Proc. of KIISE Spring Conference, Vol. 21, No. 1, pp.813-816, 1994.
  2. S.H Yang, Y.S. Kim, "A High-Speed Korean Morphological Analysis Method based on Pre-Analyzed Partial Words", Journal of KIISE:Software and Applications, Vol. 27, No. 3, pp.290-301, 20004.
  3. K.S Shim, J.H.Yang," High Speed Korean Morphological Analysis based on Adjacency Condition Check ", Journal of KIISE:Software and Applications, Vol. 31, No. 1, pp.89-99, 2004.
  4. Y.K. Kim, M.S. Park, J.S. Choi, H.C. Kwon, "Improvement of Analysis Speed in Korean Morphological Analyzer Using Ameliorated Dictionary", Proc. of the 11th Human & Cognitive Language Technology, pp.479-483, 1999.
  5. S.S. Kang, "Korean Morphological Analysis Using Syllable Information and Multiword Unit Information", Ph. D. Thesis, Seoul National University, 1993.
  6. C.S Kim, W.J Bae, Y.S. Lee, Junichi Aoe, "Construction of Korean Electronic Dictionary Using Double-array Trie Structure", Journal of KIISE(B), Vol. 23, No. 1, pp.85-94, 1996.