DOI QR코드

DOI QR Code

A Study of Disambiguation Method To Improve The Syntactic Analysis System

구문 분석의 결과로 나타나는 구조의 모호성을 해결하기 위한 방법 연구

  • Park, Yong Uk (School of Information Technology, Ulsan College)
  • 박용욱 (울산과학대학교 컴퓨터정보학부)
  • Received : 2014.12.05
  • Accepted : 2015.04.09
  • Published : 2015.04.30

Abstract

In this paper, we present a Korean syntactic analysis system which can generate all possible syntactic trees in a given sentence. Therefore, the number of syntactic trees by this syntactic analysis system can be increased exponentially. To solve this problem, we suggest a segmentation method and maximum connected unit in a segmentation. Maximum connected unit is a combined unit which contains all morphemes in a segmentation. According to the input sentence, it is possible one or more maximum connected unit in a segmentation. We extract 516 sentences to experiment randomly from the text book of Korean middle school. We could reduce about 28% of the number of syntactic trees.

본 논문에서는 형태소 단위의 입력요소에 대해 의존규칙을 적용하여 가능한 모든 구분분석 구조를 생성할 수 있는 알고리즘을 적용한 구문분석기를 구현하였다. 따라서 형태소의 수가 증가함에 따라 생성되는 구문분석 트리의 개수가 기하급수적으로 증가할 수 있다. 이를 해결하기 위하여 본 논문에서는 주어진 문장에 대해 문장의 기본 구성요소들에 대하여 구간을 나누고, 나누어진 구간에서 최대연결단위를 구성하였다. 최대연결단위는 한 구간에 존재하는 모든 형태소가 결합된 것을 의미한다. 입력되는 문장에 따라서 한 구간에 하나 이상의 최대연결단위가 구성될 수 있다. 중학교 교과서에서 임의로 추출한 10어절 이내의 516문장에 대하여 실험한 결과 제안한 방법을 사용하지 않은 방법에 비해 약 28%의 개선효과가 있었다.

Keywords

References

  1. D. R. Ra, "A Study about Korean Language Parsing", Journal of KIISE, vol.12, No.8, pp33-46, 1994.
  2. Y. T. Kim "Natural Language Processing," SaengRung Press, 2001.
  3. H. C. Kwon, J. Y. Choi, "A Korean Parser Using Dependency Grammar based on Unification," Journal of KIISE : Software and Application, vol.19, No.5, pp.467-476, 1992.
  4. E. K. Park, D. Y. Ra, "Processing Dependent Nouns Based on Chunking for Korean Syntactic Analysism." Korean Journal of Cognitive Science, vol.17, no.2, pp.119-138, 2006.
  5. G. E. Im, Y. I. Jung, H. C. Kwon, "Implementation of Dependency Parser using Argument Information based on Korean WordNet,", Proc. of the 19th Human and Cognitive Language Technology, vol.24, no.1, pp.158-164, 2007.
  6. Y. U. Park, H. C. Kwon, "A Study of Paring System Implementation Using Segmentation and Argument Information", Journal of Korea Multimedia Society Vol. 16, No. 3, pp366-374, 2013. DOI: http://dx.doi.org/10.3346/jkms.2001.16.3.366
  7. J. H. Yang, Y. T. Kim, "Korean Analysis using Multiple Knowledge Sources," Journal of KIISE, vol.21, No.7, pp.1324-1332, 1994.
  8. C. J. Kim, C. Y. Jung, Y. H. Seo, "An Efficient Korean Syntactic Analyzer Using Partial Combination of Words," Proc. of the KIISE Autumn Conference, vol22, no.2(A), pp597-600, 1995.
  9. Y. G. Hwang, H. Y. Lee, Y. S. Lee, "Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity", Journal of KIISE : Software and Application, vo.27, no.7, pp784-793, 2000.
  10. Y. H. Lee, J. H. Lee, "Korean Dependency Parsing Using Online Learning," Proc. of the KIISE Korea Computer Congress 2010, vo.37, no.1(C), pp299-304, 2010.
  11. E. K. Park, M. H. Cho, S. W. Kim, D. Y. Ra, "A Method for Extracting Dependency Relations Using Chunking and Segmentation", Proc. of the 16th Human & Cognitive Language Technology, Vol.16, no.1, pp131-137. 2004.