방향성을 이용한 한국어 비재귀 명사구 인식 모델

Korean BaseNP Identification Model using Forward and Backward Processing Characteristics

  • 이신목 (한국과학기술원 전자전산학과) ;
  • 강인호 (한국과학기술원 전자전산학과) ;
  • 김길창 (한국과학기술원 전자전산학과)
  • Lee, Sheen-Mok (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
  • Kang, In-Ho (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
  • Kim, Gil-Chang (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST)
  • 발행 : 2001.10.12

초록

비재귀 명사구(baseNP)는 단순한 단어 패턴과 품사 패턴에 의하여 쉽게 인식되므로, 자연어처리의 다양한 분야에서 활용한다. 교착어의 지배 성분 후위 원칙에 의하여 한국어 비재귀 명사구 인식은 보다 많은 광역 정보를 필요로 하므로, 본 논문에서는 광역 정보의 활용이 쉬운 상태 기반 모델을 사용한다. 본 논문은 상태 기반의 한국어 비재귀 명사구 인식에서 방향성을 고려한다. 교착어의 특성상 한국어 비재귀 명사구는 처음 위치가 끝 위치에 비하여 인식이 어려운 특징을 가지므로 방향성을 고려하여 오른쪽 우선의 방범을 활용한 경우, 모델의 특성 및 성능이 변화한다. 본 논문에서는 기존의 왼쪽 우선 방법과 새로이 제안하는 오른쪽 우선 방법을 각각 적용하고, 양 방법을 통합하는 방법들을 제안한다. 통합 결과 92.55%의 정확률과 90.90%의 재현률을 얻었다.

키워드