Development of Broad-Coverage Korean Dependency Parser BCD-KL-Parser

한국어 구문분석 시스템 BCD-KL-Parser의 개발

  • Kim, Minho (Pusan National University, Dept. of Electrical Computer Engineering) ;
  • Kim, Seongtae (Pusan National University, Dept. of Electrical Computer Engineering) ;
  • Kwon, Hyuk-Chul (Pusan National University, Dept. of Electrical Computer Engineering)
  • 김민호 (부산대학교 전기전자컴퓨터공학과) ;
  • 김성태 (부산대학교 전기전자컴퓨터공학과) ;
  • 권혁철 (부산대학교 전기전자컴퓨터공학과)
  • Published : 2018.10.12

Abstract

본 연구진은 모든 형태소 분석 후보에 적절한 의존관계를 부여하여 구문분석 트리 후보를 순위화하여 제시하는 한국어 구문 분석 시스템 BCD-KL-Parser를 개발하고 있다. 이 시스템의 최종목표는 형태소 분석후보와 구문분석 트리 후보를 줄여나감으로써, 구문분석의 정확도와 실행 속도를 높이는 것이다. 본 논문에서 소개하는 BCD-KL-Parser에서는 형태적 중의성 해소규칙을 정의하여 형태소 분석후보의 수를 줄이고, 용언의 하위범주화 정보와 선택제약 정보 그리고 의존관계 제약규칙을 정의하여 구문분석 트리 후보의 수를 최소화할 수 있었다. 그 결과 '21세기 세종계획 구문분석 말뭉치'에서 무작위로 추출한 2,167문장에 대하여 UAS 92.27%를 달성할 수 있었다.

Acknowledgement

Supported by : 삼성전자 미래기술육성센터