DOI QR코드

DOI QR Code

Korean Parser Using Segmentation Based on Dependency Grammar

의존문법 기반의 구간 분할법을 활용한 한국어 구문 분석기

  • 박용욱 (울산과학대학 컴퓨터정보학부)
  • Published : 2009.08.31

Abstract

Recently, most Korean syntactic analysis systems use Dependency Grammar, because it is quite good to analysis of Korean language structures. But Dependency Grammar makes many ambiguities during syntax analysis of Korean. We implement a system which decreases many ambiguities in syntax analysis. To decrease ambiguities we suggest several methods. First, we use about 200 dependency rules, second, we suggest a new segmentation method and third, one predicate can not have more than one subject or object. Using these methods, we can reduce many ambiguities in Korean syntactic analysis.

최근 대부분의 한국어 구문분석기는 의존문법(Dependency Grammar)을 사용하고 있는데, 그 이유는 한국어의 특성인 어순이 비교적 자유롭고 생략이 잦은 문장에 대한 처리가 용이하기 때문이다. 하지만 의존문법을 이용한 한국어 구문분석은 많은 중의성을 도출하는 문제점이 대두되고 있다. 본 논문에서는 이러한 중의성을 보다 효과적으로 해결하기 위하여 200개가 넘는 의존문법 규칙과 문장의 구성성분을 이용한 구간분할방법, 관형형어미가 붙은 용언에 대한 처리 및 같은 용언에 중복된 구성성분 결합제한 방법을 사용한 구문분석기를 제안한다. 실험 결과 중의성 제거에 많은 효과가 있음을 보여준다.

Keywords

References

  1. 권혁철, 최준영, "단일화 기반 의존 문법을 이용한 한국어 분석기", 한국정보학회 논문지 ‘92.9 Vol.19, No.5, September
  2. 임경업, 정영임, 권혁철, "한국어 어휘의휘어미망에 기반한 논항 정보를 이용한 의존문법 구문분석기의 구현", 제19회 한글 및 한국어 정보처리 학술대회 pp.158-163, 2007
  3. 김광배, 박의규, 나동렬, 윤준태, "구간 분할 기반 한국어 구문분석", 제14회 한글 및 한국어 정보처리 학술대회 pp.163-168, 2002
  4. "자연언어처리", 김영택 외 공저, 생능출판사
  5. 이현영, 황이규, 이용석, "문형과 단문 분할을 이용한 한국어 구문 모호성 해결", 제12회 한글 및 한국어정보처리 학술대회 pp.116-123, 2000
  6. 이현영, 이용석, "문형을 제약조건으로 하는 단문 분할 기반 한국어 구문분석", 제18회 한글 및 한국어정보처리 학술대회 pp.140-147, 2006
  7. 박의규, 나동열, "한국어 구문분석을 위한 구묶음 기반 의존 명사 처리", 인지과학 제17권 제 2호, pp119-138, 2005
  8. 김광진, 송형훈, 이정현, "한국어 내포문을 단문으로 분리하는 시스템의 구현", 제5회 한글 및 한국어정보처리 학술대회, pp.333-352, 1993
  9. 은지현, 정민우, 이근배, "확률적 차트 파싱에 기반한 한국어 의존 구조 분석기", 제17회 한글 및 한국어정보처리 학술대회 논문집, pp.105-111, 2005
  10. 이미경, 정한민, 성원경, 박동인, "품사 표지 부착 말뭉치 검증", 제17회 한글 및 한국어 정보처리 학술대회 논문집, pp145-150, 2005
  11. 김창제, 정천영, 김영훈, 서영훈, "부분적인 어절결합을 이용한 효율적인 한국어 구문 분석기", 한국정보과학회 가을 학술발표논문집, vol. 22, No.2, 1995
  12. 전은희, 이성욱, 서정연, "한국어 동사의 격틀 정보를 이요한 구문분석 후처리기", 제13회 한글 및 한국어정보처리 학술대회 논문집, pp.445-449, 2001
  13. 윤준태, "공기 관계 기반 어휘 연관도를 이용한 한국어 구문 분석", 연세대학교 박사학위논문, 1997
  14. 조형준, "한국어 병렬구문과 결합범주문법에서의 구문분석" 한국과학기술원 석사학위논문, 1999
  15. I.A. Mel'cuk, Dependency Syntax : Theory and Practice, State Univ. of New York Press, 1988