Disambiguation of Counting Unit Noun using Word Embedding

단어 임베딩을 이용한 단위성 의존명사 분별

  • 이주상 (울산대학교, 한국어처리연구실) ;
  • 옥철영 (울산대학교, 한국어처리연구실)
  • Published : 2016.10.07

Abstract

단위성 의존명사는 수나 분량 따위를 나타내는 의존명사로 혼자 사용할 수 없으며 수사나 수관형사와 함께 사용하는 의존명사이다. 단위성 의존명사가 2가지 이상인 동형이의어의 경우 기존의 인접 어절을 이용한 동형이의어 분별 모델에서는 동형이의어 분별에 어려움이 있다. 본 논문에서는 단위성 의존명사 분별을 위해 단어 임베딩을 사용했으며 총 115,767개의 단어를 벡터로 표현하였으며 분별할 의존명사 주변에 등장한 명사들과의 유사도를 계산하여 단위성 의존명사를 분별하였다. 단어 임베딩을 이용한 단위성 의존명사 분별이 효과가 있음을 보았다.

Acknowledgement

Grant : Symbolic Approach 기반 인간모사형 자가 학습 지능 원천 기술 개발

Supported by : 정보통신기술진흥센터