DOI QR코드

DOI QR Code

Bilingual Lexicon Extraction Using Self-Organizing Maps

자기조직화 지도를 이용한 이중언어사전 자동 구축

  • Seo, Hyeong-Won (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Cheon, Minah (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime and Ocean University)
  • 서형원 (한국해양대학교 컴퓨터 공학과) ;
  • 천민아 (한국해양대학교 컴퓨터 공학과) ;
  • 김재훈 (한국해양대학교 컴퓨터 공학과)
  • Published : 2015.04.22

Abstract

본 논문은 인공신경망(artificial neural network)의 한 종류인 자기조직화 지도(self-organizing map)를 이용하여 비교말뭉치(comparable corpora)로부터 이중언어사전(bilingual lexicon)을 자동으로 구축하는 방법에 대하여 기술한다. 일반적으로 우리가 대상으로 하는 언어 쌍마다 말뭉치 혹은 초기사전과 같은 언어 자원을 수집하고 그것을 필요에 맞게 가공하는 것은 매우 어려운 일이다. 이런 관점에서 볼 때, 비지도학습(unsupervised learning) 방법 중 하나인 자기조직화 지도를 이용하여 사전을 구축하면 다른 방법에 비해 적은 노력으로도 더 높은 성능을 얻을 수 있다. 본 논문에서는 한국어와 불어에 대하여 실험을 하였고, 그 결과 적은 양의 초기사전으로도 주목할 만한 정확도를 얻을 수 있었다. 향후 연구로는 학습 파라미터에 대해 좀 더 다양한 실험을 하고, 다른 언어 쌍으로의 적용 및 기존의 평가사전을 확장하여 더 많은 경우에 대해 실험하는 것을 들 수 있다.

Keywords