A Postprocessing method for Statistical English-Korean Word Alignment Reflecting Alignment Tendency Between Parts-of-Speeches

품사간 정렬 경향을 반영한 통계 기반 영한 단어 정렬 후처리 방법

  • Lee, Jae-Hee (Dept. of Computer and Radio Communications Engineering, Korea University) ;
  • Lee, Seung-Wook (Dept. of Computer and Radio Communications Engineering, Korea University) ;
  • Hwang, Young-Sook (Institute of Future Technology, SK Telecom) ;
  • Kim, Sang-Bum (Institute of Future Technology, SK Telecom) ;
  • Rim, Hae-Chang (Dept. of Computer and Radio Communications Engineering, Korea University)
  • 이재희 (고려대학교 정보통신대학 컴퓨터전파통신공학과) ;
  • 이승욱 (고려대학교 정보통신대학 컴퓨터전파통신공학과) ;
  • 황영숙 (SK 텔레콤 미래기술원) ;
  • 김상범 (SK 텔레콤 미래기술원) ;
  • 임해창 (고려대학교 정보통신대학 컴퓨터전파통신공학과)
  • Published : 2009.10.09

Abstract

병렬 말뭉치 내에서 서로 대응되는 단어를 찾아내는 단어 정렬 작업은 기계 번역에서 가장 기본적으로 수행되는 작업이고 다양한 분야에서 유용하게 사용된다. 본 논문에서는 영한 단어 정렬에서 기존의 통계 기반 정렬 모델의 문제점을 파악하고 이를 해결하기 위해 영한의 품사간 정렬 경향을 단어 정렬에 반영하는 방법을 제안한다. 실험을 통해서 기존 통계 기반 영한 단어 정렬 결과와 비교하여 제안된 방법이 정확률, 재현율, F-measure 측면에서 모두 향상시키는 것을 보였다.

Keywords