DOI QR코드

DOI QR Code

Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship

`단어-의미 의미-단어` 관계에 기반한 번역어 선택

  • 이현아 (금오공과대학교 컴퓨터공학부)
  • Published : 2006.02.01

Abstract

To obtain a correctly translated sentence in a machine translation system, we must select target words that not only reflect an appropriate meaning in a source sentence but also make a fluent sentence in a target language. This paper points out that a source language word has various senses and each sense can be mapped into multiple target words, and proposes a new translation disambiguation method based on this 'word-to-sense and sense-to-word' relationship. In my method target words are chosen through disambiguation of a source word sense and selection of a target word. Most of translation disambiguation methods are based on a 'word-to-word' relationship that means they translate a source word directly into a target wort so they require complicate knowledge sources that directly link a source words to target words, which are hard to obtain like bilingual aligned corpora. By combining two sub-problems for each language, knowledge for translation disambiguation can be automatically extracted from knowledge sources for each language that are easy to obtain. In addition, disambiguation results satisfy both fidelity and intelligibility because selected target words have correct meaning and generate naturally composed target sentences.

기계번역에서 올바른 번역 문장을 구성하기 위해서는 원시 문장의 의미를 올바르게 표현하면서 자연스러운 목적 문장을 구성하는 번역어를 선택해야 한다. 본 논문에서는 '단어-의미 의미-단어' 관계, 즉 원시언어의 한 단어는 하나 이상의 의미를 가지고 각 의미는 각기 다른 목적언어 단어로 표현된다는 점에 기반하여, 원시 단어의 의미 분별과 목적 단어 선택을 결합하여 번역어를 선택하는 방식을 제안한다. 기존의 번역방식은 원시 단어에 대한 목적단어를 직접 선택하는 '단어-단어' 관계에 기반하고 있기 때문에, 원시언어를 목적 언어로 직접 대응시키기 위한 지식을 필요로 하여 지식 획득에 어려움이 있었다. 본 논문의 방식에서는 원시 단어의 의미 분별과 목적 언어의 단어 선택의 결합을 통해 번역어를 선택함으로써, 손쉽게 획득할 수 있는 원시 언어와 목적 언어 각각의 지식원에서 번역어 선택을 위한 지식을 자동으로 추출할 수 있다. 또한 원시 언어의 의미와 목적 언어의 쓰임새를 모두 반영하여 충실도와 이해도를 모두 만족시키는 보다 정확한 번역어를 선택할 수 있다.

Keywords

References

  1. John White and Teri O'Connell, 'Machine Translation Evaluation', Tutorial, the Second Conference of Association for Machine Translation in the Americas, 1996
  2. Bonnie J. Dorr and Pamela W. Jordan and John W. Benoit, 'A Survey of Current Research in Machine Translation', 1-68, Advances in Computers, M. Zelkowitz (Ed). Academic Press, London, 1999
  3. Philipp Koehn and Kevin Knight, 'Knowledge Sources for Word-Level Translation Models', Proceedings, Empirical Methods in Natural Language Processing, 2001
  4. Ido Dagan and Alon Itai, 'Word Sense Disambiguation Using a Second Language Monoligual Corpus', 563-596, Vol.20, No.4, Computational Linguistics, 1994
  5. 엣센스 영영한 사전, 민중서림,1995
  6. German Rigau and Jordi Atserias and Eneko Agirre, 'Combining Unsupervised Lexical Knowledge Methods for Word Sense Disambiguation', Proceeding of Annual Meeting of the Association for Computational Linguistics, 1997 https://doi.org/10.3115/979617.979624
  7. Geoffrey Towell and Ellen M. Voorhees, 'Disambiguating Highly Ambiguous Words', Computational Linguistics, Vol. 24, No.1, pp.125-147, 1998