Korean-Japanese Cross Lingual Information Retrieval Based on Bi-gram Indexing

바이그램 색인에 기반한 한-일 교차언어검색

  • Lee Gyu-Chan (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
  • Kang In-Su (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
  • Na Seung-Hoon (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
  • Lee Jong-Hyeok (Knowledge & Language Engineering Lab, Pohang University of Science and Technology)
  • 이규찬 (포항공과대학교 지식 및 언어공학 연구실) ;
  • 강인수 (포항공과대학교 지식 및 언어공학 연구실) ;
  • 나승훈 (포항공과대학교 지식 및 언어공학 연구실) ;
  • 이종혁 (포항공과대학교 지식 및 언어공학 연구실)
  • Published : 2005.07.01

Abstract

교차언어검색 시스템은 다양한 언어자원을 필요로 한다. 여기서는 한-일 대역어 사전과 일본어 문서의 바이그램 색인만을 이용해서 교차언어검색을 수행하는 방법을 제시한다. 한국어로 된 자연어 질의에서 형태소분석기 등의 도움 없이 간단하게 일본어 대역어 리스트를 생성할 수 있는 방법과, 검색의 성능을 올릴 수 있도록 대역어에 가중치를 부여하는 방법을 제안한다. 그리고 실험을 통해 제시한 방법을 평가하고 분석한다.

Keywords