다중 질의 결합을 통한 검색 효과의 개선

Improving Retrieval Effectiveness with Multiple Query Combination

  • 이기호 (연구개발정보센터 연구개발부) ;
  • 이준호 (연구개발정보센터 연구개발부) ;
  • 이규철 (충남대학교 컴퓨터공학과)
  • 발행 : 1997.09.01

초록

일반적으로 주어진 정보 요구에 대하여 서로 다른 사용자는 서로 다른 질의를 생성할 수 있으며, 또는 한명의 사용자가 통제어의 사용 여부에 따라 서로 다른 질의를 생성할 수 있다. 최근 정보 검색 분야의 연구들은 이러한 서로 다른 질의 표현은 서로 다른 문서 집합을 검색함을 보여준다. 본 논문에서는 하나의 사용자 질의에 대하여 다양한 적합성 피드백 방법을 적용함으로써 다중의 질의들을 자동으로 생성한 후, 생성된 다중 질의들을 다시 하나의 질의로 결합하는 방법을 제안한다. 또한 실험을 통하여 자동으로 생성된 다중의 질의들을 결합함으로써 보다 높은 검색 효과를 얻을 수 있음을 입증한다.

Different users or the same user using controlled versus free-text vocabularies could generate different queries for the same information need. It has been known in the information retrieval literature that different query representations may retrieve different sets of documents. In this paper, we first generate multiple query vectors from a given information problem by using different relevance feedback methods. Then, we combine the multiple query vectors into a single query vector. We also show through experiments that significant improvements can be achieved by the combination of the multiple query vectors.

키워드