A Study on the Document Length Normalization of Extended Vector Model Using the Information of Location

위치 정보를 이용한 확장 벡터 모델의 문서 길의 정규화에 관한 연구

  • Kim, Kwang-Young (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Seo, Jerry (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Lee, Min-Ho (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Joo, Won-Kyun (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Jeong, Chang-Hoo (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • You, Beom-Jong (Group for Intelligent Information System, Korea Institute of Science and Technology Information)
  • Published : 2003.05.16

Abstract

인터넷의 발달과 인터넷 이용자수의 급격한 증가로 정보 검색 시스템의 필요성이 커지고 있다. 또한 대용량의 문서에서 사용자가 원하는 정보를 정확하게 찾기가 점점 어려워지고 있다. 현재 대부분의 검색 시스템들은 문서 길이에 대한 정규화를 처리하고 있다. 현재 문서 길이 정보도 검색 시스템의 검색성능에 기여를 하고 있다. 일반적으로 TREC이나 HANTEC2.0을 이용한 검색 성능 평가를 했을 때문서 길의 정규화를 하지 않는 것보다 한 것이 우수한 성능을 보여 주고 있다. 본 논문에서는 KISTAL2000을 이용하여 위치 정보를 사용하여 문서 길의 정규화 방법에 제시하고 이에 대한 실험하였다.

Keywords