Improvement of retrieval system and generation of compound noun using word weight method

단어 가중치 값을 이용한 복합명사 제한적 확장 및 검색 성능 개선

  • 김현진 (한국전자통신연구원 휴먼정보검색연구팀) ;
  • 이충희 (한국전자통신연구원 휴먼정보검색연구팀) ;
  • 허정 (한국전자통신연구원 휴먼정보검색연구팀) ;
  • 장명길 (한국전자통신연구원 휴먼정보검색연구팀)
  • Published : 2002.11.15

Abstract

자동색인이나 정보검색 엔진에서는 효율적인 색인어 추출이 주요한 요인으로 작용한다. 특히 색인 집합의 많은 부분을 차지하는 복합명사의 경우에는 색인과 검색 두 분야 모두에 큰 문제로 여겨져 왔다. 본 논문에서는 복합명사를 이루는 단일 단어 중에 단어 가중치가 높은 것을 중심으로 복합명사를 확장하는 방식을 이용하여, 색인어를 추출하여, 복합명사가 제한적으로 확장되는 효과를 보여 주며, 검색에서는 질의문에 나타나는 명사들에 이러한 가중치 값을 적용하여 검색에 효과를 높여 주는 방식을 제안한다.

Keywords