A Study on Cluster Topic Selection in Hierarchical Clustering

계층적 클러스터링에서 분류 대표어 선정에 관한 연구

  • Yi, Sang-Seon (Dept. of Computer Engineering, Chonbuk National University) ;
  • Lee, Shin-Won (Dept. of Computer Engineering, Chonbuk National University) ;
  • An, Dong-Un (Dept. of Computer Engineering, Chonbuk National University) ;
  • Chung, Sung-Jong (Dept. of Computer Engineering, Chonbuk National University)
  • 이상선 (전북대학교 컴퓨터공학과) ;
  • 이신원 (전북대학교 컴퓨터공학과) ;
  • 안동언 (전북대학교 컴퓨터공학과) ;
  • 정성종 (전북대학교 컴퓨터공학과)
  • Published : 2004.05.14

Abstract

정보의 양이 많아지면서 정보 검색 시스템에 검색 결과를 자동으로 구조화하는 계층적 클러스터링을 적용하는 시도가 늘고 있다. 계층적 클러스터링은 문서 간의 유사도를 통해 클러스터를 계층 구조로 만들어 검색 성능을 높이고 결과를 사용자에게 이해하기 쉽게 보여준다. 계층 구조는 검색 결과를 요약하는 것이기 때문에 클러스터의 내용을 효과적으로 함축할 수 있는 대표어의 선정이 중요하다. 각 클러스터의 대표어를 선정하기 위해 대표어에 명사인 단어만 추출하고 상위 클러스터 대표어에 사용된 단어는 하위 클러스터에 사용하지 않는 방법을 적용하여 대표어의 질을 높였다.

Keywords