A MultiDatabase Clustering using Distance of Itemsets

항목집합의 거리를 이용한 다중데이터베이스 클러스터링

  • Kim, Jin-Hyun (Dept. of Computer Science, Pukyong National University) ;
  • Park, Sung-Lyeon (Dept. of Computer Science Education, Pukyong National University) ;
  • Youn, Sung-Dae (Dept. of Computer Science, Pukyong National University)
  • 김진현 (부경대학교 전자계산학과) ;
  • 박성련 (부경대학교 전산교육학과) ;
  • 윤성대 (부경대학교 전자계산학과)
  • Published : 2003.05.16

Abstract

장바구니 데이터들로 구성된 다중데이터베이스를 마이닝 하기 위한 선처리 작업으로는 Ideal&Goodness 기법이 있으며, Ideal&Goodness기법은 유사한 항목이 존재하는 데이터베이스간의 식별이 불가능하다는 단점이 있다. 그러므로 본 논문에서 제안하는 기법은 항목으로만 구성된 집합을 생성하여 데이터베이스간의 거리를 측정하고 항목집합간의 식별능력을 향상시키기 위하여 항목과 지지도를 갖는 항목 데이터 집합을 생성하고 지지도에 대한 확률을 계산한 후, 이를 비교 연산하여 가중치를 계산한다. 본 논문에서는 장바구니 분석을 위한 선처리 단계로써 활용 가능한 클러스터링 기법을 제안하며 성능평가를 통하여 데이터베이스간의 우수한 식별 능력을 보인다.

Keywords