An Efficient Algorithm for Mining Ranged Association Rules

영역 연관규칙 탐사를 위한 효율적 알고리즘

  • 조일래 (순천공업전문대학 전자계산과)
  • Published : 1997.12.01

Abstract

Some association rules can have very high confidence in a sub-interval or a subrange of the domain, though not quite high confidence in the whole domain. In this paper, we define a ranged association rule, an association with high confidence worthy of special attention in a sub-domain, and further propose an efficient algorithm which finds out ranged association rules. The proposed algorithm is data-driven method in a sense that hypothetical subranges are built based on data distribution itself. In addition, to avoid redundant database scanning, we devise an effective in-memory data structure, that is collected through single database scanning. The simulation shows that the suggested algorithm has reliable performance at the acceptable time cost in actual application areas.

본 논문에서는 사건들이 발생한 전체 영역에 대해서는 신뢰도가 그리 높지 않더라도, 특정 기간 혹은 특정 영역에서 강하게 성립하는 연관성을 영역(ranged) 연관규칙을 정의하고, 영역 연관규칙이 성립되는 부분영역을 탐사하는 효율적인 알고리즘을 제안한다. 제안된 알고리즘은 데이타 자체의 분포에 근거하여 부분영역을 설정하는 데이타 기반 검색 방법과, 중복되는 데이타베이스 스캐닝을 줄이기 위해 한번의 데이타베이스 스캐닝(scanning)에 의해 생성되어 주기억장치 상에 관리할 수 있는 효과적인 자료구조를 설계한다. 아울러 모의 실험을 통해 제안 알고리즘이 현장에 적용할 만한 시간 비용으로 수행됨을 보인다.

Keywords