Subtree Mining to extract Association rules from Tree Data

트리 데이터에서 연관규칙 추출을 위한 서브트리 마이닝

  • Kang, Woo-Jun (College of Management and Information Technology, Korea Christian University) ;
  • Shin, Jun (Department of Computer Engineering, Sungkyunkwan University)
  • 강우준 (그리스도대학교 경영정보학부) ;
  • 신준 (성균관대학교 컴퓨터공학과)
  • Published : 2006.11.10

Abstract

XML 트리 데이터들로부터 빈번 서브 트리들을 추출하는 기존 방법들은 복잡하고 다수의 입력데이터 스캐닝을 필요로 할 뿐만 아니라 빈번 서브 트리를 구하기 위해 에지 하나하나의 조인 작업을 필요로 하였다. 이는 결과적으로 많은 수행 시간을 요한다. 본 논문에서는 트리데이터를 레벨 별로 나누고 이를 마치 채로 거르듯이 필터링하여 특정 수치 이상의 출현 횟수를 가지는 노드들만을 남겨 빠르게 빈번한 서브 트리를 찾고, 이를 이용하여 XML 연관규칙들을 생성하는 방법을 제시한다. 제시된 방법을 위해서 PairSet 이라는 새로운 자료구조를 도입하였으며, 이를 이용하는 크로스필터링 알고리즘을 개발하여 제시하였다.

Keywords