DOI QR코드

DOI QR Code

An Efficient Algorithm For Mining Association Rules In Main Memory Systems

대용량 주기억장치 시스템에서 효율적인 연관 규칙 탐사 알고리즘


Abstract

This paper propose an efficient algorithm for mining association rules in the large main memory systems. To do this, the paper attempts firstly to extend the conventional algorithms such as DHP and Partition in order to be compatible to the large main memory systems and proposes secondly an algorithm to improve Partition algorithm by applying the techniques of the hash table and the bit map. The proposed algorithm is compared to the extended DHP within the experimental environments and the results show up to 65% performance improvement in comparison to the expanded DHP.

본 논문은 대용량 주기억장치를 가진 시스템에 적합한 연관 규칙 탐사 알고리즘에 관한 연구이다. 이를 위하여 먼저 기존의 잘 알려진 알고리즘인 DHP, Partition 방법을 대용량 주기억장치를 가진 시스템에서 효율적으로 동작하도록 확장하였고, 다음 Partition 방법에 대해서 해쉬 테이블과 비트맵 기법을 적용하여 Partition 방법을 개선하는 방법을 제안하였다. 제안된 알고리즘은 실험적 환경에서 DHP와 성능이 비교되었으며, 제안하는 알고리즘이 확장된 DHP보다 최대 65%까지 성능 개선 효과가 있음을 보인다.

Keywords

References

  1. R. Agrawal, T. Imielinski and A. Swami, 'Database Mining : A Performance Perspective,' IEEE Trans. On Knowledge and Data Engineering, Vol.5, No.6, pp.914-925, 1993 https://doi.org/10.1109/69.250074
  2. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules in Large Databases,' Proceedings of the 20th International Conference on Very Large Databases, 1994
  3. J. S. Park, M.-S. Chen and P. S. Yu, 'An Effective Hash-Based Algorithm for Mining Association Rules,' Proceedings of ACM SIGMOD, pp.175-186, 1995 https://doi.org/10.1145/568271.223813
  4. A. Savasere, E. Omiecinski and S. Navathe, 'An Efficient Algorithm for Mining Association Rules in Large Databases,' Proceedings of the 21th International Conference on Very Large Databases, pp.432-444, 1995
  5. R. Srikant and R. Agrawal, 'Mining Generalized Association Rules,' Proceedings of the 21th International Conference on Very Large Databases, pp.407-419, 1995
  6. J. Han and Y. Fu, 'Discovery of Multiple-Level Association Rules from Large Databases,' Proceedings of the 21th International Conference on Very Large Databases, pp.420-431, 1995
  7. H. Toivonen, 'Sampling Large Databases for Association Rules,' Proceedings of the 21th International Conference on Very Large Databases, pp.134-144, 1995
  8. 박종수, '대용량 데이터베이스 상의 효과적인 연관 규칙 탐사를 위한 전지 기법', 한국정보과학회 산하 데이터베이스 연구회지, 제12권 제4호, pp.59-75, 1996
  9. M-S Chen, J. Han, and Philip S. Yu, 'Data Mining : An Overview from a Database Perspective,' IEEE Transactions on Knowledge and Data Engineering, 8(6) : pp.866-883, 1996 https://doi.org/10.1109/69.553155
  10. R. Agrawal and et al, 'Programs Generating Test Data in Data Mining,' http://www.almaden.ibm.com/cs/quest, 1997
  11. R. Agrawal, H. Mannila, R. Srikant, H. Toivonen, and A. I. Verkmo, 'Fast Discovery of Association Rules,' In Adavanes in Knowledge Discovery and Data Mining, ed. U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, pp.307-328, 1996
  12. 이재문, 박종수, '복합 해쉬 트리를 이용한 효율적인 연관 규칙 탐사 알고리즘', 한국정보과학회논문지, 제26권 제3호, pp.343-352, 1999
  13. 이재문, '대화형 환경에서 효율적인 연관 규칙 알고리즘', 정보처리학회논문지D, 제8-D권 제4호, pp.339-346, 2001
  14. 이재문, '대용량 주기억장치에서 연관 규칙 알고리즘 비교', 한성대학교논문집 2001