DOI QR코드

DOI QR Code

Mining Frequent Itemsets using Time Unit Grouping

시간 단위 그룹핑을 이용한 빈발 아이템셋 마이닝

  • 황정희 (남서울대학교 컴퓨터소프트웨어학과)
  • Received : 2022.09.01
  • Accepted : 2022.10.20
  • Published : 2022.11.30

Abstract

Data mining is a technique that explores knowledge such as relationships and patterns between data by exploring and analyzing data. Data that occurs in the real world includes a temporal attribute. Temporal data mining research to find useful knowledge from data with temporal properties can be effectively utilized for predictive judgment that can predict the future. In this paper, we propose an algorithm using time-unit grouping to classify the database into regular time period units and discover frequent pattern itemsets in time units. The proposed algorithm organizes the transaction and items included in the time unit into a matrix, and discovers frequent items in the time unit through grouping. In the experimental results for the performance evaluation, it was found that the execution time was 1.2 times that of the existing algorithm, but more than twice the frequent pattern itemsets were discovered.

데이터 마이닝은 데이터를 탐색하고 분석하여 데이터 사이의 관계나 패턴 등의 지식을 탐사하는 기법이다. 실세계에서 발생하는 데이터는 시간 속성을 포함한다. 시간 속성을 포함하는 데이터에서 유용한 지식을 찾아내기 위한 시간 데이터마이닝 연구는 미래를 예측할 수 있는 예측 판단에 효율적으로 활용될 수 있다. 본 논문은 데이터베이스를 일정한 시간 간격 단위로 구분하고, 시간 단위에서 빈발한 패턴 아이템셋을 발견하기 위한 시간 단위 그룹핑을 이용하는 알고리즘을 제안한다. 제안하는 알고리즘은 시간 단위에 포함된 트랜잭션과 아이템 정보를 매트릭스로 구성하고, 그룹핑을 통한 시간 단위에서의 빈발한 아이템셋을 발견한다. 성능평가의 실험 결과에서 수행시간은 기존의 알고리즘보다 1.2배 소요되지만, 2배 이상의 빈발 아이템셋이 탐사되었다.

Keywords

Acknowledgement

이 논문은 2022년도 남서울대학교 학술연구비 지원에 의해 연구되었음.

References

  1. Y. Lee, J. Lee, D. Chai, B. Hyun and K. Ryu, "Mining temporal interval relation rules fromtemporal data," The journal of systems and software, Vol.82, No.1, pp. 155-167, 2012. DOI: 10.1016/j.jss.2008.07.037
  2. Z. Zhang and Q. Fu, "Data mining algorithm of frequent probability item based on sliding window," Applied Mechanics and materials, Vol. 602-605, pp.3268-71, 2014. DOI:10.4028/www.scientific.net/AMM.602-605.3268
  3. C. H. Lee, C. R. Lin and M. S. Chen, "On mining general temporal association rules in a publication database," The IEEE International Conference on Data Mining, pp. 337-344, 2001. DOI:10.1109/ICDM.2001.989537
  4. J. M. Ale and G. H. Rossi, "An Approach to Discovering Temporal Association Rules," in Proceedings of the 2000 ACM symposium on Applied computing ACM, 2000. DOI:10.1145/335603.335770
  5. Y. Kim, W. Kim and U. Kim, "Mining Frequent Itemsets with Normalized Weight in Continuous Data Streams," Journal of Information Processing Systems, Vol. 6, No. 1, pp. 79-90, 2010. DOI:10.3745/JIPS.2010.6.1.079
  6. C. K. Leung and B. Hao, "Mining of Frequent Itemsets from Streams of Uncertain Data," IEEE International Conference on Data Engineering, 2010. DOI:10.1109/ICDE.2009.157
  7. Y. Lee, J. Lee, D. Chai, B. Hwang and K. Ryu, "Mining Temporal Interval Relational Rules from Temporal Data," Journal of System and Software, Vol. 82, pp. 155-167, 2009. DOI:10.1016/j.jss.2008.07.037
  8. L. Sacchi, C. Larizza, C. Combi and R. Bellazzi, "Data mining with Temporal Abstractions: learning rules from time series," Data Mining and Knowledge Discovery, Vol. 15, No. 2, pp. 217-247, 2007. DOI:10.1007/s10618-007-0077-7
  9. J. Pei, J. Han, B. M. Asi, J. Wang, H. Pinto, Q. Chen, U. Dayal and M. Hsu, "Mining Sequential Patterns by Pattern-Growth: The PrefixSpan Approach," IEEE Transactions on Knowledge and Data Engineering, Vol. 16, No.11, pp.1424-1440, 2004. DOI:10.1109/TKDE.2004.77
  10. H. Mannila, H. Toivonen and A. I. Verkamo, "Discovery of frequent episodes in event sequences," Data Mining and Knowledge Discovery, Vol. 1, No. 3, pp.259-289, 1997. https://doi.org/10.1023/A:1009748302351
  11. T. P. Hong, G. C. Lan, J. H. Su, P. S. Wu and S. L. Wang, "Discovery of temporal association rules with hierarchical granular framework," Applied Computing and informatics, Vol. 12. No. 2. pp. 134-141, 2016. DOI:10.1016/j.aci.2016.01.003
  12. V. Srinivasan and M. Aruna, "Mining Association Rules to Discover Calendar Based Temporal Classification," International Conference on Computing, Communication and Networking, pp. 1-12. 2008. DOI:10.1109/ICCCNET.2008.4787754
  13. E. Boudaillier and G. Hebrail, "Interactive Interpretation of Hierarchical Clustering," Intelligent Data Analysis 2, pp. 229-244, 1998. DOI:10.1016/S1088-467X(98)00026-2