DOI QR코드

DOI QR Code

Product Recommendation System on VLDB using k-means Clustering and Sequential Pattern Technique

k-means 클러스터링과 순차 패턴 기법을 이용한 VLDB 기반의 상품 추천시스템

  • 심장섭 (정보통신연구진흥원 정보화추진팀) ;
  • 우선미 (전북대학교 전자정보공학부) ;
  • 이동하 ((주)넷스루 데이터 마이닝 연구소) ;
  • 김용성 (전북대학교 전자정보공학부) ;
  • 정순기 (전북대학교 전기전자 컴퓨터공학부)
  • Published : 2006.12.31

Abstract

There are many technical problems in the recommendation system based on very large database(VLDB). So, it is necessary to study the recommendation system' structure and the data-mining technique suitable for the large scale Internet shopping mail. Thus we design and implement the product recommendation system using k-means clustering algorithm and sequential pattern technique which can be used in large scale Internet shopping mall. This paper processes user information by batch processing, defines the various categories by hierarchical structure, and uses a sequential pattern mining technique for the search engine. For predictive modeling and experiment, we use the real data(user's interest and preference of given category) extracted from log file of the major Internet shopping mall in Korea during 30 days. And we define PRP(Predictive Recommend Precision), PRR(Predictive Recommend Recall), and PF1(Predictive Factor One-measure) for evaluation. In the result of experiments, the best recommendation time and the best learning time of our system are much as O(N) and the values of measures are very excellent.

대용량 데이터베이스에서의 추천시스템은 많은 문제점들을 지니고 있으므로, 대규모 인터넷 쇼핑몰에 적합한 추천 시스템 구조와 데이터 마이닝 기법의 필요성이 요구되고 있다. 따라서 본 논문에서는 k-mean 클러스터링과 순차 패턴 기법을 이용한 VLDB(very large database) 기반의 상품 추천 시스템을 설계 및 구현한다. 본 논문에서는 사용자의 정보를 일괄처리하고 다양한 카테고리를 계층적으로 정의하며, 탐색엔진에 순차 패턴 마이닝 기법을 이용한다. 예측 모델을 만들기 위하여 사용자의 로그 데이터 중에서 카테고리에 대한 사용자의 선호도를 추출하여 이용한다. 본 논문에서는 실험과 성능 평가를 위하여 국내 인터넷 쇼핑몰에서 30일 동안 수집한 실제 데이터를 이용한다. 또한 성능평가를 위하여 추천 예측 정확율(PRP: Predictive Recommend Precision), 추천 예측 재현율(PRR: Predictive Recommend Recall), 정확도 인수(PF1 : Predictive Factor One-measure)를 제안하여 사용한다. 성능평가 결과 가장 빠른 추천시간 및 학습시간은 O(N)이었고, 다양한 실험에서의 측도들의 값이 상당히 우수하였다.

Keywords

References

  1. 김재경, 안도현, 조윤호, '개인별 상품추천시스템,WebCF-PT: 웹마이닝과 상품계층도를 이용한 협업필터링' , 경영정보학연구. 제15권, 제1호. pp.63-79. 2005
  2. Minos Garofalakis, Rajeev Rastogi and Kyuseok Shim, 'Mining Sequential Patterns with Regular Expression Constraints,' In the Proceeding of the 2001 ACM SIGMOD International Conference ON Management of Data, 2001
  3. 오용생, '시계열 데이터로부터 경향성을 이용한 순차 패턴의 탐색', 포항공과대학교 대학원 석사학위논문, 2001
  4. Cho, Yoon Ho, Iae Kyeong Kim, and Soung Hie Kim, 'A Personalized Recommender System Based on Web Usage Mining and Decision Tree Induction,' Expert Systems with Applications, Vol.23, No.3, pp.329-342, 2002 https://doi.org/10.1016/S0957-4174(02)00052-0
  5. Sarwar.B, Karypis.G, Konstan,J and Riedl.J, 'Application of dimensionality reduction in recommender system - a case study,' In Proceedings of ACM WebKDD-2000 Workshop. pp.285-295, 2000
  6. Mulvenna.M.D, S.S.Anand, A.G.Buchner, 'Personalization on the Net Using Web Mining,' Communication of the ACM, Vol.43, No.8, pp.122-125, August, 2000 https://doi.org/10.1145/345124.345165
  7. Kim.Jong Woo, Byung Hun Lee, Michael J.Shaw, Hsin-Lu Chang, Mathew Nelson, 'Application of Decision Tree Induction Techniques to Personalized Advertisments on the Internet Storefront,' International Journal of Electronic Commerce, Vol.5, No.3, pp.45-62, Spring, 2001 https://doi.org/10.1080/10864415.2001.11044215
  8. Mobasher, Bamshad, Robert Cooley, and Iaideep Srivastava, 'Automatic Personalization Based on Web Usage Mining,' Communication of the ACM, Vol.43, No.3, pp.142-151, 2000 https://doi.org/10.1145/345124.345169
  9. 황병연, '개선된 추천을 위해 클러스터링을 이용한 협동적 필터링 에이전트 시스템의 성능' , 정보처리논문지, 제7권, 제5S호, pp.1599-1608, 2000
  10. J.B. Schafer, J.A. Konstan, and J. Riedl, 'Meta-recommendation Systems; User-controlled Integration of Driverse Recommendations,' In Proceedings of the 11th International Conference on Information and Knowledge Management (CIKM 2002), McLean, VA, pp.43-51, November, 2002
  11. F. Masseglia, P. Poncelet and M. Teisseire, 'Incremental Mining of Sequential Patterns in Large Databases,' Actes des 16imes Journes Bases de Donnes Avances (BDA'00), Blois, France, October, 2000
  12. 이경희,한정혜,임춘성,'지수적 가중치를 적용한 협력적 상품추천시스템' , 정보처리학회지,pp.625-632,2001
  13. Feng-Hsu Wang, Hsiu-Mei Shao, 'Effective personalized recommendation based on time-framed navigation clustering and association mining,' Expert Systems with Applications, pp.365-377, 2004 https://doi.org/10.1016/j.eswa.2004.05.005
  14. Soe-Tsyr Yuan, Chiahsin Cheng, 'Ontology-based personalized couple clustering for heterogeneous product recommendation in mobile marketing,' Expert Systems with Applications 26, pp.461-476, 2004 https://doi.org/10.1016/j.eswa.2003.10.006