DOI QR코드

DOI QR Code

Generator of Dynamic User Profiles Based on Web Usage Mining

웹 사용 정보 마이닝 기반의 동적 사용자 프로파일 생성

  • An, Kye-Sun (Dept.of Computer Science Engineering, Graduate School of Inha University) ;
  • Go, Se-Jin (Dept.of Computer Science Engineering, Graduate School of Inha University) ;
  • Jiong, Jun (Dept.of Computer Science Engineering, Graduate School of Inha University) ;
  • Rhee, Phill-Kyu (Dept.of Computer Science Engineering, Inha University)
  • 안계순 (인하대학교 대학원 전자계산공학과) ;
  • 고세진 (인하대학교 대학원 전자계산공학과) ;
  • 정준 (인하대학교 대학원 전자계산공학과) ;
  • 이필규 (인하대학교 전자계산공학과)
  • Published : 2002.08.01

Abstract

It is important that acquire information about if customer has some habit in electronic commerce application of internet base that led in recommendation service for customer in dynamic web contents supply. Collaborative filtering that has been used as a standard approach to Web personalization can not get rapidly user's preference change due to static user profiles and has shortcomings such as reliance on user ratings, lack of scalability, and poor performance in the high-dimensional data. In order to overcome this drawbacks, Web usage mining has been prevalent. Web usage mining is a technique that discovers patterns from We usage data logged to server. Specially. a technique that discovers Web usage patterns and clusters patterns is used. However, the discovery of patterns using Afriori algorithm creates many useless patterns. In this paper, the enhanced method for the construction of dynamic user profiles using validated Web usage patterns is proposed. First, to discover patterns Apriori is used and in order to create clusters for user profiles, ARHP algorithm is chosen. Before creating clusters using discovered patterns, validation that removes useless patterns by Dempster-Shafer theory is performed. And user profiles are created dynamically based on current user sessions for Web personalization.

동적 웹 컨텐츠 제공에서 고객을 위한 추천서비스에 이르는 인터넷 기반의 전자상거래 애플리케이션에서는 고객이 어떤 성향을 가지고 있는가에 대한 정보를 획득하는 것이 중요하다. 웹 개인화의 대표적인 기술인 협력적 석과는 사용자의 정보를 정적인 프로파일 형태로 저장하여 사용자의 성향 변화를 빨리 획득할 수 없다. 또한 사용자의 명시적 평가 의존성, 확장성 부족, 다차원 공간 데이터에 대한 적용 어려움 둥의 문제점을 가지고 있다. 이와 같은 단점을 해결하기 위한 해결 방안으로 웹 사용 정보 마이닝(web usage mining)이 쓰이고 있다. 웹 사용 정보 마이닝은 서버에 축적된 웹 사용 데이터(web usage data)를 이용하여 패턴을 발견하는 기술이다. 특히 연관 규칙 생성 알고리즘으로 웹 사용 패턴(web usage pattern)을 찾고 패턴을 클러스터링하는 기술이 사용되고 있다. 그러나 연관 규칙 생성 알고리즘은 많은 수의 패턴들을 찾고 또 유용하지 못한 패턴을 발견하는 단점이 있다. 본 논문에서는 검증된 웹 사용 패턴을 이용한 동적 사용자 프로파일 생성 방법을 제안한다. 먼저 패턴 발견을 위해 연관 규칙 생성 알고리즘인 Apriori를 이용하고 사용자 프로파일을 위한 클러스터를 생성하기 위해 ARHP를 채택하였다. 클러스터를 생성하기 전에 Dempster-Shafer 이론을 이용하여 유용하지 못한 패턴을 제거하는 패턴 검증 과정을 수행한다. 검증된 패턴을 이용하여 클러스터를 생성하고 사용자의 현재 활성화된 세션에 따라 동적으로 사용자 프로파일이 생성된다

Keywords

References

  1. Adomavicius, G., and Tuzhilin, A. 'Expert-Driven Validation of Rule-Based User Models in Personalization Applications,' International Journal on Data Mining and Know-ledge Discovery. Special Issue on E-commerce and Data Mining, January, 2001 https://doi.org/10.1023/A:1009839827683
  2. Agrawal R., Imielinski T., Swami A. 'Mining Association Rules betweenSets of Items in Very Large Databases,' In the Proceedings of the ACM SIGMOD Conference, 1993
  3. Alfred Kobsa. 'Generic User Modeling Systems,' In the Proceedings of User Modeling and User-Adapted Interaction, 2000
  4. Bamshad Mobasher, Honghua Dai, Tao Luo,Miki Nakagawa, Yuqing Sun, Jim Wiltshire 'Discovery of Aggregate Usage Profiles for Web Personalization,' WEBKDD2000
  5. C. Shahabi, A. Zarkesh, J. Adibi, and V. Shah,'Knowledge discovery from users Web-page navigatioin,' In Proceedings of Workshop on Research Issues in Data Engineering, 1997, Birmingham, England https://doi.org/10.1109/RIDE.1997.583692
  6. E. H. Han, et al., 'Clustering Based On Association Rule Hypergraphs,' Proc. of SIGMOD '97 Workshop on Research Issues in Data Mining and Knowledge Discovery (DMKD), May, 1997
  7. G. Karypis and V. Kumar, 'Multilevel k-way Hypergraph Partitioning,' DAC, pp.343-348, 1999
  8. G. Shafer, 'A Mathematical Theory of Evidence,' Princeton University Press, 1976
  9. Goldberg, D. Nichols, 'Using Collaborative Filtering to Weave an Information Tapestry,' Comm. of the ACM35 (12), pp.61-70, 1992 https://doi.org/10.1145/138859.138867
  10. M. Spiliopoulou and L. C. Faulstich, 'WUM : A Web Utilization Miner,' In Proceedings of EDBT Workshop Web-DB98, LNCS 1590, Springer Verlag, Balencia, Spain, 1999
  11. O. Nasraoui, H. Frigui, A. Joshi, R. Krishnapuram, 'Mining Web access logs using relational competitive fuzzy cluser-ing,' In Proceedings of the Eight International Fuzzy Systems Association World Congress, August, 1999
  12. O. R. Zaiane, M. Xin, and J. Han, 'Discovering weeb access patterns and trends by applying olap and data mining technology on web logs,' In Advances in Digital Libraries, Santa Barbara, CA, pp.19-29, 1998
  13. R. Cooley, et al., 'Data Preparation for Mining World Wide Web Browsing Patterns,' Knowledge and Information Systems, Vol.1-1, 1999
  14. R. Cooley, et al., 'Discovery of Interesting Usage Patterns from Web Data,' WEBKDD, 1999

Cited by

  1. A Study on Recommendation Technique Using Mining and Clustering of Weighted Preference based on FRAT vol.14, pp.4, 2013, https://doi.org/10.9728/dcs.2013.14.4.419