Effective User Clustering Algorithm for Collaborative Filtering System

협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘

  • Published : 2001.04.01

Abstract

협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

Keywords

References

  1. R. Agrawal and T. Imielinski and A. Swami, 'Mining association rules between sets of items in large databases', Proceedings of the 1993 ACM SIGMOD Conference, Washington DC, USA, 1993 https://doi.org/10.1145/170036.170072
  2. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules,' Proceedings of the 20th VLDB Conference, Santiago, Chile, 1994
  3. R. Agrawal and R. Srikant, 'Mining Sequential Patterns', Proc. of the Intl Conference on Data Engineering (ICDE), Taipei, Taiwan, 1995
  4. K. Alsabti and S. Ranka and V. Singh, 'An Efficient K-Means Clustering Algorithm,' http://www.cise.ufl.edu/ranka/, 1997
  5. G. Caseila amd E. I. George, 'Explaining the Gibbs Sampler', The American Statistician, pp.167-174, 1992
  6. H. Chen, Y. Chung, M. Ramsey, C. Yang, P. Ma, J. Yen, 'Intelligent Spider for Internet Searching,' Proceedings of the 30th Annual Hawaii International Conference on System Sciences- Vol.IV, pp.178-188, 1997 https://doi.org/10.1109/HICSS.1997.663379
  7. D. W. Cheung and B. Kao and J. Lee, 'Discovering User Access Patterns on the World-Wide Web,' PAKDD-97, Singapore, 1997
  8. W. W. Cohen and W. Fan, 'Web-Collaborative filtering : recommending music by crawling the Web,' Computer Networks-the International Journal of Computer & Teiecommunications Networking, Vol.33, No.1-6, 2000 https://doi.org/10.1016/S1389-1286(00)00057-8
  9. Cognitive Science Laboratory, Princeton University, 'WordNet-a Lexical Database for English,' http://www.cogsci.princeton.edu/~wn/
  10. G. Fisher and C. Stevens, 'Information Access in Complex, Poorly structured Information Spaces', Proceedings CHI'91 Human Factors in Computers Systems, pp.63-70, 1991 https://doi.org/10.1145/108844.108854
  11. K. Funakoshi, and T. Ohguro, 'A content-based collaborative recommender system with detailed sue of evaluations,' Proceedings of the 4th International Conference on Knowledge-Based Intelligent engineering Systems & Allied Technologies Vol.1, 2000
  12. N. Good and J. B. Shafer and J. A. Konstan, and A. Borchers and B. Sarwar and J. Herlocker and J. Riedl, 'Combining Collaborative Filtering with Personal Agents for Better Recomendations,' Proceedings of the Sixteenth National Conference on Artificial Intelligence, 1999
  13. V. Hatzivassiloglou and K. Mckeown, 'Towards the automatic identification of adjectival scales : Clustering adjectives according to meaning,' Proceedings of the 31st Annual Meeting of the ACL, pp.172-182, 1993 https://doi.org/10.3115/981574.981597
  14. G. J. McLachlan and T. Krishnan, The EM Algorithm and Extensions, New York : John Wiley and Sons, 1997
  15. A. Kohrs and B. Meriaido, 'USING CATEGORY-BASED COLLABORATIVE FILTERING IN THE ACTIVE WEBMUSEUM,' Proceedings of the IEEE International Conference on Multimedia and Expo-Vol.1, 2000 https://doi.org/10.1109/ICME.2000.869613
  16. T. Michael, Maching Learning, McGraw-Hill, pp.154-200, 1997
  17. B. Smyth and P. Cotter, 'A personalized television listings service-Mixing the ccollaborative recommendation approach with content-based filtering seems to bring out the best in both methods,' Communications of the ACM, Vol.43 No.8, pp.107-111, 2000 https://doi.org/10.1145/345124.345161
  18. Ko. Sujeong and Lee. JungHyen, 'Optimized Association Word Knowledge Base Construction Using Apriori-Genetic Algorithm,' Proceedings of th International Symposium on Adaptive Systems, 2001
  19. D. B. Terry, '7 Steps to a Better Mail System', Proceedings IFIP International Symposium on Message Handling System and Application Layer Communication Protocols, 1990
  20. L. H. Ungar and D. P. Foster, 'Clustering Methods for Collaborative Filtering,' AAAI Workshop on Recommendation Systems, 1998
  21. P. C. Wong and P. Whitney and J. Thomas, 'Visualizing Association Rules for Text Mining,' Proceedings of the 1999 IEEE Symposium on Information Visualization, pp.120-123, 1999 https://doi.org/10.1109/INFVIS.1999.801866
  22. T. W. Yan, et al. 'From User Access Patterns to Dynamic Hypertext Linking,' Proceedings of the Fifth International World-Wide Web Conference, Paris, France, 1996 https://doi.org/10.1016/0169-7552(96)00051-7
  23. O.Zamir and O.Etzioni, 'Web Document Clustering : A Feasibillity Demonstration,' SIGIR'98, pp.46-54, 1998 https://doi.org/10.1145/290941.290956
  24. 박영규, 김진수, 김태용, 이정현, '연관 웹 문서 분류와 사용자 브라우징 패턴을 이용한 동적 링킹 시스템', 한국정보처리학회 추계 학술 발표 논문집, 2000