Discovery of User Preference in Recommendation System through Combining Collaborative Filtering and Content based Filtering

협력적 여과와 내용 기반 여과의 병합을 통한 추천 시스템에서의 사용자 선호도 발견

  • 고수정 (인하대학교 전자계산공학과) ;
  • 김진수 (인하대학교 전자계산공학과) ;
  • 김태용 (문경대학 인터넷정보계열) ;
  • 최준혁 (김포대학 소프트웨어개발전공) ;
  • 이정현 (인하대학교 전자계산공학과)
  • Published : 2001.12.01

Abstract

Recent recommender system uses a method of combining collaborative filtering system and content based filtering system in order to solve sparsity and first rater problem in collaborative filtering system. Collaborative filtering systems use a database about user preferences to predict additional topics. Content based filtering systems provide recommendations by matching user interests with topic attributes. In this paper, we describe a method for discovery of user preference through combining two techniques for recommendation that allows the application of machine learning algorithm. The proposed collaborative filtering method clusters user using genetic algorithm based on items categorized by Naive Bayes classifier and the content based filtering method builds user profile through extracting user interest using relevance feedback. We evaluate our method on a large database of user ratings for web document and it significantly outperforms previously proposed methods.

최근의 추천 시스템은 협력적 여과 시스템의 희박성과 초기 평가 문제를 해결하기 위하여 내용 기반 여과 시스템과 협력적 여과 시스템을 병합하는 방법을 사용한다. 협력적 여과 시스템은 부가적인 상품을 예측하기 위해 사용자의 선호도에 대한 데이타베이스를 사용한다. 내용 기반 여과 시스템은 상품의 속성과 사용자의 흥미를 대조함에 의해 아이템을 추천한다. 본 논문에서는 두 가지의 기술을 기계 학습 알고리즘에 응용하고 병합함으로써 사용자의 선호도를 발견하는 방법을 기술한다. 제안된 협력적 여과 방법에서는 유전자 알고리즘을 이용하여 Naive Bayes 분류자에 의해 분류된 아이템을 기반으로 사용자 군집을 생성하며 내용 여과 기법에서는 연관 피드백에 의해 사용자의 흥미를 추출함으로써 사용자의 프로파일을 생성한다. 제안된 방법은 웹문서에 대해 사용자가 평가한 데이타베이스에서 평가되며 기존의 방법보다 높은 성능을 나타냄을 보인다.

Keywords

References

  1. J. Delgado and N. Ishii. Formal Models for Learning of User Preferences. a Preliminary Report, In Proceedings of International Joint Conference on Artificial Intelligence (IJCAI-99), Stockholm, Sweden, July, 1999
  2. R. Raymond and J. Mooney and L. Roy, Content-Based Book Recommending Using Learning for Text Categorization, Proceedings of the Fifth ACM Conference on Digital Libraries, San Antonio, TX, pp. 195-204, June, 2000 https://doi.org/10.1145/336597.336662
  3. B. M, Sarwar, J. A. Konstan, AI Borchers, J. Herlocker, B. Miller, and J. Riedl. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System, Proceedings of the 1998 Conference on Computer Supported Cooperative Work, 1998 https://doi.org/10.1145/289444.289509
  4. D. M. Pennock and E. Horvitz, Collaborative Filtering by Personality Diagnosis: A Hybrid Memory and Model-Based Approach, Proceedings of the 16th Conference On Uncertainty in Artificial Intelligence. 2000
  5. W. S. Lee, Collaborative learning for recommender systems, In Proceedings of the Conference on Machine Learning, 1997
  6. M. J. Pazzani, A framework for collaborative, content-based and demographic filtering, Artificial Intelligence Review, pp. 393-408, 1999 https://doi.org/10.1023/A:1006544522159
  7. M. Balabanovic and Y. Shoham, Fab: Content-based, collaborative recommendation, Communication of the Association of Computing Machinery, Vol. 40, No.3, pp. 66-72, 1997 https://doi.org/10.1145/245108.245124
  8. C. Basu and H. Hirsh and W. W, Cohen, Recommendation as classification : Using social and content-based information in recommendation, In proceedings of the Fifteenth National Conference On Artificial Intelligence, pp. 714-720, Madison, WI, 1998
  9. D. Billsus and M. J. Pazzani, Learning collaborative information filters, In proceedings of the International Conference on Machine Learning, 1998
  10. N. Good, J. R. Schafer and J. A. Konstan, A. Borchers, D, Sarwar, J. Herlocker, and J. Riedl, Combining collaborative filtering with personal agents for better recommendations, In Proceedings of National Conference on Artificial Intelligence (AAAI-99), pp, 439-446, 1999
  11. I. Soboroff and C. Nicholas, Combining content and collaboration in text filtering, In Proceedings of the IJCAI'99 Workshop on Machine Learning in Information filtering, pp. 86-91, 1999
  12. 인하대학교, 사용자 중심의 지능형 정보 검색 시스템, 최종 연구 개발 보고서, 정보통신부, 1997
  13. M. Pazzani, D. Billsus, Learning and Revising User Profiles: The Identification of Interesting Web Sites, Machine Learning, Kluwer Academic Publishers, pp. 313-331, 1997
  14. S. J. Ko and J. H. Lee, Feature Selection using Association Word Mining for Classification, In Proceedings of the Conference on DEXA2001, LNCS2113, pp. 211-220, 2001
  15. 고수정, 이정현, 연관 단어 마이닝을 이용한 특징추출, 한국정보과학회 논문지 심사중, 2001
  16. R. Agrawal and R Srikant, 'Fast Algorithms for Mining Association Rules,' Proceedings of the 20th VLDB Conference, Santiago, Chile, 1994
  17. R. Agrawal and T. Imielinski and A. Swami, 'Mining association rules between sets of items in large databases,' In Proceedings of the 1993 ACM SIGMOD Conference, Washington DC, USA, 1993, https://doi.org/10.1145/170035.170072
  18. T. Michael, Maching Learning, McGraw-Hill, pp. 154-200, 1997
  19. 고수정, 이정현, Apriori-Genetic 알고리즘을 이용한 베이지안 자동 문서 분류, 한국정보처리학회 논문지(B), 제8권, 제3호, 2001
  20. 고수정, 최준혁, 이정현, 연역적 유전자 알고리즘을 이용한 연관 단어 지식베이스의 최적화, 한국정보과학회 논문지(B), 제28권, 제3호, 2001
  21. 백준호, 최준혁, 이정현, 한국어 웹 정보검색 시스템의 정확도 향상을 위한 연관 피드백 에이전트, 한국 정보 처리학회 논문, 제6권, 제7호, pp 1832-1840, 1999
  22. 이수정, 권혜련, 김은주, 이일병, 유전자 알고리즘을 이용한 군집화 기법의 적함도 함수에 관한 연구, 한국정보과학회 '2001춘계학술발표대회 논문집. 2001
  23. 한송희, 이재윤, 문헌 클러스터링을 위한 유사계수간의 연관성 측정, 제6회 한국정보관리학회 논문집, pp. 25-28, 1999
  24. M. Gordon, 'Probabilistic and genetic algorithms for document retrieval,' Communication of the ACM, 31, pp, 1208-1218, 1988 https://doi.org/10.1145/63039.63044
  25. V. Rijsbergen and C. Joost, Information Retrieval, Butterworths, London-second edition, 1979
  26. G. Salton and M. J. McGill, Introduction to Modern Information Retrieval, McGraw-Hill, 1983
  27. John. S. Breese and C. Kadie, Empirical Analysis of Predictive Algorithms for Collaborative Filtering, Proceedings of the Conference on Uncertainty in Artificial Intelligence, Madison, WI, 1998