A study on neighbor selection methods in k-NN collaborative filtering recommender system

근접 이웃 선정 협력적 필터링 추천시스템에서 이웃 선정 방법에 관한 연구

  • Published : 2009.09.30

Abstract

Collaborative filtering approach predicts the preference of active user about specific items transacted on the e-commerce by using others' preference information. To improve the prediction accuracy through collaborative filtering approach, it must be needed to gain enough preference information of users' for predicting preference. But, a bit much information of users' preference might wrongly affect on prediction accuracy, and also too small information of users' preference might make bad effect on the prediction accuracy. This research suggests the method, which decides suitable numbers of neighbor users for applying collaborative filtering algorithm, improved by existing k nearest neighbors selection methods. The result of this research provides useful methods for improving the prediction accuracy and also refines exploratory data analysis approach for deciding appropriate numbers of nearest neighbors.

협력적 필터링 기법은 전자상거래에서 거래되는 아이템에 대하여 고객들이 평가한 선호 정보를 이용하여 특정 상품에 대한 선호도 예측 대상 고객의 선호도를 예측하는 기법이다. 협력적 필터링 기법을 통한 예측 정확도를 향상시키기 위해서는 예측에 이용할 수 있는 고객들의 선호 정보를 충분히 확보하여야 한다. 그러나 과도한 이웃 고객의 선호 정보는 오히려 예측 정확도에 부정적 영향을 미치며 또한 과소 정보 역시 예측 정확도 감소에 영향을 미칠 수 있다. 본 연구에서는 협력적 필터링 알고리즘 적용에 있어 k명의 근접 이웃을 결정하는 이웃 선정방법을 개선하였으며 개별 고객의 선호도 평가 정보를 이용하여 적정 이웃 수를 결정할 수 있는 방법을 제시한다. 본 연구의 결과는 근접 이웃 수 결정을 위한 기존 방법인 탐색적 방법을 개선함과 동시에 선호도 예측 정확도를 향상시키는데 유용한 방법을 제공할 수 있다.

Keywords

References

  1. 이재식, 박석두 (2007). 장르별 협업필터링을 이용한 영화 추천시스템의 성능 향상. <한국지능정보시스템학회논문지>, 13, 65-78.
  2. 이희춘, 이석준 (2006). 사용자 기반 추천시스템에서 근접이웃 알고리즘과 수정알고리즘의 예측 정확도에 관한 연구. <한국자료분석학회지>, 8, 1893-1904.
  3. Ansari, A., Essegaier, S. and Kohli, R. (2000). Internet recommender systems. Journal of Marketing Research, 37, 363-375. https://doi.org/10.1509/jmkr.37.3.363.18779
  4. Breese, J., Heckerman, D. and Kadie, C. (1998). Empirical analysis of predictive algorithms for collaborative filtering. Proceedings of the Fourteenth Annual Conference on Uncertainty in Artificial Intelligence, 43-52.
  5. Herlocker, J., Komstan J., Terveen, L. and Riedle, J. (2004). Evaluating collaborative filtering recommender systems. ACM Transactions on Information Systems, 22, 5-53. https://doi.org/10.1145/963770.963772
  6. Konstan, J., Miller, B., Maltz, D., Herlocker, J., Gordon, L. and Riedl, J. (1997). GroupLens: Applying collaborative filtering to usenet news. Communications of the ACM, 40, 77-87. https://doi.org/10.1145/245108.245126
  7. Kumar, N. and Benbasat, I. (2006). The influence of recommendation and consumer reviews on evaluations of websites. Information Systems Research, 17, 425-429. https://doi.org/10.1287/isre.1060.0107
  8. Lee, H. C. (2006). Improved algorithm for user based recommender system. Journal of Korean Data & Information Science Society, 17, 717-726.
  9. Lee, S. J., Kim, S. O. and Lee, H. C. (2007). Pre-evaluation for detecting abnormal users in recommender system. Journal of Korean Data & Information Science Society, 18, 619-628.
  10. Lekakos, G. and Giaglis, M. (2006). Improving the prediction accuracy of recommendation algorithms: Approaches anchored on human factors. Interacting with Computers, 18, 410-431. https://doi.org/10.1016/j.intcom.2005.11.004
  11. Linden, G., Smith, B. and York, J. (2003). Amazon.com recommendations: Item-to-item collaborative filtering. Internet Computing, IEEE, 7, 76-80. https://doi.org/10.1109/MIC.2003.1167344
  12. Resnick, P., Iacovou, N., Suchak, M., Bergstorm, P. and Riedl, J. (1994). GroupLens: An open architecture for collaborative filtering of netnews. Proceedings of ACM 1994 Conference on Computer Supported Cooperative Work, 175-186.
  13. Schafer, J., Konstan, J. and Riedle, J. (2001). E-commerce recommendation applications. Journal of Data Mining and Knowledge Discovery, 5, 115-152. https://doi.org/10.1023/A:1009804230409
  14. Shardanand, U. and Maes, P. (1995). Social information filtering: Algorithms for automating ‘word of mouth’. Proceedings of ACM CHI’95 Conference on Human Factors in Computing Systems, 210-217.