DOI QR코드

DOI QR Code

Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법

  • You, Tithrottanak (Department of Computer and Information Engineering, Inha University) ;
  • Rosli, Ahmad Nurzid (Department of Computer and Information Engineering, Inha University) ;
  • Ha, Inay (Department of Computer and Information Engineering, Inha University) ;
  • Jo, Geun-Sik (School of Computer and Information Engineering, Inha University)
  • 유띳로따낙 (인하대학교 IT 공과대학 컴퓨터정보공학과) ;
  • 누르지드 (인하대학교 IT 공과대학 컴퓨터정보공학과) ;
  • 하인애 (인하대학교 IT 공과대학 컴퓨터정보공학과) ;
  • 조근식 (인하대학교 IT 공과대학 컴퓨터정보공학부)
  • Received : 2013.02.22
  • Accepted : 2013.03.04
  • Published : 2013.03.31

Abstract

Social media has become one of the most popular media in web and mobile application. In 2011, social networks and blogs are still the top destination of online users, according to a study from Nielsen Company. In their studies, nearly 4 in 5active users visit social network and blog. Social Networks and Blogs sites rule Americans' Internet time, accounting to 23 percent of time spent online. Facebook is the main social network that the U.S internet users spend time more than the other social network services such as Yahoo, Google, AOL Media Network, Twitter, Linked In and so on. In recent trend, most of the companies promote their products in the Facebook by creating the "Facebook Page" that refers to specific product. The "Like" option allows user to subscribed and received updates their interested on from the page. The film makers which produce a lot of films around the world also take part to market and promote their films by exploiting the advantages of using the "Facebook Page". In addition, a great number of streaming service providers allows users to subscribe their service to watch and enjoy movies and TV program. They can instantly watch movies and TV program over the internet to PCs, Macs and TVs. Netflix alone as the world's leading subscription service have more than 30 million streaming members in the United States, Latin America, the United Kingdom and the Nordics. As the matter of facts, a million of movies and TV program with different of genres are offered to the subscriber. In contrast, users need spend a lot time to find the right movies which are related to their interest genre. Recent years there are many researchers who have been propose a method to improve prediction the rating or preference that would give the most related items such as books, music or movies to the garget user or the group of users that have the same interest in the particular items. One of the most popular methods to build recommendation system is traditional Collaborative Filtering (CF). The method compute the similarity of the target user and other users, which then are cluster in the same interest on items according which items that users have been rated. The method then predicts other items from the same group of users to recommend to a group of users. Moreover, There are many items that need to study for suggesting to users such as books, music, movies, news, videos and so on. However, in this paper we only focus on movie as item to recommend to users. In addition, there are many challenges for CF task. Firstly, the "sparsity problem"; it occurs when user information preference is not enough. The recommendation accuracies result is lower compared to the neighbor who composed with a large amount of ratings. The second problem is "cold-start problem"; it occurs whenever new users or items are added into the system, which each has norating or a few rating. For instance, no personalized predictions can be made for a new user without any ratings on the record. In this research we propose a clustering method according to the users' genre interest extracted from social network service (SNS) and user's movies rating information system to solve the "cold-start problem." Our proposed method will clusters the target user together with the other users by combining the user genre interest and the rating information. It is important to realize a huge amount of interesting and useful user's information from Facebook Graph, we can extract information from the "Facebook Page" which "Like" by them. Moreover, we use the Internet Movie Database(IMDb) as the main dataset. The IMDbis online databases that consist of a large amount of information related to movies, TV programs and including actors. This dataset not only used to provide movie information in our Movie Rating Systems, but also as resources to provide movie genre information which extracted from the "Facebook Page". Formerly, the user must login with their Facebook account to login to the Movie Rating System, at the same time our system will collect the genre interest from the "Facebook Page". We conduct many experiments with other methods to see how our method performs and we also compare to the other methods. First, we compared our proposed method in the case of the normal recommendation to see how our system improves the recommendation result. Then we experiment method in case of cold-start problem. Our experiment show that our method is outperform than the other methods. In these two cases of our experimentation, we see that our proposed method produces better result in case both cases.

소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

Keywords

References

  1. Aart, C. V., L. Y. Raimond, D. Brickley, G. Schreiber, M. Minno, L. Miller, D. Palmisano, M. Mostarda, R. Siebes, and V. Buser, "The No Tube Beancounter : aggregating user data for television programme recommendation", in Proceedings of the Linked Data on the Web Workshop (LDOW 2009), Madrid, Spain, 2009.
  2. Adomavicius, G. and A. Tuzhilin, "Toward the next generation of recommender system : A survey of the state-of-the-art and possible extensions", IEEE Trans. Knowl. Data Eng., Vol.17, No.6(2005), 734-749. https://doi.org/10.1109/TKDE.2005.99
  3. Aimeur, E., G. Brassard, J. M. Fernandez, and F. S. Onana, "Privacy-preserving demographic filtering", In Proceedings of the 2006 ACM symposium on Applied computing, (2006), 872-878.
  4. Bertini, M., A. D. Bimbo, A. Ferracani, and D. Pezzatini, "A Social Network for Video Annotation and Discovery Based on Semantic Profiling", in Proceedings of the 21st international conference companion on World Wide Web, Lyon, France, 2012.
  5. Burke, R., "Hybrid recommender systems : Survey and experiments", User modeling and useradapted interaction, Vol.12, No.4(2002), 331-370. https://doi.org/10.1023/A:1021240730564
  6. Chikhaoui, B., M. Chiazzaro, and Wang, S., "An Improved Hybrid Recommender System by Combining Predictions", In Advanced Information Networking and Applications (WAINA), 2011 IEEE Workshops of International Conference, (2011), 644-649.
  7. Cho, Y. and J. Bang, "Applying Centrality Analysis to Solve the Cold-Start and Sparsity Problems in Collaborative Filtering", Journal of Intelligence and Information Systems, Vol.17, No.3(2011), 99-114.
  8. Choi, S. M. and Y. S. Han, "A content recommendation system based on category correlations", In The fifth international multi-conference on computing in the global information technology, (2010), 1257-1260.
  9. Choi, S. M., S. K. Ko, and Y. S. Han, "A movie recommendation algorithm based on genre correlations", Expert Systems with Applications,2012.
  10. Gunawardana, A. and C. Meek, "A unified approach to building hybrid recommender systems", In of the third ACM conference on Recommender systems, (2009), 117-124.
  11. Hameed, M. A., O. Al Jadaan, and S. Ramachandram, "Collaborative Filtering Based Recommendation System : A survey", International Journal on Computer Science and Engineering, Vol.4, No.5(2012), 859-876.
  12. Herlocker, J. L., J. A. Konstan, A. Borchers, and J. Riedl, "An algorithmic framework for performing collaborative filtering", in Proceedings of the SIGIR conference, New York, NY, USA : ACM, (1999), 230-237.
  13. Herlocker, J. L., J. A. Konstan, L. G. Terveen, and J. T. Riedl, "Evaluating collaborative filtering recommender systems", ACM Transactions on Information Systems (TOIS), Vol. 22, No.1(2004), 5-53. https://doi.org/10.1145/963770.963772
  14. Herlocker, J. L., J. A. Konstan, and J. Riedl, "Explaining collaborative filtering recommendations", In of the 2000 ACM conference on Computer supported cooperative work, (2000), 241-250.
  15. Hill, W., L. Stead, M. Rosenstein, and G. Furnas, "Recommending and evaluating choices in a virtual community of use", Proceedings of the ACM CHI ' 95 Conference on Human Factors in Computing Systems, (1995), 194-201.
  16. Jin, X., C. Wang, J. Luo, X. Yu, and J. Han, "Likeminer : A system for mining the power of 'like' in social media networks", In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining, KDD, 2011.
  17. Jung, J. J., "Attribute selection-based recommendation framework for long-tail user group : An empirical study on movie lens dataset", Expert Systems with Application, 2011.
  18. Kim, K. R. and N. Moon, "Recommender system design using movie genre similarity and preferred genres in SmartPhone", Multimedia Tools and Applications, (2012), 1-18.
  19. Lam, X. N., T. Vu, T. D. Le, and Duong, A. D., "Addressing cold-start problem in recommendation systems", In of the 2nd international conference on Ubiquitous information management and communication, (2008), 208-211.
  20. Lekakos, G. and G. M. Giaglis, "Improving the prediction accuracy of recommendation algorithms : Approaches anchored on human factors", Interacting with computers, Vol.18, No.3 (2006), 410-431. https://doi.org/10.1016/j.intcom.2005.11.004
  21. Li, Q. and B. M. Kim, "Clustering approach for hybrid recommender system", In Intelligence, 2003, Proceedings, IEEE/WIC International Conference, (2003), 33-38.
  22. Melville, P., R. J. Mooney, and R. Nagarajan, "Content-boosted collaborative filtering for improved recommendations", In of the National Conference on Artificial Intelligence, Menlo Park, CA; Cambridge, MA; London; AAAI Press; MIT Press; (1999), 187-192.
  23. Miller, B. N., J. A. Konstan, and J. Riedl, "Pocket Lens : Toward a personal recommender system", ACM Transactions on Information Systems (TOIS), Vol.22, No.3(2004), 437-476. https://doi.org/10.1145/1010614.1010618
  24. Park, J. H. K. and Y. H. Cho, "Social Network Analysis for the Effective Adoption of Recommender System", Journal of Intelligence and Information Systems, Vol.17, No.4(2011), 305-316.
  25. Pazzani, M. J., "A framework for collaborative, content-based and demographic filtering", Artificial Intelligence Review, Vol.13, No.5(1999), 393-408. https://doi.org/10.1023/A:1006544522159
  26. Resnick, P. and H. R. Varian, "Recommender systems", Communications of the ACM, Vol.40, No.3(1997), 56-58.
  27. Resnick, P., N. Iacovou, M. Suchak, P. Bergstrom, and J. Riedl, "Grouplens : an open architecture for collaborative filtering of netnews", In : Proceedings of the ACM Conference on Computer Supported Cooperative Work, (1994), 175-186.
  28. Sean, V., K. J. Oh, and G. S. Jo, "A User Profilebased Filtering Method for Information Search in Smart TV Environment", Journal of Intelligence and Information Systems, Vol.18, No.3 (2012), 91-117.
  29. Schein, A. I., A. Popescul, L. H. Ungar, and D. M. Pennock, "Methods and metrics for cold start recommendations", In of the 25th annual international ACM SIGIR conference on Research and development in information retrieval, (2002), 253-260.
  30. Shardanand, U. and P. Maes, "Social information filtering : algorithms for automating word of mouth", In : Proceedings of the ACM CHI'95 Conference on Human Factors in Computing Systems, Denver, Colorado, (1995), 210-217.
  31. Sun, D., C. Li, and Luo, Z., "A content-enhanced approach for cold-start problem in collaborative filtering", In Intelligence, Management Science and Electronic Commerce (AIMSEC), 2011 2nd International Conference on IEEE, (2011), 4501-4504.
  32. Sun, D., Z. Luo, and Zhang, F., "A novel approach for collaborative filtering to alleviate the new item cold-start problem", In Communications and Information Technologies (ISCIT), 2011 11th International Symposium on, (2011), 402-406.
  33. Wang, Z., M. Zhang, Y. Tan, W. Wang, Y. Zhang, and L. Chen, "Recommendation Algorithm Based on Graph-Model Considering User Background Information", 2011 Ninth International Conference on Creating, Connecting and Collaborating through Computing, (2011), 32-39.

Cited by

  1. Ontology-based Course Mentoring System vol.20, pp.2, 2014, https://doi.org/10.13088/jiis.2014.20.2.149
  2. 개인화된 뉴스 서비스를 위한 소셜 네트워크 기반의 콘텐츠 추천기법 vol.19, pp.3, 2013, https://doi.org/10.13088/jiis.2013.19.3.057
  3. Item Genre-Based Users Similarity Measure for Recommender Systems vol.11, pp.13, 2013, https://doi.org/10.3390/app11136108