DOI QR코드

DOI QR Code

Automatic TV Program Recommendation using LDA based Latent Topic Inference

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천

  • Kim, Eun-Hui (Korea Advanced Institute of Science and Technology (KAIST), Electrical Engineering) ;
  • Pyo, Shin-Jee (Korea Advanced Institute of Science and Technology (KAIST), Information and Communications Engineering) ;
  • Kim, Mun-Churl (Korea Advanced Institute of Science and Technology (KAIST), Electrical Engineering)
  • 김은희 (한국과학기술원 전기및전자공학과) ;
  • 표신지 (한국과학기술원 정보통신공학과) ;
  • 김문철 (한국과학기술원 전기및전자공학과)
  • Received : 2012.01.06
  • Accepted : 2012.03.08
  • Published : 2012.03.30

Abstract

With the advent of multi-channel TV, IPTV and smart TV services, excessive amounts of TV program contents become available at users' sides, which makes it very difficult for TV viewers to easily find and consume their preferred TV programs. Therefore, the service of automatic TV recommendation is an important issue for TV users for future intelligent TV services, which allows to improve access to their preferred TV contents. In this paper, we present a recommendation model based on statistical machine learning using a collaborative filtering concept by taking in account both public and personal preferences on TV program contents. For this, users' preference on TV programs is modeled as a latent topic variable using LDA (Latent Dirichlet Allocation) which is recently applied in various application domains. To apply LDA for TV recommendation appropriately, TV viewers's interested topics is regarded as latent topics in LDA, and asymmetric Dirichlet distribution is applied on the LDA which can reveal the diversity of the TV viewers' interests on topics based on the analysis of the real TV usage history data. The experimental results show that the proposed LDA based TV recommendation method yields average 66.5% with top 5 ranked TV programs in weekly recommendation, average 77.9% precision in bimonthly recommendation with top 5 ranked TV programs for the TV usage history data of similar taste user groups.

다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

Keywords

References

  1. ChoiceStream, "ChoiceStream 2007 Survey of Viewer Trends in TV and Online Video," 2007.
  2. G. Adomavicius and A. Tuzhilin, "Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions," IEEE Trans. Knowl. Data Eng., vol. 17, no. 6, pp. 734-749,Jun. 2005. https://doi.org/10.1109/TKDE.2005.99
  3. Johan De Vriendt, Natalie Degrande, Marc Verhoeyen, "Video content recommendation: An overview and discussion on technologies and business models", Bell Labs Technical Journal Special Issue: Application Enablement, Volume 16, Issue 2, pages 235-250, September 2011.
  4. T. Hofmann, Probabilistic latent semantic indexing, ACM , pp 50-57.1999.
  5. David M.Blei, Andrew Y.Ng, Michael I.Jordan, "Latent Dirichlet Allocation," Journal of Machine Learning Research 3, pp.993-1022, 2003.
  6. Tomas L. Griffiths, Mark Steyvers, "Finding scientific topics," Proceedings of the National Academy of Sciences, vol. 101, suppl. 1, pp. 5228-5235, April, 2006. https://doi.org/10.1073/pnas.0307752101
  7. A. Asuncion, M. Welling, P. Smyth, and Y. W. Teh. On smoothing and inference for topic models. In Proceedings of the International Conference on Uncertainty in Artificial Intelligence, 2009.
  8. H. M.Wallach. Structured Topic Models for Language. Ph.D. thesis, University of Cambridge, 2008.
  9. H. M. Wallach, D. Mimno, and A. McCallum, Rethinking lda: Why priors matter, In Advances in Neural Information Processing Systems 22, pages 1973-1981, 2009.
  10. C.M. Bishop. Pattern recognition and machine learning. chapter 2, 8, 10, 11, Springer, 2006.
  11. T. Minka. Estimating a Dirichlet distribution. Technical report, M.I.T., 2003.
  12. Eunhui kim, Shinjee Pyo, Eunkyung Park and Munchurl Kim, "An automatic TV Recommendation for (IP)TV Personalization," IEEE Transactions on Broadcasting, vol. 57, no.3, pp.674-684, Sept, 2011 https://doi.org/10.1109/TBC.2011.2161409
  13. Y.W. Teh., Tutorial, An introduction to Bayesian Nonparametric Modeling, MLSS Cambridge, Sept. 2009.
  14. Y.W. Teh., M. I. Jordan, M.J. Beal, D.M. Blei. "Hierarchical dirichlet processes." Journal of the American Statistical Association 101(476): 1566-1581. 2006. https://doi.org/10.1198/016214506000000302
  15. Chong Wang, C++ implementation of hierarchical Dirichlet process (HDP) with split-merge operations, http://www.cs.princeton.edu/-chongw/resource.html
  16. Y.W. Teh., D. Newman, M. Welling, "A collapsed variational bayesian inference algorithm for latent dirichlet allocation." Advances in neural information processing systems 19: 1353, 2007.