DOI QR코드

DOI QR Code

A Model to Predict Popularity of Internet Posts on Internet Forum Sites

인터넷 토론 게시판의 게시물 인기도 예측 모델

  • 이윤정 (부산대학교 U-Port 정보기술공동사업단) ;
  • 정인준 (부산대학교 컴퓨터공학과) ;
  • 우균 (부산대학교 컴퓨터공학과)
  • Received : 2011.11.29
  • Accepted : 2011.12.30
  • Published : 2012.02.29

Abstract

Today, Internet users can easily create and share the digital contents with others through various online content sharing services such as YouTube. So, many portal sites are flooded with lots of user created contents (UCC) in various media such as texts and videos. Estimating popularity of UCC is a crucial concern to both users and the site administrators. This paper proposes a method to predict the popularity of Internet articles, a kind of UCC, using the dynamics of the online contents themselves. To analyze the dynamics, we regarded the access counts of Internet posts as the popularity of them and analyzed the variation of the access counts. We derived a model to predict the popularity of a post represented by the time series of access counts, which is based on an exponential function. According to the experimental results, the difference between the actual access counts and the predicted ones is not more than 10 for 20,532 posts, which cover about 90.7% of the test set.

오늘날 인터넷 사용자들은 유튜브(YouTube)와 같은 온라인 콘텐츠 공유 사이트를 통해 손쉽게 자신의 콘텐츠를 만들고 다른 사람들과 공유하고 있다. 그로 인해 하루에도 엄청난 양의 온라인 콘텐츠들이 쏟아지고 있다. 온라인 콘텐츠들의 홍수 속에서 어떤 콘텐츠가 향후에 인기가 있을 것인지를 예측하는 문제는 일반 이용자들이나 콘텐츠 공유 사이트 운영자들 모두가 관심을 가지는 문제이다. 본 논문에서는 인터넷 토론 게시판에 등록된 게시물들의 인기도를 예측하는 방법을 제안한다. 본 논문에서는 인터넷 토론 게시판에 등록된 게시물들의 인기도를 예측하기 위해 게시물의 조회수를 인기 척도로 간주하고 각 게시물의 조회수 변화량을 분석하였다. 게시물의 최종 조회수를 예측하기 위하여 관찰된 조회수 시계열 데이터를 이용하여 지수 함수를 기반으로 하는 조회수 증가 모델을 제안한다. 다음 아고라 게시판의 게시물을 대상으로 한 실험에서 전체 실험 게시물 중 약 90.7%인 20,532개의 게시물이 예측 오차가 10개 이하로 나타났다.

Keywords

References

  1. G. Mishne and N. Glance, "Leave a reply: An analysis of weblog comments," In Third annual workshop on the Weblogging ecosystem, 2006.
  2. 이윤정, 지정훈, 우균, 조환규, "TRIB: 블로그 댓글 분류 및 시각화 시스템", 정보처리학회논문지D, 제16-D권 제5호, pp.517-524, 2009.
  3. 이윤정, 김은경, 조환규, 우균, "스킵리스트를 이용한 인터넷 토론 게시판 댓글 관리", 한국콘텐츠학회, 제10권 제8호, pp.38-50, 2010.
  4. M.J. Salganik, P.S. Dodds, and D.J. Watts, "Experimental study of inequality and unpredictability in an artificial cultural market," science, Vol.311, No.5762, pp.854-856, 2006, American Association for the Advancement of Science. https://doi.org/10.1126/science.1121066
  5. K. Lerman, "Social Information Processing in News Aggregation," IEEE Internet Computing, pp.16-28, 2007.
  6. G. Szabo and B. A. Huberman, "Predicting the popularity of online content," Social Science Research Network Working Paper Series, November, 2008.
  7. K. Lerman and T. Hogg, "Using a Model of Social Dynamics to Predict Popularity of News," Proc. of WWW, pp.621-630, 2010(4).
  8. JG. Lee, S. Moon, and K. Salamatian, "An Approach to Model and Predict the Popularity of Online Contents with Explanatory Factors," in Proc. of WI-IAT 2010, 2010.
  9. 김수도, 김소라, 조환규, "웹게시판에서 가상온도를 이용한 게시 글의 인기 예측", 제11권 제10호, pp.19-29, 2011.
  10. M. Tsagkias, W. Weerkamp, and M. de Rijke, "News Comments: Exploring, Modeling, and Online Prediction," in Proc. of the 7th ACD SIGCOMM conference on Internet Measurement, 2007.
  11. A. kaltenbrunner, V. Gomez, and V. Lopez, "Description and Prediction of Slashdot Activity," in LA-Web 2007, 2007.
  12. H. Yu, D. Zheng, B. Y. Zhao, and W. Zheng, "Understanding User Behavior in Large-Scale Video-on-Demand System," in Proc. of EuroSys'06, 2006.
  13. Daum 아고라, http://agora.media.daum.net/ (2011년 12월 방문)

Cited by

  1. Software Replacement Time Prediction Technique Using the Service Level Measurement and Replacement Point Assessment vol.2, pp.8, 2013, https://doi.org/10.3745/KTSDE.2013.2.8.527