DOI QR코드

DOI QR Code

TV드라마 참여 인물의 계량 능력지표에 기반한 첫 회 시청률 상대적 우위 예측

Predicting Relative Superiority of TV Drama First Episodes based on the Quantitative Competency Index of the Cast and Crew

  • 주상필 (연세대학교 기술정책협동과정) ;
  • 홍준석 (경기대학교 경영정보학과) ;
  • 김우주 (연세대학교 산업공학과)
  • 투고 : 2019.05.03
  • 심사 : 2019.05.20
  • 발행 : 2019.06.28

초록

TV 드라마 한 시즌 제작에 최소 수십 억 원이 투입되지만 투자 대비 효과 예측은 쉽지 않으며 참여 인력의 중요성에도 불구하고 그들에 대한 적절한 평가지표는 아직 존재하지 않는다. 그 동안 콘텐츠 평가지표로 널리 사용되어온 시청률 절대 수치는 지속 감소하고 있지만 대체할만한 지표는 아직 없는 상태다. 본 연구에서는 시청률 절대 수치가 아니라 개별 드라마 시청률 간 상대적 우위를 반응변수로 하고, 드라마 참여 인력이 과거에 획득하여 축적한 상대적 우위를 계량 능력지표화 하여 설명변수로 설계함으로써 드라마의 상대적 흥행성을 예측하는 모형을 개발하였다. 예측 모형으로는 다양한 머신러닝 알고리즘을 활용하였고 예측 성능을 높이기 위해 기존 연구에서 유용한 것으로 판명된 설명변수를 추가하여 조합하였다. 결과적으로 본 연구에서 설계한 설명변수와 기존 연구의 설명변수로부터 최적의 조합을 탐색하여 구축한 예측 모형은 84%의 높은 정분류율로 우수한 예측 성능을 보여주었다. 이렇게 본 연구에서는 TV 드라마 참여 인력 능력지표와 시청률을 활용하여 콘텐츠의 상대적 흥행성을 예측함으로써 콘텐츠 산업 전반 투자 효율화와 활성화를 촉진하려 한다.

It is not easy to predict the return on investment in the content business, and there is no index to evaluate cast & crew. The absolute number of TV ratings is steadily declining, but there is no substitute index yet. In this study, we tried to predict the relative popularity of the drama by designing the relative superiority of the individual drama viewership as the response variable and designing the relative superiority of the drama participants as the explanatory variables. We used various machine learning algorithms and added explanatory variables that were found to be useful in previous studies. As a result, with properly combined explanatory variables, a high prediction accuracy of 84% is obtained. In this study, we intend to promote the investment efficiency of the entire contents industry by predicting the relative popularity of the contents.

키워드

CCTHCV_2019_v19n6_179_f0001.png 이미지

그림 1. 연간 채널별 수도권 시청률 추이[2]

CCTHCV_2019_v19n6_179_f0002.png 이미지

그림 2. 지상파방송사업자별 TV방송사업매출액[3]

CCTHCV_2019_v19n6_179_f0003.png 이미지

그림 3. 분석 프로세스와 예측 모형

표 1. 반응변수

CCTHCV_2019_v19n6_179_t0001.png 이미지

표 2. 설명변수

CCTHCV_2019_v19n6_179_t0002.png 이미지

표 3. 첫 회 시청률 비교 예시

CCTHCV_2019_v19n6_179_t0003.png 이미지

표 4. 첫 회 시청률 반응변수 예시

CCTHCV_2019_v19n6_179_t0004.png 이미지

표 5. 동시간대 특정 회차 시청률 비교

CCTHCV_2019_v19n6_179_t0005.png 이미지

표 6. 각 채널 드라마 정보

CCTHCV_2019_v19n6_179_t0006.png 이미지

표 7. 각 참여드라마 개인별 ‘상대우위 지표(RSI)’ (2016.7.21. 하루)

CCTHCV_2019_v19n6_179_t0007.png 이미지

표 8. 시청률 차이 범주화 방법

CCTHCV_2019_v19n6_179_t0008.png 이미지

표 9. 각 참여드라마 개인별 ‘상대우위차 지표(RSGI)’ (2016.7.21.하루)

CCTHCV_2019_v19n6_179_t0009.png 이미지

표 10. Confusion Matrix

CCTHCV_2019_v19n6_179_t0010.png 이미지

표 11. 노드 수별 비교 (상위 3개만 표시)

CCTHCV_2019_v19n6_179_t0011.png 이미지

표 12. Confusion Matrix (인공신경망)

CCTHCV_2019_v19n6_179_t0012.png 이미지

표 13. Confusion Matrix (로지스틱 회귀분석)

CCTHCV_2019_v19n6_179_t0013.png 이미지

표 14. Confusion Matrix (의사결정나무 모델)

CCTHCV_2019_v19n6_179_t0014.png 이미지

표 15. Confusion Matrix (랜덤포레스트 모델)

CCTHCV_2019_v19n6_179_t0015.png 이미지

표 16. Confusion Matrix (서포트벡터머신 모델)

CCTHCV_2019_v19n6_179_t0016.png 이미지

표 17. Confusion Matrix (나이브베이즈 모델)

CCTHCV_2019_v19n6_179_t0017.png 이미지

표 18. 분석 모델별 결과 비교

CCTHCV_2019_v19n6_179_t0018.png 이미지

표 19. 기존 논문의 유효한 설명변수

CCTHCV_2019_v19n6_179_t0019.png 이미지

표 20. 분석 모델별 결과 비교

CCTHCV_2019_v19n6_179_t0020.png 이미지

표 21. 분석 모델별 결과 비교

CCTHCV_2019_v19n6_179_t0021.png 이미지

표 22. 로지스틱스회귀분석에서 선택된 설명변수

CCTHCV_2019_v19n6_179_t0022.png 이미지

표 23. 의사결정나무 모델에서 선택된 설명변수

CCTHCV_2019_v19n6_179_t0023.png 이미지

표 24. 나이브베이즈 모델에서 선택된 설명변수

CCTHCV_2019_v19n6_179_t0024.png 이미지

표 25. 분석 모델별 예측 결과 비교

CCTHCV_2019_v19n6_179_t0025.png 이미지

표 26. 분석 결과 최종 비교

CCTHCV_2019_v19n6_179_t0026.png 이미지

참고문헌

  1. "2018년도 방송매체 이용행태 조사," 방송통신위원회, pp.30-31, 2018.
  2. http://www.mediatoday.co.kr/?mod=news&act=articleView&idxno=144060
  3. "2018년도 방송시장 경쟁상황 평가," 방송통신위원회, p.110, 2018.
  4. 최현종, 박영선, 정수미, 김화종, "데이터 마이닝을 통한 지상파 드라마 첫 회 시청률 예측 모형 연구," 한국정보기술학회논문지, Vol.15, No.1, pp.1-10, 2017. https://doi.org/10.14801/jkiit.2017.15.1.1
  5. 배진아, "드라마 시청률 영향 요인 분석," 한국방송학보, Vol.19, No.2, pp.270-309, 2005.
  6. 이원재, 이남용, 김종배, "드라마 시청률 예측모델에 대한 실증적 연구," 한국디지털콘텐츠학회논문지, Vol.13, No.3, pp.325-334, 2012.
  7. 강수연, 전희정, 김지혜, 송종우, "국내 드라마 시청률 예측 및 영향요인 분석," 한국통계학회 <응용통계연구>, 제28권, 제5호, pp.933-944, 2015.
  8. S. D. Hunter III, R. Chinta, S. Smith, A. Shamim, and A. Bawazir, "Moneyball for TV: A Model for Forecasting the Audience of New Dramatic Television Series," Studies in Media Communication, Vol.4, No.2, 2016. https://doi.org/10.11114/smc.v4i2.2036
  9. P. J. Danahera, T. S. Daggerb, and M. S. Smitha, "Forecasting television ratings," International Journal of Forecasting, Vol.27, 2011.
  10. 오윤학, 김한, 윤재섭, 이종석, "데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구," Journal of the Korean Institute of Industrial Engineers, Vol.40, No.1, pp.8-17, 2014. https://doi.org/10.7232/JKIIE.2014.40.1.008
  11. R. Sharda and D. Delen, "Predicting box-office success of motion pictures with neural networks," Expert Systems with Applications, Vol.30 pp.243-254, 2006. https://doi.org/10.1016/j.eswa.2005.07.018
  12. S. D. Hunter III, S. Smith, and S. Singh, "Predicting Box Office from the Screenplay: A Text Analytical Approach," Journal of Screenwriting, Vol.5, No.2, pp.135-154, 2016.
  13. 김종훈, 김경태, 한종기, "Deep Learning 기반 기계학습 알고리즘을 이용한 야구 경기 Big Data 분석," 한국통신학회학술대회논문집, pp.262-265, 2015.
  14. J. Eliashberg, S. K. Hui, and Z. J. Zhang, "Assessing Box Office Performance Using Movie Scripts: A Kernel-Based Approach," IEEE Transactions on Knowledge and Data Engineering, Vol.26, Issue 11, 2014.
  15. R. A. Nelson and R. Glotfelty, "Movie stars and box office revenues: An empirical analysis," Journal of Cultural Economics, Vol.36, No.2, pp.141-166, 2012. https://doi.org/10.1007/s10824-012-9159-5
  16. S. Basuroy, S. Chatterjee, and S. A. Ravid, "How critical are critical reviews? The box office effects of film critics, star power, and budgets," Journal of Marketing, Vol.67(October), pp.103-117, 2003. https://doi.org/10.1509/jmkg.67.4.103.18692
  17. D. Delen, "Movie forecast Guru: A Web-based DSS for Hollywood managers," Decision Support Systems, Vol.43, Issue4, pp.1151-1170, 2005. https://doi.org/10.1016/j.dss.2005.07.005