Analysis of YouTube Trending Video Dataset by Country and Category

YouTube 인기 급상승 동영상 데이터셋의 국가별-카테고리별 분석

  • Jung, Jimin (Computer Science Department, Hankuk University of Foreign Studies) ;
  • Kim, Seungjin (Computer Science Department, Hankuk University of Foreign Studies) ;
  • Jung, Sungwook (Computer Science Department, Hankuk University of Foreign Studies) ;
  • Lee, Dongyun (Computer Science Department, Hankuk University of Foreign Studies)
  • 정지민 (한국외국어대학교 컴퓨터공학부) ;
  • 김승진 (한국외국어대학교 컴퓨터공학부) ;
  • 정성욱 (한국외국어대학교 컴퓨터공학부) ;
  • 이동윤 (한국외국어대학교 컴퓨터공학부)
  • Published : 2022.05.26

Abstract

YouTube, a video platform used by millions of people worldwide, provides a rapidly growing video service. This study aims to understand the characteristics and cultural differences of each country using the Kaggle dataset, one of the public datasets, and to show the usefulness of the public dataset. For this purpose, we analyze data from 11 countries, 15 categories, and about 1.1 million trending videos. This study adopts Python to obtain the number of videos by category for data analysis, the selection period of videos rapidly increasing in popularity, and the ratio of unique videos. In the future, based on machine learning, we plan to research to help diagnose individual videos and establish channel operation plans and strategies by predicting the selection possibility and selection period based on machine learning.

전세계적으로 수많은 사람들이 이용하는 동영상 플랫폼 YouTube는 인기 급상승 동영상 서비스를 제공하고 있다. 본 연구는 공개 데이터셋 중 하나인 Kaggle 데이터셋을 이용하여 국가별 특징과 문화적 차이를 이해하고 공개 데이터셋의 유용성을 보이는 것을 목적으로 한다. 이를 위해 11개국, 15개 카테고리, 약 110만개의 인기 급상승 동영상 데이터를 분석 대상으로 한다. 데이터 분석을 위해 파이썬을 이용하여 카테고리 별 동영상의 개수와 인기 급상승 동영상 선정 기간, Unique 동영상 비율 등을 구하였으며, 이를 통해 국가별, 카테고리별 특징을 파악하고, 그 현상에 대한 배경을 추가 자료 조사를 통해 확인하였다. 향후 머신 러닝에 기반을 둔 인기 급상승 동영상 선정 가능성 및 선정 기간 예측을 통해 개별 동영상 진단 및 채널 운영 방안과 전략 수립에 도움을 주는 연구를 수행할 예정이다.

Keywords