DOI QR코드

DOI QR Code

Detection of inappropriate advertising content on SNS using k-means clustering technique

k-평균 군집화 기법을 활용한 SNS의 부적절한 광고성 콘텐츠 탐지

  • Lee, Dong-Hwan (Dept. of Bigdata Convergence, Graduate School of Computer and Information Technology, Korea University) ;
  • Lim, Heui-Seok (Dept. of Bigdata Convergence, Graduate School of Computer and Information Technology, Korea University)
  • 이동환 (고려대학교 컴퓨터정보통신대학원 빅데이터융합학과) ;
  • 임희석 (고려대학교 컴퓨터정보통신대학원 빅데이터융합학과)
  • Published : 2021.11.04

Abstract

오늘날 SNS를 사용하는 사람들이 증가함에 따라, 생성되는 데이터도 많아지고 종류도 매우 다양해졌다. 하지만 유익한 정보만 존재하는 것이 아니라, 부정적, 반사회적, 사행성 등의 부적절한 콘텐츠가 공존한다. 때문에 사용자에 따라 적절한 콘텐츠를 필터링 할 필요성이 증가하고 있다. 따라서 본 연구에서는 SNS Instagram을 대상으로 콘텐츠의 해시태그를 수집하여 데이터화 했다. 또한 k-평균 군집화 기법을 적용하여, 유사한 특성의 콘텐츠들을 군집화하고, 각 군집은 실루엣 계수(Silhouette Coefficient)와 키워드 다양성(Keyword Diversity)을 계산하여 콘텐츠의 적절성을 판단하였다.

Keywords