Webtoon Search utilizing Genre Similarity with Word2Vec

Word2Vec 기반 장르 유사성을 활용한 웹툰 검색

  • Lee, ChangMin (Kumoh National Institute of Technology, Dept. of Computer Software Engineering) ;
  • Ahn, JeJeong (Kumoh National Institute of Technology, Dept. of Computer Software Engineering) ;
  • Kang, DongYeon (Kumoh National Institute of Technology, Dept. of Computer Software Engineering) ;
  • Lee, Hyunah (Kumoh National Institute of Technology, Dept. of Computer Software Engineering)
  • 이창민 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 안제정 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 강동연 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 이현아 (금오공과대학교 컴퓨터소프트웨어공학과)
  • Published : 2019.10.10

Abstract

본 논문에서는 기존 웹툰 장르 검색 시스템의 단점을 보완하기 위해 키워드 기반 유사 장르 검색 시스템을 제안한다. 기존 웹툰의 장르와 키워드를 분석하여 44개의 장르를 설정하고 해당 장르에 적합한 웹툰을 수집한다. 나무위키와 위키피디아 문서로 학습된 Word2Vec모델에 기반하여 계산한 사용자 입력 키워드와 44개의 장르간 유사도로 사용자 입력에 가장 유사한 장르를 찾는다. 유사 장르에 포함되는 웹툰을 결과로 출력하여 사용자가 선호하는 장르의 웹툰을 제시한다. 실험 결과에서는 나무위키에서 '장르'로 검색하여 얻는 작은 크기의 문서 집합에서 Word2Vec을 학습한 모델에서 가장 높은 검색 성능을 보였다.

Keywords