Classification of similar national petitions and prediction of answerable petitions

국민 청원 유사 글 분류 및 답변 받을 청원 예측

  • Park, Seonga (Big data engineering department, Soonchunhyang University) ;
  • Woo, Jiyoung (Big data engineering department, Soonchunhyang University)
  • 박성아 (순천향대학교 빅데이터공학과) ;
  • 우지영 (순천향대학교 빅데이터공학과)
  • Published : 2021.07.14

Abstract

청와대 국민 청원 게시판은 중복되는 국민 청원글과 20만 이상의 동의를 받았지만 관리자의 검토로 인해 답변이 지연되는 청원글들이 존재한다. 이는 중복 청원으로 인해 청원 동의 인원이 분산되고 답변이 지연되는 문제로 인해 국민들의 불만을 일으킨다. 따라서, 유사한 청원글을 분류하고 동일한 청원 참여 기간 내 유사한 청원글 수를 기반으로 20만 명 이상의 동의를 받을 청원 예측 모델을 구축하였다. 본문 내용만을 LSTM 모델에 적용했을 때 68%의 정확도, 20만 명 이상의 동의를 받은 청원 글에 대해서는 Precision 60%, F1-score 60%이었으나 청원 동의 가능 기간 내 유사한 글의 개수, 본문 길이, 제목의 길이를 추가하였을 때 모델은 74%의 정확도와 20만 명 이상의 동의를 받은 청원 글에 대해 74%의 Precision, 70%의 F1-score로 본문 내용만으로 학습한 모델보다 예측력이 더 높았다.

Keywords