Proceedings of the Korean Society of Computer Information Conference (한국컴퓨터정보학회:학술대회논문집)
- 2021.07a
- /
- Pages.37-39
- /
- 2021
Classification of similar national petitions and prediction of answerable petitions
국민 청원 유사 글 분류 및 답변 받을 청원 예측
- Park, Seonga (Big data engineering department, Soonchunhyang University) ;
- Woo, Jiyoung (Big data engineering department, Soonchunhyang University)
- Published : 2021.07.14
Abstract
청와대 국민 청원 게시판은 중복되는 국민 청원글과 20만 이상의 동의를 받았지만 관리자의 검토로 인해 답변이 지연되는 청원글들이 존재한다. 이는 중복 청원으로 인해 청원 동의 인원이 분산되고 답변이 지연되는 문제로 인해 국민들의 불만을 일으킨다. 따라서, 유사한 청원글을 분류하고 동일한 청원 참여 기간 내 유사한 청원글 수를 기반으로 20만 명 이상의 동의를 받을 청원 예측 모델을 구축하였다. 본문 내용만을 LSTM 모델에 적용했을 때 68%의 정확도, 20만 명 이상의 동의를 받은 청원 글에 대해서는 Precision 60%, F1-score 60%이었으나 청원 동의 가능 기간 내 유사한 글의 개수, 본문 길이, 제목의 길이를 추가하였을 때 모델은 74%의 정확도와 20만 명 이상의 동의를 받은 청원 글에 대해 74%의 Precision, 70%의 F1-score로 본문 내용만으로 학습한 모델보다 예측력이 더 높았다.