Attention-based Sequence-to-Sequence 모델을 이용한 한국어 어체 변환

Korean Text Style Transfer Using Attention-based Sequence-to-Sequence Model

  • 홍태석 (서강대학교 컴퓨터공학과) ;
  • 허광호 (서강대학교 컴퓨터공학과) ;
  • 안휘진 (서강대학교 컴퓨터공학과) ;
  • 강상우 (가천대학교 소프트웨어학과) ;
  • 서정연 (서강대학교 컴퓨터공학과)
  • Hong, Taesuk (Department of Computer Science and Engineering, Sogang University) ;
  • Xu, Guanghao (Department of Computer Science and Engineering, Sogang University) ;
  • Ahn, Hwijeen (Department of Computer Science and Engineering, Sogang University) ;
  • Kang, Sangwoo (Department of Software, Gachon University) ;
  • Seo, Jungyun (Department of Computer Science and Engineering, Sogang University)
  • 발행 : 2018.10.12

초록

한국어의 경어체는 종결어미에 따라 구분하고, 서로 다른 경어체는 각각 고유한 경어 강도가 있다. 경어체 간의 어체 변환은 규칙기반으로 진행되어 왔다. 본 논문은 어체 변환을 위한 규칙 정의의 번거로움을 줄이고 어체 변환 데이터만을 사용한 심층 학습 기반의 어체 변환 방법을 제안한다. 본 연구는 '해요체-합쇼체' 쌍의 병렬 데이터를 이용하여 Attention-based Sequence-to-Sequence 모델을 바탕으로 한 어체 변환 모델을 학습하였다. 해당 모델을 학습하고 실험하였을 때, 정확도 91%의 우수한 성과를 얻을 수 있었다.

과제정보

연구 과제 주관 기관 : 한국연구재단, 정보통신기술진흥센터