Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism

강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델

  • Kim, Tae-Hyeong (School of Computer Science and Engineering, Kyungpook National University) ;
  • Park, Seong-Bae (Department of Computer Science and Engineering, Kyung Hee University) ;
  • Park, Se-Young (School of Computer Science and Engineering, Kyungpook National University)
  • 김태형 (경북대학교 컴퓨터학부) ;
  • 박성배 (경희대학교 컴퓨터공학과) ;
  • 박세영 (경북대학교 컴퓨터학부)
  • Published : 2018.10.12

Abstract

최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

Acknowledgement

Grant : 비디오 튜링 테스트를 통과할 수준의 비디오 스토리 이해 기반의 질의응답 기술 개발

Supported by : 정보통신기술진흥센터