A Similarity-based Dialogue Modeling with Case Frame and Word Embedding

격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링

  • Lee, Hokyung (DongA University, Department of Computer Engineering) ;
  • Bae, Kyoungman (DongA University, Department of Computer Engineering) ;
  • Ko, Youngjoong (DongA University, Department of Computer Engineering)
  • 이호경 (동아대학교 컴퓨터공학과) ;
  • 배경만 (동아대학교 컴퓨터공학과) ;
  • 고영중 (동아대학교 컴퓨터공학과)
  • Published : 2016.10.07

Abstract

본 논문에서는 격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링을 제안한다. 기존의 유사도 기반 대화 모델링 방법은 형태소, 형태소 표지, 개체명, 토픽 자질, 핵심단어 등을 대화 말뭉치에서 추출하여 BOW(Bag Of Words) 자질로 사용하였기 때문에 입력된 사용자 발화에 포함된 단어들의 주어, 목적어와 같은 문장성분들의 위치적 역할을 반영할 수 가 없다. 또한, 의미적으로 유사하지만 다른 형태소를 가지는 문장 성분들의 경우 유사도 계산에 반영되지 않는 형태소 불일치 문제가 존재한다. 이러한 문제점을 해결하기 위해서, 위치적 정보를 반영하기 위한 문장성분 기반의 격틀과 형태소 불일치 문제를 해결하기 위한 워드임베딩을 활용하여 개선된 유사도 기반 대화 모델링을 제안한다. 개선된 유사도 기반 대화 모델링은 MRR 성능 약 92%의 성능을 나타낸다.

Acknowledgement

Supported by : 한국연구재단