RNN Based Natural Language Sentence Generation from a Knowledge Graph and Keyword Sequence

핵심어 시퀀스와 지식 그래프를 이용한 RNN 기반 자연어 문장 생성

  • Kwon, Sunggoo (School of Computer Science and Engineering, Kyungpook National Univerisity) ;
  • Noh, Yunseok (School of Computer Science and Engineering, Kyungpook National Univerisity) ;
  • Choi, Su-Jeong (School of Computer Science and Engineering, Kyungpook National Univerisity) ;
  • Park, Se-Young (School of Computer Science and Engineering, Kyungpook National Univerisity)
  • 권성구 (경북대학교 컴퓨터학부) ;
  • 노윤석 (경북대학교 컴퓨터학부) ;
  • 최수정 (경북대학교 컴퓨터학부) ;
  • 박세영 (경북대학교 컴퓨터학부)
  • Published : 2018.10.12

Abstract

지식 그래프는 많은 수의 개채와 이들 사이의 관계를 저장하고 있기 때문에 많은 연구에서 중요한 자원으로 활용된다. 최근에는 챗봇과 질의응답과 같은 연구에서 자연어 생성을 위한 연구에 활용되고 있다. 특히 자연어 생성에서 최근 발전 된 심층 신경망이 사용되고 있는데, 이러한 방식은 모델 학습을 위한 많은 양의 데이터가 필요하다. 즉, 심층신경망을 기반으로 지식 그래프에서 문장을 생성하기 위해서는 많은 트리플과 문장 쌍 데이터가 필요하지만 학습을 위해 사용하기엔 데이터가 부족하다는 문제가 있다. 따라서 본 논문에서는 데이터 부족 문제를 해결하기 위해 핵심어 시퀀스를 추출하여 학습하는 방법을 제안하고, 학습된 모델을 통해 트리플을 입력으로 하여 자연어 문장을 생성한다. 부족한 트리플과 문장 쌍 데이터를 대체하기 위해 핵심어 시퀀스를 추출하는 모듈을 사용해 핵심어 시퀀스와 문장 쌍 데이터를 생성하였고, 순환 신경망 기반의 인코더 - 디코더 모델을 사용해 자연어 문장을 생성하였다. 실험 결과, 핵심어 시퀀스와 문장 쌍 데이터를 이용해 학습된 모델을 이용해 트리플에서 자연어 문장 생성이 원활히 가능하며, 부족한 트리플과 문장 쌍 데이터를 대체하는데 효과적임을 밝혔다.

Acknowledgement

Grant : WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발

Supported by : 정보통신기술진흥센터