Deep Learning Based Causal Relation Extraction with Expansion of Training Data

학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출 모델

  • Lee, Seungwook (Dong-A University, Department of Computer Engineering) ;
  • Yu, Hongyeon (Dong-A University, Department of Computer Engineering) ;
  • Ko, Youngjoong (Dong-A University, Department of Computer Engineering)
  • 이승욱 (동아대학교, 컴퓨터공학과) ;
  • 유홍연 (동아대학교, 컴퓨터공학과) ;
  • 고영중 (동아대학교, 컴퓨터공학과)
  • Published : 2018.10.12

Abstract

인과관계 추출이란 어떠한 문장에서 인과관계가 존재하는지, 인과관계가 존재한다면 원인과 결과의 위치까지 분석하는 것을 말한다. 하지만 인과관계 관련 연구는 그 수가 적기 때문에 말뭉치의 수 또한 적으며, 기존의 말뭉치가 존재하더라도 인과관계의 특성상 새로운 도메인에 적용할 때마다 데이터를 다시 구축해야 하는 문제가 있다. 따라서 본 논문에서는 도메인 특화에 따른 데이터 구축비용 문제를 최소화하면서 새로운 도메인에서 인과관계 모델을 잘 구축할 수 있는 통계 기반 모델을 이용한 인과관계 데이터 확장 방법과 도메인에 특화되지 않은 일반적인 언어자질과 인과관계에 특화된 자질을 심층 학습 기반 모델에 적용함으로써 성능 향상을 보인다.

Acknowledgement

Grant : 기계학습용 텍스트 데이터 레이블 자동생성 및 검증도구 개발

Supported by : 정보통신기술진흥센터