DOI QR코드

DOI QR Code

Chinese and Korean Cross Lingual News Detection in Twitter

트위터에서 이슈가 되고 있는 중국어-한국어 교차언어 뉴스 탐지

  • Zhao, Shengnan (Dept. of Computer Engineering, Chonbuk National University) ;
  • Tsolmon, Bayar (Dept. of Computer Engineering, Chonbuk National University) ;
  • Lee, Kyung-Soon (Dept. of Computer Engineering, Chonbuk National University) ;
  • Lee, Yong-Seok (Dept. of Computer Engineering, Chonbuk National University)
  • 조승남 (전북대학교 컴퓨터공학부/영상정보신기술연구센터) ;
  • 촐몽 바야르 (전북대학교 컴퓨터공학부/영상정보신기술연구센터) ;
  • 이경순 (전북대학교 컴퓨터공학부/영상정보신기술연구센터) ;
  • 이용석 (전북대학교 컴퓨터공학부/영상정보신기술연구센터)
  • Published : 2012.11.22

Abstract

국제적으로 이슈가 되고있는 사건들의 뉴스는 보도당국의 입장차이에 따라 동일 이슈에 대한 관점의 차이를 나타낸다. 교차언어 연구에서는 번역하는 과정이 중요하다. 본 논문에서는 중-한 어휘번역에서 발생하는 오류 및 모호성을 해결하기 위해 키워드를 중심으로 문맥 어휘를 이용해서 번역한 후 번역결과에서 빈도가 높은 한국어 어휘를 선택하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 3 개에 대한 트윗 데이터에서 실험하여 추출된 중-한 이슈 뉴스 결과에서의 정확도 85.8%의 성능을 보였다. 실험을 통해 제안 방법이 중-한 교차언어 트위터 데이터에서 동일한 이슈와 관련된 뉴스를 찾는데 효과적인 방법임을 알 수 있다.

Keywords