Corpus Analyzer for Linguists

언어학자를 위한 말뭉치 분석기

  • Jeong, Seok-Pal (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Lim, Seong-Jyeon (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Jeon, Jin-Hyeong (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Lee, Hyun Ah (Kumoh National Institute of Technology, Department of Computer Software Engineering)
  • 정석팔 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 임성현 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 전진형 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 이현아 (금오공과대학교 컴퓨터소프트웨어공학과)
  • Published : 2012.10.06

Abstract

말뭉치는 언어를 연구하기 위한 중요한 재료이다. 본 논문에서는 말뭉치에서 나타나는 언어 현상을 보다 효율적으로 분석하기 위한 언어학자를 위한 말뭉치 분석기를 제안하고 그 구현 방법을 설명한다. 제안하는 말뭉치 분석기는 기본적인 통계 정보와 함께, 형태소 분석된 파일을 대상으로 위치 색인을 포함하는 역파일 색인을 구성하여 빠른 형태소 검색과 다앙한 수준의 연어 검색을 제공한다. 분석기는 세종말뭉치를 기본 말뭉치로 하며, 다앙한 말뭉치에 대한 통계자료와 검색 기능을 제공하기 위해 사용자 말뭉치 파일에 대한 처리도 지원한다. 시스템은 사용자가 업로드한 말뭉치 파일에 대하여 자동 형태소 분석을 제공하며 형태소 분석 결과 수정을 가능하게 하여 다앙한 말뭉치에서 언어학자들의 우리말 연구를 지원한다.

Keywords