A Study on Verbs Statistics in Corpus

말모둠에서 동사 분포 연구

  • Choi, Yong-Seok (Department of Computer Science KAIST/KORTERM/AITrc) ;
  • Lee, Woon-Jae (Department of Computer Science KAIST/KORTERM/AITrc) ;
  • Choi, Key-Sun (Department of Computer Science KAIST/KORTERM/AITrc)
  • 최용석 (한국과학기술원 전산학과/전문용어언어공학연구센터/첨단정보기술연구센터) ;
  • 이운재 (한국과학기술원 전산학과/전문용어언어공학연구센터/첨단정보기술연구센터) ;
  • 최기선 (한국과학기술원 전산학과/전문용어언어공학연구센터/첨단정보기술연구센터)
  • Published : 2000.10.13

Abstract

말모둠은 특성에 따라서 여러 성격을 나타내게 된다. 하지만 말모둠의 특성을 자동적으로 알아내는 방법은 간단하지 않다. 중요 단어를 가지고 있으면 말모둠에서 통계적으로 많은 부분에 적용시켜 말모둠의 특성을 파악할 수 있다. 본 논문에서는 한국어 말모둠에서 나타나는 동사류 단어들의 빈도를 분석한다. 또한, 사람이 직접 중요도를 평가한 사전의 단어들과 말모둠에 나타나는 단어들을 비교해서 통계적 차이점을 알아보고, 그 차이점을 통해 앞으로 연구할 일에 대해서 토론한다. 간단한 실험을 통해 사람의 평가한 중요도 점수의 효용성도 알아본다.

Keywords