On Word Embedding Models and Parameters Optimized for Korean

한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구

  • Published : 2016.10.07

Abstract

본 논문에서는 한국어에 최적화된 단어 임베딩을 학습하기 위한 방법을 소개한다. 단어 임베딩이란 각 단어가 분산된 의미를 지니도록 고정된 차원의 벡터공간에 대응 시키는 방법으로, 기계번역, 개체명 인식 등 많은 자연어처리 분야에서 활용되고 있다. 본 논문에서는 한국어에 대해 최적의 성능을 낼 수 있는 학습용 말뭉치와 임베딩 모델 및 적합한 하이퍼 파라미터를 실험적으로 찾고 그 결과를 분석한다.

Acknowledgement

Supported by : 한국연구재단