DOI QR코드

DOI QR Code

Context Based Real-time Korean Writing Correction for Foreigners

외국인 학습자를 위한 문맥 기반 실시간 국어 문장 교정

  • 박영근 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 김재민 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 이성동 (금오공과대학교 컴퓨터소프트웨어공학과) ;
  • 이현아 (금오공과대학교 컴퓨터소프트웨어공학과)
  • Received : 2017.05.24
  • Accepted : 2017.07.25
  • Published : 2017.10.15

Abstract

Educating foreigners in Korean language is attracting increasing attention with the growing number of foreigners who want to learn Korean or want to reside in Korea. Existing spell checkers mostly focus on native Korean speakers, so they are inappropriate for foreigners. In this paper, we propose a correction method for the Korean language that reflects the contextual characteristics of Korean and writing characteristics of foreigners. Our method can extract frequently used expressions by Koreans by constructing syllable reverse-index for eojeol bi-gram extracted from corpus as correction candidates, and generate ranked Korean corrections for foreigners with upgraded edit distance calculation. Our system provides a user interface based on keyboard hooking, so a user can easily use the correction system along with other applications. Our system improves the detection rate for foreign language users by about 45% compared to other systems in foreign language writing environments. This will help foreign users to judge and correct their own writing errors.

외국인 유학생과 국내 체류 외국인 등 한국어를 학습하고자 하는 외국인이 지속적으로 증가함에 따라 외국인 한국어 학습자의 교육에 대한 관심이 높아지고 있다. 기존 맞춤법 검사기는 한국인의 사용에 중점을 두고 있어 외국인 한국어 학습자가 사용하기에는 다소 부적절하다. 본 논문에서는 한국어의 문맥 특성과 외국인의 작문 특성을 반영한 한국어 교정 방식을 제안한다. 제안하는 방식에서는 국어 문서에서 자주 사용되는 표현을 추천 교정으로 제시하기 위해 말뭉치를 활용한다. 말뭉치에서 추출된 어절 바이그램에 대한 음절 역색인을 사용하여 입력된 작문에 대한 교정 후보 집합을 얻고, 외국인의 작문 특성을 반영하는 편집거리 계산 방법을 사용하여 순위화된 추천 교정을 제시한다. 구현된 시스템에서는 사용성 향상을 위해 키보드 후킹에 기반한 사용자인터페이스를 제공하여 다른 응용프로그램에서의 입력과 동시에 문장 교정 결과를 얻을 수 있다. 외국인의 작문 환경에 대한 평가에서는 타 시스템에 비해 검출률을 약 45% 향상시켜, 제안된 시스템을 사용하는 경우 외국인 사용자가 스스로 작문 오류를 판단하고 수정할 수 있어 한국어 학습에 많은 도움이 될 것으로 기대된다.

Keywords

Acknowledgement

Supported by : 금오공과대학교

References

  1. Basic Statistics on Education in 2016, Ministry of Education, 2016. 8.
  2. Basic Plan for Education Support for Multicultural Students in 2016, Seoul Metropolitan Office of Education, 2016, 2.
  3. NaraInfotech Co., Ltd. , Korean Spelling / Grammar Checker [Online]. Available: http://speller.cs.pusan.ac.kr/
  4. NaraInfotech Co., Ltd., Kwon Hyuk-Chul, "Apparatus for and Method of Korean Orthography," The Patent No. 100798752, 2008. 01.22.
  5. Naver Co., Ltd., Korean Spelling / Grammar Checker [Online]. Available: http://www.naver.com
  6. Daum Co., Ltd., Korean Spelling / Grammar Checker [Online]. Available:https://developers.daum.net/services/apis/grammar-checker/intro
  7. Seo, Su-Baek, "A Study on Analysis of Error Pattern in Korean Writing of international students," Korean Article, 62, 127-157, 2014.
  8. Kim Eun-Kyung, "Korean phonological guidance for foreigners," Chungnam National University Master's Thesis, 2006.
  9. EunBi Go, Jong woo Lee, Jae Won Lee, "An Efficient Set-based POI Data Search Algorithm," Journal of KIISE : Computing Practices and Letters, 19(5), 242-251, 2013.
  10. National Institute of the Korean Language, Language Information Free Board [Online]. Available: https://ithub.korean.go.kr/user/total/database/corpusManager.do
  11. Kim Jong Sook, Yoo Jeong Kim, "Basic study for constructing Korean learner corpus," Bilingual society, 2002.