의사 N-gram 언어모델을 이용한 핵심어 검출 시스템에 관한 연구

A Study on Keyword Spotting System Using Pseudo N-gram Language Model

  • 이여송 (영남대학교 전자정보공학부) ;
  • 김주곤 (영남대학교 전자정보공학부) ;
  • 정현열 (영남대학교 전자정보공학부)
  • 발행 : 2004.04.01

초록

일반적인 핵심어 검출 시스템에서는 필러모델과 핵심어모델을 연결단어 인식 네트워크로 구성하여 핵심어 검출에 사용한다. 이것은 대량의 텍스트 데이터를 이용한 대어휘 연속 음성인식에서 구해지는 단어의 출현빈도의 언어모델을 핵심어 검출 시스템에서 효과적으로 구성할 수가 없는 어려움이 있기 때문이다. 이를 해결하기 위하여 본 논문에서는 의사 N-gram 언어모델을 이용한 핵심어 검출 시스템을 제안하고 핵심어와 필러모델의 출현빈도의 변화에 따른 핵심어 검출 성능을 조사하였다. 그 결과, 핵심어와 필러모델의 출현확률을 0.2:0.8의 비율에서 CA (Correctly Accept for Keyword: 핵심어를 제대로 인정한 경우)가 91.1%, CR (Correctly Reject for OOV: 비핵심어에 대해 제대로 거절한 경우)는 91.7%로써, 일반적인 연결단어인식 네트워크를 이용한 방법보다 제안된 방법이 CA-CR 평균 인식률의 에러감소율 (Error Reduction Rate)에서 14%향상되어 핵심어 검출에서의 언어모델 도입의 효과를 확인할 수 있었다.

Conventional keyword spotting systems use the connected word recognition network consisted by keyword models and filler models in keyword spotting. This is why the system can not construct the language models of word appearance effectively for detecting keywords in large vocabulary continuous speech recognition system with large text data. In this paper to solve this problem, we propose a keyword spotting system using pseudo N-gram language model for detecting key-words and investigate the performance of the system upon the changes of the frequencies of appearances of both keywords and filler models. As the results, when the Unigram probability of keywords and filler models were set to 0.2, 0.8, the experimental results showed that CA (Correctly Accept for In-Vocabulary) and CR (Correctly Reject for Out-Of-Vocabulary) were 91.1% and 91.7% respectively, which means that our proposed system can get 14% of improved average CA-CR performance than conventional methods in ERR (Error Reduction Rate).

키워드

참고문헌

  1. IEEE Trans. Acoust., Speech Signal Processing v.38 no.11 Automatic recognition of keywords in unconstrained speech using hidden markov models J.G.Wilpon;L.R.Rabiner;C.H.Lee;E.R.Goldman
  2. IEEE Trans. on Speech and Audio Progression v.2 no.3 A Fast Algorithm for Large Vocabulary Keyword Spotting Application Eng-Fong Huang;Hsiao-Chuan Wang;Frank K. Soong
  3. 한국음향학회 학술 발표대 논문집 v.19 no.2(s) 가변어휘 핵심어 검출 시스템의 구현 신영욱;송명규;김형순
  4. 한국음향학회지 v.20 no.2 가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교 김기태(외4명)
  5. The HTK BOOK (for HTK Version 3.0) Steve Young
  6. ICASSP Discriminative utterance Verification Using Minimum String Verification Error (MSVE) Training Mazin G Rahim;Chin-Hui Lee;Biing-Hwang Juang;Wu Chou
  7. 한국음향학회지 v.12 no.3 반음소 모델링을 이용한거절기능에 대한 연구 김우성;구명완
  8. 한국음향학회지 v.21 no.4 정규화 신뢰도를 이용한 핵심어 검출 성능향상 김철(외4명)
  9. ICSLP A New Method for Dialogue Management in an Intelligent System for Information Retrieval A.Kenji;K.Kazushige;T.Kazunari;C.Sumio;F.Hiroya
  10. ICSLP Keyword Spotting in Auto-Attendant System Q.Gou;Y.H.Yan;Z.W.lin;B.S.Yuan;Q.W.Zhao;J.Liu