DOI QR코드

DOI QR Code

미등록어 거절 알고리즘에서 가우시안 모델 최적화를 이용한 신뢰도 정규화 향상

In Out-of Vocabulary Rejection Algorithm by Measure of Normalized improvement using Optimization of Gaussian Model Confidence

  • 안찬식 (광운대학교 컴퓨터공학과) ;
  • 오상엽 (경원대학교 IT대학 컴퓨터소프트웨어)
  • 투고 : 2010.08.24
  • 심사 : 2010.09.16
  • 발행 : 2010.12.31

초록

어휘 인식에서는 인식 학습 시 나타나지 않는 미 출현 트라이 폰이 존재하며, 이들 시스템에서는 모델 파라미터들의 초기 추정치를 생성하지 못하고 음소 데이터에 대한 모델을 구성할 수 없는 단점으로 인하여 가우시안 모델의 정확성을 확보하지 못하게 된다. 이를 개선하기 위하여 확률 분포를 이용한 모델 파라미터의 가우시안 모델 최적화 방법을 제안한다. 확률 분포의 가우시안 모델을 최적화하여 가우시안 모델의 정확성을 제공하고, 음소 단위로 데이터의 탐색을 지원하여 신뢰도가 향상되었다. 제안된 방법의 성능 평가를 위하여 실제 다양한 미등록어가 관측될 수 있는 대상으로 실험을 수행하였으며 본 연구에서 제안한 정규화 신뢰도를 이용한 미등록어 거절 알고리즘이 기존의 방법들에 비하여 평균 1.7%의 성능향상을 나타내었다.

In vocabulary recognition has unseen tri-phone appeared when recognition training. This system has not been created beginning estimation figure of model parameter. It's bad points could not be created that model for phoneme data. Therefore it's could not be secured accuracy of Gaussian model. To improve suggested Gaussian model to optimized method of model parameter using probability distribution. To improved of confidence that Gaussian model to optimized of probability distribution to offer by accuracy and to support searching of phoneme data. This paper suggested system performance comparison as a result of recognition improve represent 1.7% by out-of vocabulary rejection algorithm using normalization confidence.

키워드

참고문헌

  1. 방기덕, 강철호, "가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구," 한국멀티미디어학회논문지, 제11권, 제11호, 1471-1479쪽, 2008년 11월.
  2. 김우성, 구명완, "반음소 모델링을 이용한 거절기능에 관한 연구," 한국음향학회지, 제1 8권, 제 3호, 3-9쪽, 1999년.
  3. 문광식, 김회린, 정재호, 이영직, "가변어휘 단어 인식에서의 미등록어 거절 알고리즘의 성능비교," 신호처리합동학술대회논문집, 제12권, 제1호, 305-308쪽, 1999년 10월.
  4. 안찬식, 오상엽, "공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링," 한국컴퓨터정보학회지, 제 15권, 제 1호, 177-183쪽, 2010년 1월. https://doi.org/10.9708/jksci.2010.15.1.177
  5. 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템", 한국컴퓨터정보학회지, 제 14권, 제 10호, 217-223쪽, 2009년 10월.
  6. 김용현, 정민화, "에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상," Proc. KISS Spring Semiannual Conf. 제 27권, 제 1호, 441-443쪽, 2000년 4월.
  7. A. S. Manos and V. W. Zue, "A study on out-ofvocabulary word modeling for a segment-based keyword spotting system," Master Thesis, MIT, 1996.
  8. 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 전자공학회 논문지, 제43권, 제6호, 496-504쪽, 2006년.
  9. L. R. Bahl, P. V. deSouza, P. S. Gopalakrishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," InProc. IEEE ICASSP-92, Vol.1, pp.17-21, 1992.
  10. L. R. Rabiner, B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, 1993.
  11. T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp.217-220, 1998.
  12. 이경록, 김철, 김진영, 최승호, 최승호, "정규화 신뢰도를 이용한 핵심어 검출 성능향상," 한국음향학회지, 제 21권, 제 4호, 380-386쪽, 2002년 5월
  13. 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 대한전자공학회논문지, 제 43권, 제 6호, 496-504쪽, 2006년.
  14. 김상운, 신성효, "ML/MMSE를 이용한 HMM-Net 분류기의 학습에 대한 실험적 고찰," 대한전자공학회논문지C, 제 36C권, 제 6호, 44-51쪽, 1999년 6월.
  15. S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, 2002.
  16. 권석봉, 윤성락, 장규철, 김용래, 김봉완, 김회린, 유창동, 이용주, 권오욱, "한국어 음성인식 플랫폼 (ECHOS)의 개선 및 평가," 대한음성학회지:말소리, 제59호, 53-68쪽, 2006년 9월.
  17. 최승호, "정규화 신뢰도 기반 가변 어휘 고립 단어 인식기의 거절기능 성능 분석," 한국음향학회지, 제25권, 제 2호, 96-100쪽, 2006년 2월.
  18. K. Demuynck, J. Duchateau, and D. Van Comp ernolle, "A static lexicon network representation for cross-word context dependent phones," In Proc. EUROSPEECH, Vol.1, pp.143-146, 1997.
  19. 김기태, 문광식, 김회린, 이영직, 정재호, "가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교," 한국음향학회지, 제 20권, 제 2호, 27-34쪽, 2001년 2월.
  20. M. W. Jeong, B. C. Kim, and G. G. Lee, "Semantic-oriented error correction for spoken query processing," Proc. IEEE Workshop on ASRU, pp.156-161, Nov, 2003.