A Study on the Speech Recognition for Commands of Ticketing Machine using CHMM

CHMM을 이용한 발매기 명령어의 음성인식에 관한 연구

  • 김범승 (코레일 정보기술단, 광운대학교) ;
  • 김순협 (광운대학교 컴퓨터공학과)
  • Published : 2009.04.30

Abstract

This paper implemented a Speech Recognition System in order to recognize Commands of Ticketing Machine (314 station-names) at real-time using Continuous Hidden Markov Model. Used 39 MFCC at feature vectors and For the improvement of recognition rate composed 895 tied-state triphone models. System performance valuation result of the multi-speaker-dependent recognition rate and the multi-speaker-independent recognition rate is 99.24% and 98.02% respectively. In the noisy environment the recognition rate is 93.91%.

논문에서는 연속HMM(Continuos Hidden Markov Model)을 이용하여 실시간으로 발매기 명령어(314개 역명)를 인식 할 수 있도록 음성인식 시스템을 구현하였다. 특징 벡터로 39 MFCC를 사용하였으며, 인식률 향상을 위하여 895개의 tied-state 트라이폰 음소 모델을 구성하였다. 시스템 성능 평가 결과 다중 화자 종속 인식률은 99.24%, 다중화자 독립 인식률은 98.02%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 다중 화자 독립 실험의 경우 93.91%의 인식률을 나타내었다.

Keywords

References

  1. 강점자, 강병옥, 정호영, 정훈, 이윤근, "신성장동력산업용 대어휘 음성인식 기술 동향 및 응용", 전자통신동향분석, 제23권 제1호, pp. 65-76, 2008. 2
  2. L. R. Rabine, "A tutorial on hidden Markov models and selected applications in speech recognition", Proc IEEE, vol. 77, no. 2, pp. 257-286, Feb. 1989 https://doi.org/10.1109/5.18626
  3. D. A. Reynolds and R. C. Rose, "Robust text-independent speaker identification using gaussan mixture speaker models", IEEE Transactions on Speech and Audio Processing, vol. 3, no. 1, pp. 72-83, Jan. 1995 https://doi.org/10.1109/89.365379
  4. D. Jurafsky and J. H. Martin, "Speech and Language Processing", Prentice Hall(2nd), 2008
  5. L. R. Rabiner and B. H. Juang, "Fundamentals of Speech Recognition", Prentice Hall, 1993
  6. L. Gu and K. Rose, "Sub-state tying in tied mixture hidden Markov models", Proc. IEEE Int. Conf. Acoustics, Speech, and Signal Processing, pp. 1062-1065, 2000
  7. Y. Ephraim, D. Malah, B. H. Juang, "On the Application of Hidden Markov Models for Enhancing Noisy Speech", IEEE Transaction on Acoustics, Speech, and Signal Processing, vol. 37, no. 12, pp. 1846-1856, Dec. 1989 https://doi.org/10.1109/29.45532
  8. P. J. Moreno, "Speech Recognition in Noisy Environments", Phd. dissertation", Carnegie Mellon Univ. Pittsburgh, Pennsylvania, 1996