Performance Improvement of Korean Connected Digit Recognition Based on Acoustic Parameters

음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선

  • Published : 1999.07.01

Abstract

This paper proposes use of acoustic parameters to improve the discriminability among digit models in Korean connected digit recognition. The proposed method used the logarithmic values of energy ratio between the predetermined frequency bands as additional feature parameters, based on the acoustic-phonetic knowledge. The results of our experiment show that the proposed method reduced the error rate by 46% in comparison with the baseline system. And incorporation of channel compensation technique in the proposed method yielded error reduction of about 69%.

본 연구에서는 한국어 연결숫자인식에 있어서 모델간의 변별력을 향상시키기 위하여 음향학적 파라메터(Acoustic Parameter)를 사용하는 것을 제안한다. 제안된 방법은 음성학적 지식에 근거하여 적절한 주파수 대역별 에너지의 비의 로그값을 추가적인 특징 파라메터로 사용한다. 실험결과, 제안된 방법을 사용함으로써 기본 인식시스템에 비해 오류율이 최고 46% 정도 감소됨을 확인할 수 있었다. 그리고 채널보상 기술을 함께 적용함으로써 69% 정도의 오류율 감소를 얻었다.

Keywords

References

  1. Fundamentals of Speech Recognition L. Rabiner;B. H. Juang
  2. 제10회 신호처리 합동학술대회 논문집 연결 숫자음 인식에서의 상태 및 단어 유지 확률을 이용한 지속시간 모델링 양태영(외8인)
  3. 제 11회 신호처리합동학술대회 논문집 Voice dialing system을 위한 연속음성인식 이성권:김순협
  4. 제 15회 음성통신 및 신호처리 워크샵 논문집 한국어 연결숫자인식을 위한 숫자 모델링에 관한 연구 김기성;김승희;김형순;지민제
  5. IEEE Trans. on Speech and Audio Processing v.2 no.2 High-performance connected digit recognition using maximum mutual information estimation Y. Normandin;R. Cardin;R. De Mori
  6. Ph.D. thesis, Department of Communication Technology, Aalborg University Acoustic-Phonetic Features used in Automatic Speech Recognition A. V. Hansen
  7. Proc. IEEE ICSLP C. H. Lee and F. K. Soong, Cepstral channel normalization techniques for HMM-based speaker verification A. E. Rosenberg
  8. Proc. IEEE ICASSP Signal bias removal for robust telephone based speech recognition in adverse environments M. G. Rahim;B. H. Juang
  9. IEEE Trans. on Speech and Audio Processing v.2 no.4 RASTA processing of speech H. Hermansky
  10. IEEE Trans. on ASSP v.ASSP-29 Cepstral analysis technique for automatic speaker verification S. Furui
  11. Proc. IEEE ICSLP Compensation of telephone line effects for robust speech recognition C. Mokbel;P. Paches-Leal;D. Jouvet;J. Monne
  12. Filtering the time sequences of spectral parameters for speech recognition, Speech Communication v.22 C. Nadeu;P. Paches-Leal;B. H. Juang
  13. Korean Speech Data Base CD-ROM 국어공학센터