A Speech Coder for Server-Based Speech Recognition in Mobile Communication

이동통신 환경 하에서의 서버 기반 음성 인식을 위한 음성 부호화 기법

  • Lee Gil Ho (Gwangju Institute of Science and Technology (GIST)) ;
  • Yoon Jae Sam (Gwangju Institute of Science and Technology (GIST)) ;
  • Oh Yoo Rhee (Gwangju Institute of Science and Technology (GIST)) ;
  • Kim Hong Kook (Gwangju Institute of Science and Technology (GIST))
  • 이길호 (광주과학기술원 정보통신공학과) ;
  • 윤재삼 (광주과학기술원 정보통신공학과) ;
  • 오유리 (광주과학기술원 정보통신공학과) ;
  • 김홍국 (광주과학기술원 정보통신공학과)
  • Published : 2004.11.01

Abstract

본 논문의 목적은 이동통신 환경 하에서 음성 인식과 음성 부호화를 성능의 저하 없이 동시에 수행하기 위한 기법을 개발하는 것에 있다. 이를 구현하기 위해 통신상에서 전송되는 음성 특징 파라미터는 기존 음성 부호화기의 LPC 대신 음성 인식 파라미터인 MFCC를 사용하였다. 따라서 음성 인식 성능은 향상된다 하지만 음성 재생을 위해 MFCC를 LPC로 변환하는 과정에서 오차가 발생하여 전송되는 bit 수에 비해 만족할만한 음질을 얻을 수 없다. 따라서 이 오차를 보상하여야 하며 이를 위한 변수를 추가하여 음질을 개선시켰다. 그 결과 음질과 음성 인식에서 안정된 성능을 보이는 음성 부호화기를 개발하였다.

Keywords