Performance Analysis of Speech Recognition in Communication Systems using Speech Coder

음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석

  • Han Sang-Wook (Dept. of Electronics Engineering, Kwangwoon University) ;
  • Jung Heui Suck (Dept. of Telecommunication Engineering, Kwangwoon University) ;
  • Park Hochong (Dept. of Electronics Engineering, Kwangwoon University)
  • 한상욱 (광운대학교 전자공학과) ;
  • 정희석 (광운대학교 전자통신공학과) ;
  • 박호종 (광운대학교 전자공학과)
  • Published : 2002.07.01

Abstract

본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.

Keywords