인지 LPC cepstrum의 새로운 구현 및 음성인식에의 적용

A new Implementation of Perceptual LPC Cepstrum and its Application to Speech Recognition

  • 김진영 (전남대학교 공과대학 전자공학과) ;
  • 최승호 (동신대학교 공과대학 전자공학과)
  • Kim, Jin-Young (Chonnam National University, Dept. of Electronics Eng.) ;
  • Choi, Seong-Ho (Dongshin University, Dept. of Information & Communication Eng.)
  • 발행 : 1996.10.01

초록

본 논문에서는 귀의 주요한 특징인 주파수가중특성과 Bark-scale이라는 비선형주파수특성을 선형주파수축상에서 고려한 거리함수를 정의하고, 이 거리함수로부터 새로운 LPC cepstrum 계수를 제안한다. 귀의 특성은 선형주파수축에서 로그 스펙트럼에 대한 가증함수로서 표현되며, 이 가중함수는 cepstrum 영역에서 콘볼루션으로 표현되어 콘볼루션적으로 가중되는 LPC cepstrum을 정의하게 된다. 제안된 cepstrum 계수에서 정의된 가중함수는 A-weighting의 영향과 비선형주파수축의 영향을 하나의 가중함수로 통합하여 사용된 것이다. 제안된 파라미터의 성능을 음성인식 실험을 통하여 검증하였다.

To improve the performance of a recognition system, namely the recognition rate, we propose a hew implementation of perceptual distance using LPC cepstrum(perceptual cepstrum, PLC). The PLC is caculated by convolution of a usual LPC cepstrum and a perceptual lifter(PL). To caculate PL, we define a new weighting function in the linear frequency domain considering the frequency scale(Bark-scale) characteristics. The PL is the inverse Fourier transform of the exponents of the weighting function. We verified our method through the speech recognition experiments. The performance of PLC was compared with that of the rasied sine liftering method.

키워드