On a Multiband Nonuniform Samping Technique with a Gaussian Noise Codebook for Speech Coding

가우시안 코드북을 갖는 다중대역 비균일 음성 표본화법

  • Published : 1997.12.01

Abstract

When applying the nonuniform sampling to noisy speech signal, the required data rate increases to be comparable to or more than that by uniform sampling such as PCM. To solve this problem, we have proposed the waveform coding method, multiband nonuniform waveform coding(MNWC), applying the nonuniform sampling to band-separated speech signal[7]. However, the speech quality is deteriorated when it is compared to the uniform sampling method, since the high band is simply modeled as a Gaussian noise with average level. In this paper, as a good method to overcome this drawback, the high band is modeled as one of 16 codewords having different center frequencies. By doing this, with maintaining high speech quality as MOS score of average 3.16, the proposed method achieves 1.5 times higher compression ratio than that of the conventional nonuniform sampling method(CNSM).

잡음 음성신호에 비균일 표본화 부호화법을 적용하면, PCM 균일표본화의 전송율 정도로 데이타 전송율이 높아진다. 이러한 문제점을 해결하기 위해 비균일 표본화법을 성분분리된 음성신호에 적용하는 방법으로서 다중대역 비균일 파형부호화(MNWC)법을 제안하였었다. 그렇지만, 고대역의 성분에 대해 가우시안 잡음의 평균레벨로 단순하게 모델링 하였기 때문에, 비균일 표본화법에 비해 음질의 열화가 초래되었었다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해 고대역의 성분을 중심주파수가 서로 다른 16가지의 가우시안 잡음으로 모델링하였다. 이렇게 하였을 때, 제안된 방법은 MOS평가가 평균 3.16 정도로 고음질을 유지하면서도 기존의 비균일 표본화법에 비해 1.5배 정도의 압축 율을 얻을 수 있었다.

Keywords