DOI QR코드

DOI QR Code

Multi-channel input-based non-stationary noise cenceller for mobile devices

이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기

  • 정상배 (한국정보통신대학교 공학부) ;
  • 이성독 (한국정보통신대학교 공학부)
  • Published : 2007.12.25

Abstract

Noise cancellation is essential for the devices which use speech as an interface. In real environments, speech quality and recognition rates are degraded by the auditive noises coming near the microphone. In this paper, we propose a noise cancellation algorithm using stereo microphones basically. The advantage of the use of multiple microphones is that the direction information of the target source could be applied. The proposed noise canceller is based on the Wiener filter. To estimate the filter, noise and target speech frequency responses should be known and they are estimated by the spectral classification in the frequency domain. The performance of the proposed algorithm is compared with that of the well-known Frost algorithm and the generalized sidelobe canceller (GSC) with an adaptation mode controller (AMC). As performance measures, the perceptual evaluation of speech quality (PESQ), which is the most widely used among various objective speech quality methods, and speech recognition rates are adopted.

잡음의 제거는 음성을 인터페이스로 하는 기기들에 필수적이라고 할 수 있다. 실질적으로 통화 품질이나 음성 인식률은 음성 입력부의 주변에서 들어오는 원치 않는 가산성 잡음에 의해서 크게 열화된다. 본 논문에서는 기본적으로 두 개의 마이크로폰을 이용한 잡음제거 방법을 제안한다. 마이크를 여러 개 사용했을 때의 장점은 방향 정보를 이용할 수 있다는 것인데 이는 사람 목소리, 음악 소리 등의 비정상성 잡음을 제거하는 데에 유용하다. 제안된 잡음제거 알고리즘은 위너필터에 기반 한다고 볼 수 있다. 위너필터에 의한 잡음제거를 위해서는 검출하고자 하는 음성과 제거하고자 하는 잡음의 주파수 응답이 동시에 추정 가능해야 한다. 이를 위해서 주파수 영역에서 스펙트럼 분류를 시행하여 위너필터 기반의 잡음제거에 필요한 정보를 얻는다. 제안된 알고리즘을 이용한 성능은 잘 알려진 프로스트 (Frost) 알고리즘 및 적응 모드 컨트롤러를 갖는 generalized sidelobe canceller (GSC)와 비교하였다. 성능의 지표로는 객관적 음질 평가의 방법 중에서 널리 쓰이고 있는 perceptual evaluation of speech quality (PESQ) 및 음성 인식률이 사용되었다.

Keywords

References

  1. ETSI Std. ES 202 212 Vl.1.2, 'Speech processing, transmission and quality aspects (STQ)', (ETSI, 2005)
  2. S. Jeong and M. Hahn, 'Speech quality and recognition rate improvement in car noise environments', Electronics Letters, Vol. 37, No.2, pp. 800-802, 2001 https://doi.org/10.1049/el:20010513
  3. B. Veen and K. Buckley, 'Beamforming: a versa- tile approach to spatial filtering', IEEE ASSP Magazine, pp. 4-24, Apr. 1988
  4. Hoshuyama, O., Sugiyama. A., and Hirano. A., 'A robust adaptive beamformer for microphone arrays with a blocking matrix using constrained adaptive filters', IEEE Trans. Signal Proc., Vol. 47, No. 10, pp. 2677-2684, 1999 https://doi.org/10.1109/78.790650
  5. Y. Jung, H. Kang, C. Lee, D. Youn, C. Choi, and J. Kim, 'Adaptive microphone array system with two-stage adaptation mode controller', IEICE Trans. Fundamentals, Vol. E88- A, No.4, Apr. 2005
  6. O. Frost, 'An algorithm for linearly constrained adaptive array processing', Proc. of the IEEE, Vol. 60, No.8, pp. 926-935, 1972 https://doi.org/10.1109/PROC.1972.8817
  7. O. Yilmaz and S. Rickard, 'Blind separation of speech mixtures via time-frequency masking', IEEE Trans. Signal. Proc., Vol. 52, No.7, pp. 1830-1847, 2004 https://doi.org/10.1109/TSP.2004.828896
  8. S. Werner, J. Apolinario, M. Campos, and P. Diniz, 'Low-complexity constrained affine-projection algorithms', IEEE Trans. Signal Proc., Vol. 53, No. 12, pp. 4545-4555, Dec. 2005 https://doi.org/10.1109/TSP.2005.859348
  9. ITU-T Recommendation P.862, 'Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech coders', Feb. 2001
  10. M. Hayes, 'Statistical digital signal processing and modeling', John Wiley & Sons, INC., 1996

Cited by

  1. Performance Improvement of Double Talk Detection before Convergence of the Echo Canceller by Using Linear Predictive Coding Filter Gain of the Primary Input Signal vol.24, pp.6, 2014, https://doi.org/10.5391/JKIIS.2014.24.6.628