음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법

Noise-Biased Compensation of Minimum Statistics Method using a Nonlinear Function and A Priori Speech Absence Probability for Speech Enhancement

  • 이수정 (성균관대학교 정보통신공학부 BK21 사업단) ;
  • 이강성 (광운대학교 교양학부) ;
  • 김순협 (광운대학교 컴퓨터공학과)
  • 발행 : 2009.01.31

초록

본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다.

This paper proposes a new noise-biased compensation of minimum statistics(MS) method using a nonlinear function and a priori speech absence probability(SAP) for speech enhancement in non-stationary noisy environments. The minimum statistics(MS) method is well known technique for noise power estimation in non-stationary noisy environments. It tends to bias the noise estimate below that of true noise level. The proposed method is combined with an adaptive parameter based on a sigmoid function and a priori speech absence probability (SAP) for biased compensation. Specifically. we apply the adaptive parameter according to the a posteriori SNR. In addition, when the a priori SAP equals unity, the adaptive biased compensation factor separately increases ${\delta}_{max}$ each frequency bin, and vice versa. We evaluate the estimation of noise power capability in highly non-stationary and various noise environments, the improvement in the segmental signal-to-noise ratio (SNR), and the Itakura-Saito Distortion Measure (ISDM) integrated into a spectral subtraction (SS). The results shows that our proposed method is superior to the conventional MS approach.

키워드

참고문헌

  1. A. Davis and S. Nordholm, "A low complexity statistical voice activity detector with performance comparisons to ITU-T/ ESTI voice activity detectors," Proc. IEEE Int. Conf. Information Communi. & Signal Process., 119-123, 2003 https://doi.org/10.1109/ICICS.2003.1292425
  2. R. Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics," IEEE Trans. Speech Audio Processing 9(5), 504-512, 2001 https://doi.org/10.1109/89.928915
  3. I. Cohen, "Noise spectrum in adverse environments: imporved minima controlled recursive averaging," IEEE Trans. Speech and Audio Proc. 11(5), 466-475, 2003 https://doi.org/10.1109/TSA.2003.811544
  4. L. Lin, W.H. Holmes, and E. Ambikairajah, "Adaptive noise estimation algorithm for speech enhancement," Electronics Letters, 39(9), 754-755, 2003 https://doi.org/10.1049/el:20030480
  5. R. Sundarrajan, C.L. Philipos, "A noise-estimation algorithm for highly non-stationary environment," Speech Communication 48, 220-231, 2006 https://doi.org/10.1016/j.specom.2005.08.005
  6. S. J. Lee and S. H. Kim, "Noise Suppression Using Normalized Time-Frequency Bin Average and Modified Gain Functionn for Speech Enhancement in Nonstationary Noisy Environment," J. Acoust. Soc. Kor. 27(1E), 1-10, 2008
  7. 박윤식, 장준혁, "강인한 음성향상을 위한 Minimum Statistics와 Soft Decision의 확률적 결합의 새로운 잡음전력," 한국음향학회지 26(4), 153-158, 2007
  8. R. Matin, "Bias compensation methods for minimum statistics noise power spectral density estimation," SIGNAL PROCESSING 86, 1215-1229, 2006 https://doi.org/10.1016/j.sigpro.2005.07.037
  9. M. Berouti, M. Scrwartz, J. Makhoul, "Enhancement of speech corrupted by acoustic noise," Proc. IEEE Int. Conf. Acoust. Speech Signal Processing, 208-211, 1979
  10. I. Cohen, "Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator," IEEE Signal Processing Letters 9(4), 113-116, 2002 https://doi.org/10.1109/97.1001645
  11. Y. Ephraim and D. Malah, "SpeechEnhancement using a minimum mean square error log-spectral amplitude estimator," IEEE Trans. Acoust. Speech Signal Process. 23(2), 443-445, 1985 https://doi.org/10.1109/TASSP.1985.1164550
  12. C. L. PHILOPOS, SPEECH ENHANCEMENT (Theory and Practice, 1st edition, (CRC Press, Boca Raton, FL, 2007)