DOI QR코드

DOI QR Code

A Study on the Realization of Wireless Home Network System Using High-performance Speech Recognition in Variable Position

가변위치 고음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 관한 연구

  • Received : 2010.01.22
  • Accepted : 2010.02.09
  • Published : 2010.04.30

Abstract

In realization of wireless home network system using speech recognition in indoor voice recognition environment, background noise and reverberation are two main causes of digression in voice recognition system. In this study, the home network system resistant to reverberation and background noise using voice section detection method based on spectral entropy in indoor recognition environment is to be realized. Spectral subtraction can reduce the effect of reverberation and remove noise independent from voice signal by eliminating signal distorted by reverberation in spectrum. For effective spectral subtraction, the correct separation of voice section and silent section should be accompanied and for this, improvement of performance needs to be done, applying to voice section detection method based on entropy. In this study, experimental and indoor environment testing is carried out to figure out command recognition rate in indoor recognition environment. The test result shows that command recognition rate improved in static environment and reverberant room condition, using voice section detection method based on spectral entropy.

실내 환경에서 음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 있어, 잡음과 실내 잔향음은 시스템 성능 저하의 주요 원인이다. 본 연구에서는 실내 인식환경에서 스펙트럼 엔트로피(Spectral entropy) 기반의 음성 구간검출법을 이용하여 잔향음(reverberation) 및 실내잡음에 강인한 음성인식 홈 네트워크 시스템을 구현하고자 한다. 스펙트럼 차감법(Spectral Subtraction)은 잔향으로 인해 왜곡된 신호를 스펙트럼 상에서 제거하여 잔향의 효과를 줄일 수 있고 음성신호와 독립적인 잡음을 제거 할 수 있다. 효과적인 스펙트럼 차감을 위해서는 음성과 비음성 구간의 정확한 구분이 수반되어야 하며 이를 위해서 엔트로피 기반의 음성 구간 검출법을 적용하여 성능을 향상시킨다. 모의 및 실내환경 실험 결과 Spectral entropy 기반의 음성 구간 검출법을 이용할 경우 실내 잔향 및 잡음환경에서 명령어 인식률의 향상이 증명되었다.

Keywords

References

  1. D. Bees, M. Blostein and P. Kabal, "Reverberant speech enhancement using cepstral processing," in proc. IEEE Int. Conf. Acoustics, Speech Signal Processing, 1991, pp. 977-980.
  2. J. B. Allen, D. A. Berkley and J. Blauert, "Multimicrophone signal-processing technique to remove room reverberation from speech signals," J. Acoust. Soc. Amer., vol. 62, no. 4, pp. 912-915, 1977. https://doi.org/10.1121/1.381621
  3. K. Lebart and J.M. Boucher, "A New Method Based on Spectral Subtraction for Speech Dereverberation," Acta Acoustica, vol. 87, pp. 359-366, 2001.
  4. Mingyang Wu and DeLiang Wang, "A two-stage algorithm for one-microphone reverberant speech enhancement," IEEE Trans. Speech Audio Process., Vol. 14, no. 3, pp. 774-784, May 2006. https://doi.org/10.1109/TSA.2005.858066
  5. R. V. Prasad, R. Muralishankar and S. Vijay, "Voice Activity Detection for VoIP-An Information Theoretic Approach," in proc. IEEE Int. Conf. Telecommunications, 2006, pp. 1-6.
  6. 노용완, 이규범, 이우석, 홍광석, "차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출," 한국신호처리시스템학회논문지, vol.9, no. 2, 2008, pp.121-128