DOI QR코드

DOI QR Code

Classification of Speech and Car Noise Signals using the Slope of Autocovariances in Frequency Domain

주파수 영역 자기 공분산 기울기를 이용한 음성과 자동차 소음 신호의 구분

  • Received : 2011.08.12
  • Accepted : 2011.09.02
  • Published : 2011.10.31

Abstract

Speech signal and car noise signal such as muffler noise are segregated from the one which has both signals mixed using statistical method. To classify speech signal from the other in segregated signals, FFT coefficients were obtained for all segments of a signal where each segment consists of 128 elements of a signal. For several coefficients of FFT corresponding to the low frequencies of a signal, autocovariances are calculated between coefficients of same order of all segments of a signal. Then they were averaged over autocovariances. Linear equation was eatablished for the those autocovariances using the linear regression method for each siganl. The coefficient of the slope of the line gives reference to compare and decide what the speech signal is. It is what this paper proposes. The results show it is very useful.

음성 신호와 자동차 엔진 배기음 등의 소음이 섞인 신호에서 통계적 방법을 이용하여 음성 신호와 자동차 소음 신호를 분리하였다. 분리된 신호에서 음성신호를 구분해 내기 위해 128개의 원소를 갖는 신호 조각의 연속으로 신호를 재구성하고 각 신호 조각에 대해 FFT를 구하였다. 각 신호 조각의 FFT 계수 중에서 저주파 영역의 일부 계수 중 계수 각각에 대해 각 신호 조각 사이의 자기 공분산을 구하고 이들을 평균하였다. 그리고 linear regression을 이용 하여 평균 자기 공분산 값들을 연결하는 직선의 방정식을 구한 후 이 직선의 기울기를 비교하여 음성 신호와 자동차 소음 신호를 구분하는 방법을 제안하고 유용성을 확인하였다.

Keywords

References

  1. J. F. Cardoso, "Blind signal separation: statistical principles," Proc. IEEE, vol. 9, no. 10, pp. 2009-2-25, Oct., 1988.
  2. A. Hyvarinen and E. Oja, "Independent component analysis: algorithms and applications," Neural Networks, vol. 13, no. 4/5, pp. 411-430, 2000. https://doi.org/10.1016/S0893-6080(00)00026-5
  3. A. Hyvarinen, "Fast and Robust Fixed-Point Algorithms for Independent Component Analysis," IEEE Trans. On Neural Networks, vol. 10, no. 2, pp. 626-634, May, 1999. https://doi.org/10.1109/72.761722
  4. Pl. Conon, "Independent component analysis, A new concept?," Signal Processing, vol. 36, pp. 287-314, 1994. https://doi.org/10.1016/0165-1684(94)90029-9
  5. J. LeBlanc and P. Leon, "Speech Sepation by Kurtosis Maximization," Proc. ICASSP, vol. 2, pp. 1029-1032, 1998.
  6. A. J. Bell and T. J. Sejnowski, "An information-maximization approach to blind separation and blind deconvolution," Neural Computation, vol. 7, no. 6, pp. 1129-1159, 1995. https://doi.org/10.1162/neco.1995.7.6.1129
  7. H. Saruwatari, K. Sawai, T. Nishikawa, A. Lee, K. Shikano, A. Kaminuma, M. Sakata and D. Saitoh. "Speech Enhancement Based on Blind Source Separation in Car Environments," Proc. 21st International Conference on Data Engineering." pp. 1205, 05-08 April, 2005.
  8. J. Lee, H, Jung, T. Lee and S. Lee, "SPEECH CODING AND NOISE REDUCTION USING ICA-BASED SPEECH FEATURES," International Workshop on independent component analysis and blind signal separation, pp. 417-422, 19-22 June, 2000, Helsinki, Finland.
  9. 김선일, "잡음 섞인 한국어 인식을 위한 ICA 비교 연구," 대한전자공학회 논문지, 제45권, IE-3호, 9 월, 2008.
  10. 김선일, "ICA로 분리한 신호의 분류," 대한전자공학회 논문지, 제47권, IE-4호, 12월, 2010.
  11. 김선일, "음성 및 음성 관련 신호의 주파수 및 Quefrency 영역에서의 자기공분산 변화," 한국해양정보통신종합학술대회논문집, 춘계15권 1호, pp. 340-343, 대구 EXCO, 2011.
  12. Sophocles J. Orfanidis, Introduction To Signal Processing, Prentice Hall Inc., 1996.
  13. R. Johnson, K. Tsui, Statistical Reasoning and Methods, John Wiley & Sons, Inc. 1998.

Cited by

  1. Distribution of the Slopes of Autocovariances of Speech Signals in Frequency Bands vol.17, pp.5, 2013, https://doi.org/10.6109/jkiice.2013.17.5.1076