A Study on the Technique of Spectrum Flattening for Improved Pitch Detection

개선된 피치검출을 위한 스펙트럼 평탄화 기법에 관한 연구

  • 강은영 (숭실대학교 정보통신공학과 대학원) ;
  • 배명진 (숭실대학교 정보통신공학과 대학원) ;
  • 민소연 (숭실대학교 전자공학과 대학원)
  • Published : 2002.04.01

Abstract

The exact pitch (fundamental frequency) extraction is important in speech signal processing like speech recognition, speech analysis and synthesis. However the exact pitch extraction from speech signal is very difficult due to the effect of formant and transitional amplitude. So in this paper, the pitch is detected after the elimination of formant ingredients by flattening the spectrum in frequency region. The effect of the transition and change of phoneme is low in frequency region. In this paper we proposed the new flattening method of log spectrum and the performance was compared with LPC method and Cepstrum method. The results show the proposed method is better than conventional method.

음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하다. 그러나 포만트의 영향과 천이진폭의 영향 때문에 음성신호로부터 정확한 피치검출은 매우 어렵다. 따라서 본 논문에서는 음소의 천이나 변동의 영향이 적은 주파수 영역에서 스펙트럼을 평탄화함으로써 포만트의 영향을 제거한 후 피치를 검출한다. 본 논문에서는 새로운 스펙트럼 평탄화 기법을 제안하고 기존의 방법인 LPC법, 켐스트럼법과 비교하여 어느 정도의 우수성을 보이는지 평가하였다. 또한 각각의 방법을 적용하여 기본주파수 (피치)를 검출한 결과는 제안한 방법이 우수함을 보여주고 있다.

Keywords

References

  1. Digital Processing of Speech signals L.R. Rabiner;R.W. Schafer
  2. J. Acoust. Soc. Am. v.41 Cepstrum pitch determination A.M. Noll https://doi.org/10.1121/1.1910339
  3. IEEE Trans. Acoust. Speech, and Signal Processing v.ASSP-26 Real time harmonic pitch detection S. Seneff
  4. Linear Prediction of Speech J.D. Marckel;A.H. Gray Jr
  5. J. Acoust. Soc. Amer v.43 Performance characteristics of an experimental harmonic identification pitch extraction(HIPEX) systems R.L. Miller
  6. KIEE, Korea v.22 no.2 The high speed pitch extrction of speech signals using the area comparison ethod M. Lee;C. Park;M. Bae;S. Ann
  7. KIEE, Korea v.24 no.3 A study on energy using G-peak from the speech production model M. Bae;J. Rheem;S. Ann
  8. J. Acoust., Soc., Am v.5 no.5 Determination of the instant of glottal closure from the speech wave Hans Werner Strube
  9. KIEE, Korea v.24 no.2 The extraction of nasal sound using G-peak in continued speech M. Bae;I. Chung;S. Ann