이중 전송률(2.4/4.0 kbps)을 갖는 개선된 하모닉-CELP 음성부호화기

Improved Harmonic-CELP Speech Coder with Dual Bit-Rates(2.4/4.0 kbps)

  • 김경민 (LG전자 기업통신연구소) ;
  • 윤성완 (연세대학교 전기전자공학과 미디어통신신호처리 연구실) ;
  • 최용수 (연세대학교 정보기술학부) ;
  • 박영철 (연세대학교 전기전자공학과 미디어통신신호처리 연구실) ;
  • 윤대희 (연세대학교 전기전자공학과 미디어통신신호처리 연구실) ;
  • 강태익 (연세대학교 정보기술학부)
  • 발행 : 2003.03.01

초록

본 논문에서는 기존에 제안한 바 있는 EHC(Efficient Harmonic-CELP) 부호화기에 기반한 이중 전송률(2.4/4.0 kbps)의 개선된 하모닉-CELP(Improved Harmonic-CELP: IHC) 음성 부호화기를 제안한다. 제안된 IHC는 유/무성음 판별에 따라 유성음에서는 하모닉 추정, 하모닉 양자화, 하모닉 합성 및 잡음 혼합을 통한 자연성 제어 등의 과정을 통해, 무성음에서는 고속 CELP 방식을 통해 음성신호를 부호화/복호화한다. 또한 제안된 IHC는 EHC의 유/무성음 판별과 하모닉 추정 성능을 개선한다. 피치 이득과 에너지 등을 이용한 유/무성음 판별은 프레임 내의 에너지 변화 등에 의해 재판별된다. 하모닉 부호화에서는 첨점 추출과 델타 조정 방법을 이용하여 정확한 하모닉 추정을 하고, 혼합하는 잡음의 대역과 양을 적절하게 조절하여 자연성을 제어한다. 제안된 IHC 부호화기에 성능평가 결과, 비교 부호화기인 HVXC 연산량의 약 40%이내의 연산량으로 우수한 음질을 보임을 확인하였다.

This paper presents a dual-rate (2.4/4.0 kbps) Improved Harmonic-CELP(IHC) speech coder based on the EHC(Efficient Harmonic-CELP) which was presented by the authors. The proposed IHC employs the harmonic coding for voiced and the CELP for unvoiced segments. In the IHC, an initial voiced/unvoiced estimate is obtained by the pitch gain and energy. Then, the final V/UV mode is decided by using the frame energy contour. A new harmonic estimation combining peak picking and delta adjustment provides a more reliable harmonic estimation than that in the EHC. In addition, a noise mixing scheme in conjunction with an improved band voicing measurement provides the naturalness of the synthesized speech. To demonstrate the performance of the proposed IHC coder, the coder has been implemented and compared with the 2.0/4.0 kbps HVXC(Harmonic excitation Vector Coding) standardized by MPEG-4. Results of subjective evaluation showed that the proposed IHC coder and produce better speech quality than the HVXC, with only 40% complexity of the HVXC.

키워드

참고문헌

  1. IEEE Proc. ICASS Code-Excited Linear Prediction(CELP): High Quality Speech at Very Low Bit Rates M.R.Schroeder;B.S.Atal
  2. IEEE Trans. on Acoust. Speech and Signal Proc. v.36 no.8 Multi-Band Excitation Vocoder D.W.Griffin;J.S.Lim
  3. Speech Coding and Synthesis W.B.Kleijin;K.K.Paliwal
  4. IEEE Trans on Acoust. Speech and Signal Proc. v.3 no.4 A Mixed Excitation LPC Vocoder Model for Low Bit Rate Speech Coding A.V.McCree;T.P.Barnwell Ⅲ
  5. ISO/IEC FCD 0.1 Subpart 2 Information Technology Very Low Bit Rate Audio-Visual Coding
  6. Proc. of ICSLP 2000Ⅱ v.II Efficient Harmonic-CELP Based Hybrid Coding of Speech at Low-Bit Rate Y.S.Choi;S.K.Ryu;Y.C.Park;D.H.Youn
  7. Proc. of ICASSP 2000 A 4kb/s Hybrid MELP/CELP Coder with Alignment Phase Encoding and Zero Phase Equalization T.Wang;K.Koishida;V.Cuperman;A.Gersho
  8. 한국음향학회지 v.20 no.5 효율적인 하모닉-CELP 구조를 갖는 저 전송률 음성부호화기 최용수;김경민;윤대희
  9. IEE Electronic Letters v.33 no.6 Fast Vector-Sum Codebook Search Method for Low Bit Rate Speech Coding Y.S.Choi;S.W.Park;D.H.Youn
  10. IEEE Trans. on Acoust. Speech and Signal Proc. v.29 no.4 The Spectral Envelope Estimaton Vocoder Douglas B.Paul
  11. Proc. of Euros speech 2001 v.2 Fast Harmonic Estimation Using a Low Resolution Pitch for Low Bit Rate Harmonic Coding Y.S.Choi;D.H.Youn
  12. Proposed TIA/EIA/PN-3292 Standard-Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital Systems, Official Ballot Version