A Preprocessing Approach to Improving the Quality of the Music Produced by the EVRC

EVRC 코덱으로 재생하는 음악의 품질을 개선하기 위한 전처리 기법

  • 남영한 (와이더덴닷컴(주) 기술연구소) ;
  • 하태균 (와이더덴닷컴(주) 기술연구소) ;
  • 전윤호 (와이더덴닷컴(주) 기술연구소) ;
  • 김재수 (와이더덴닷컴(주) 기술연구소) ;
  • 박섭형 (한림대학교 정보통신공학부)
  • Published : 2003.05.01

Abstract

This paper proposers a preprocessing approach to improving the quality of the music produced by the EVRC(enhanced variable rate codec) which is one of the CDMA(Code Division Multiple Access) voice codecs. Since the EVRC is optimized only for speech signals, it can deteriorate the quality of the music passed through it. One of the problems with the EVRC-coded music is time-clipping, which usually occurs when subsequent frames are encoded at Rate l/8. Since the EVRC determines the bit rate for an input frame based on the long-term prediction gain, we increase the long-term prediction gain in order for the most of the frames to be encoded at Rate 1 or Rate 1/2. Experimental results show that the approach works well on music signals and the number of time-clipped frames is considerably reduced.

이 논문에서는 CDMA(Code Division Multiple Access) 음성 압축 표준의 하나인 EVRC(enhanced variable rate codec) 코덱으로 재생되는 음악의 품질을 개선하기 위한 전처리 알고리듬을 제안한다. EVRC는 음성을 압축하는 목적으로 최적화되었기 때문에, 음악을 압축하여 전송하면 품질을 심하게 저하시키기도 한다. EVRC로 음악을 압축할 때 발생하는 품질 저하 현상들 중에서 가장 심한 것의 하나가 끊김 현상인데, 끊김 현상은 프레임들이 연속적으로 Rate 1/8로 전송될 때 발생한다. EVRC는 장기 예측 이득의 크기를 바탕으로 입력 프레임들의 전송률을 결정하므로, 장기 예측 이득을 증가시켜 대부분의 프레임이 Rate 1 혹은 Rate 1/2로 압축될 수 있도록 하였다. 실험 결과를 보면 이러한 전처리 방법은 음악 신호에 대해 잘 적용되며 끊김 현상이 발생하는 프레임의 개수가 상당히 줄어들었음을 확인할 수 있다.

Keywords

References

  1. Proceedings of the IEEE v.82 no.10 Speech coding: a tutorial review Andreas Spanias
  2. IEEE Communications Magazine Recent advances in cellular wireless commnunications M.Zeng;A.Annamalai;V.K.Bhargava
  3. Proc. of International Conference on Acoustics, Speech, and Signal Processing(ICASSP `98) v.1 A Two Stage Hybrid Embedded Speech/Audio Coding Structure Sean,A.Ramprashad
  4. 3rd Generation Partnership Project 2, 3GPP2 C.S0030-0 Version 2.0 Selectable Mode Vocoder Service Option for Wideband Spread Spectrum Communication Systems
  5. IS-127 Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital System TR45
  6. Digital Signal Processing in Communication Systems Frerking
  7. Digital Speech - Coding for Low Bit Rate Communication System A.M.Kondoz
  8. ITU-T Recommendation P.830 Subjective Performance Assessment of Telephone-Band And Wideband Digital Codecs
  9. ITU-T Recommendation P.800 Methods for Subjective Determination of Transmission Quality