DOI QR코드

DOI QR Code

분석/합성 구조의 저 전송률 변환여기 광대역 음성/오디오 부호화기 설계

Design of Low Bits Rate Transform Excitation Wide Band Speech and Audio Coder of Analysis-by-Synthesis Structure

  • 장성훈 (충북대학교 전파통신 공학과) ;
  • 홍기봉 (충북대학교 전파통신 공학과) ;
  • 이인성 (충북대학교 전파통신 공학과)
  • Jang, Sunghoon (Department of Radio Communication Eng. Chungbuk National University) ;
  • Hong, Kibong (Department of Radio Communication Eng. Chungbuk National University) ;
  • Lee, Insung (Department of Radio Communication Eng. Chungbuk National University)
  • 투고 : 2012.05.07
  • 심사 : 2012.07.27
  • 발행 : 2012.10.31

초록

본 논문은 음성과 오디오의 혼합 콘텐츠를 대상으로 하는 9.2 kbps 저 전송률 변환여기 부호화기 설계를 목표로 한다. 저 전송률 환경을 위하여 주파수 영역 신호의 중요도에 따른 Band-Selection 방법과 Gain-Shape 양자화를 이용한 Analysis by Synthesis(AbS) 구조를 이용한다. AbS 구조를 이용하는 과정에서 발생하게 되는 연산량을 감소시키기 위하여 밴드별 IDFT를 취하고 합성하는 방법을 이용한다. 전송 되지 않는 구간에 대하여 Comfort Noise를 삽입함으로써 음질 저하 없이 설계한다. 기존의 TCX모드와 비교하여 저 전송률에서 성능의 저하 없는 부호화기를 제안한다.

This paper is aimed to design 9.2 kbps low bits late transform excitation coder that target to voice and audio signal. To set up low bit rate, we used Band-selection in frequency domain and gain-shape quantization and AbS structure. To decrease lots of calculation from ABS structure, we used each band IDFT and synthesis. And we designed non-transfer band for performance by inserting comfort noise. We propose coder that has low bit rate and similar performance comparing with original 10.4 kbps AMR-WB+ TCX mode.

키워드

참고문헌

  1. A. Spanias, "Speech Coding: A Tutorial Review", Proc. IEEE, vol. 82, no. 10, pp. 1541-1582, 1994. https://doi.org/10.1109/5.326413
  2. Kondoz A.M, "Digital Speech: Coding for Low Bit Rate Communication Systems, 2nd Ed.", John Wiley & Sons, New Jersey, 2004.
  3. T. Painter, A. Spanias, "Perceptual Coding of Digital Audio", Proc. IEEE, vol. 88,no. 4, pp. 451-515 , 2000. https://doi.org/10.1109/5.842996
  4. J. Schnitzler, P. Vary, "Signal Processing: Trends and perspectives in wideband speech coding", Elsevier, vol. 80,no. 11, pp. 2267-2281. 2000. https://doi.org/10.1016/S0165-1684(00)00116-X
  5. 이태진, 강경옥, 김환우, "MPEG 오디오 최신 표준: USAC 기술", 방송공학회논문지, 16권, 5호, pp. 693- 704, 2011.
  6. Jari Makinen, Bruno Bessette, Stefan Bruhn, Pasi Ojala, Redwan Salami, Aniswse Taleb, "AMR-WB+: A NEW AUDIO CODING STANDARD FOR 3RD GENERATION MOBILE AUDIO SERVICES", Proc. of ICASSP, pp.1109-1112, March. 2005.
  7. 3GPP TS 26.290, Extended Adaptive Multi-Rate- Wideband(AMR-WB+) codec: Transcoding functions, V9.0.0, 2009.
  8. ISO/IEC 14496-3:2005/FPDAM9, Enhanced Low Delay AAC, Apr 2007.
  9. 3GPP TS 26.304, ANSI-C code for the floating point Extended AMR Wideband codec, V9.0.0, 2009.
  10. ITU-R BS.1534, Method for the Subjective Assessment of Intermediate Sound Quality (MUSHRA), 2001.
  11. ITU-R BS.1534, ITU-T Software Tool Library 2009 User's Manual, pp. 229-264, November 2009.

피인용 문헌

  1. Frequency Band Selection Exited Linear Prediction Wideband Speech/Audio Coding Using SBR vol.32, pp.6, 2013, https://doi.org/10.7776/ASK.2013.32.6.556