다채널 오디오 코딩을 위한 MPEG Surround-1부: 기본 구조

MPEG Surround for Multi-Channel Audio Coding-Part 1: Basic Structure

  • 발행 : 2009.10.31

초록

최근 국제 표준으로 등록된 MPEG의 다채널 오디오 코딩 기술인 MPEG Surround에 대해 소개한다. 이 오디오 표준은 멀티채널 신호를 다운믹스하여 모노나 스테레오 신호를 생성하고 동시에 공간 파라미터를 추출하는 방법을 이용하여 부호화 과정을 수행한다. 복호화 과정에서는 다운믹스 신호와 공간 파라미터들을 사용하여 다채널 신호를 생성하는데, 다운믹스 신호는 AAC나 MP3등 일반 오디오 코딩 방법에 의해 부호화하며 공간 파라미터들도 매우 낮은 정보량을 사용하기 때문에 전체적으로 매우 적은 비트율을 사용하여 고음질의 신호를 생성할 수 있다는 장점이 있다. 또한, 공간 파라미터들을 무시할 경우 휴대용 오디오 재생 기기에서 다운믹스 신호를 재생할 수 있으므로 기존 코딩 방법에 대해 역방향 호환성을 가진다. 본 논문의 1부에서는 MPEG Surround의 기본 구조에 대해 소개하고, 이어지는 2부에서는 헤드폰이나 이어폰을 이용하여 가상의 5.1 채널을 지원하는 바이노럴 모드를 포함해 다양한 모드와 툴들에 대해 소개한다. 여러 회사와 기관들에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

An overview of the recently finalized multi-channel audio coding standard MPEG Surround is provided. This audio coding standard downmixes multi-channel signals to mono or stereo signals and, simultaneously, extracts spatial parameters for its encoding process. In its decoding process, it reconstructs multi-channel signals based on the downmix signals and spatial parameters. Since the downmix signals are coded in conventional audio coding format such as AAC and MP3 and the spatial parameters require a small amount of information MPEG Surround guarantees high sound quality multi-channel audio at low bit rates. Besides, it is backward-compatible to conventional audio coding techniques because the downmix signals can be played on portable audio devices ignoring the spatial parameter information. In this paper, Part 1 presents an overview of the basic structure of MPEG Surround and Part 2 describes various modes and tools including the binaural mode which supports the virtual 5.1-channel playback via headphones or earphones. The listening test results by various companies and organizations are also presented.

키워드

참고문헌

  1. M. Bosi, "High-quality multichannel audio coding: trends and challenges," J. Audio Eng. Soc., vol. 48, no. 6, pp. 588-595, 2000
  2. Dolby Prologic II, http://www.dolby.com/consumer/technology/prologic_II.html, 2009
  3. Logic 7, http://www.lexicon.com/logic7/, 2009
  4. ISO/IEC 14496-3: 2005, Information technology - Coding of audio-visual objects - Part 3: Audio, 2005
  5. F. Baumgarte and C. Faller, "Binaural cue coding-part I: psychoacoustic fundamentals and design principles," IEEE Trans. Speech Audio Process., vol. 11, no. 6, pp. 509-519, 2003 https://doi.org/10.1109/TSA.2003.818109
  6. C. Faller and F. Baumgarte, "Binaural cue coding-part ll: schemes and applications," IEEE Trans. Speech Audio Process., vol. 11, no. 6, pp. 520-531, 2003 https://doi.org/10.1109/TSA.2003.818108
  7. ISO/IEC JTC 1/SC 29/WG 11, Investigation on Spatial Audio Coding, N6023, Oct. 2003
  8. ISO/IEC JTC 1/SC 29/WG 11, Call for Information on Spatial Audio Coding, N6150, Dec. 2003
  9. ISO/IEC JTC 1/SC 29/WG 11, Call for Proposals on Spatial Audio Coding, N6455, Mar. 2004
  10. ISO/IEC JTC 1/SC 29/WG 11, Report on Spatial Audio Coding RM0 Selection Tests, N6813, Oct. 2004
  11. ISO/IEC JTC 1/SC 29/WG 11, Text of Working Draft for Spatial Audio Coding, N7136, Apr. 2005
  12. ISO/IEC 23003-1, Information technology - MPEG audio tech-nologies - Part I: MPEG Surround, 2007
  13. S. Quackenbush and J. Herre, “MPEG Surround,” IEEE Multi-media, vol. 12, no. 4, pp. 18-23, 2005 https://doi.org/10.1109/MMUL.2005.76
  14. J. Hilpert and S. Disch, “The MPEG Surround audio coding standard,” IEEE Signal Proc. Mag., vol. 26, no. 1. pp. 148-152, 2009 https://doi.org/10.1109/MSP.2008.930433
  15. J. Breebaart, G. Hotho, K. Koppens, E. Schuijers, W. Oomen, and S. van der Par, “Background, concept, and architecture for the recent MPEG Surround standard on multichannel audio compression,” Audio Eng, Soc., vol. 55, no. 5, pp. 331-352, 2007
  16. J. Herre, K. Kjorling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. Roden, W. Oomen, K. Linzmeier, and K. S. Chong, “MPEG Surround - the ISO/MPEG stanrdard for efficient and compatible multichannel audio coding,” J. Audio Eng. Soc., vol. 56. no. 11, pp. 932-955, 2008
  17. C. Hotho, L. F. Villemoes, and J. Breebaart, "A backward-compatible multichannel audio codec," IEEE Trans. Audio, Speech, Lang. Process., vol. 16, no. 1, pp. 83-93, 2008 https://doi.org/10.1109/TASL.2007.910768
  18. ISO/IEC JTC 1/SC 29/WG 11, ISO/IEC 23003-1:2007/FDAM 2, MPEG Surround Reference Software, N9635, Jan. 2008
  19. E. Zwicker and H. Fastl, Psychoacoustics: Facts and Models, Springer, Berlin, 1999
  20. ISO/IEC JTC 1/SC 29/WG 11, Performance of MPEG Surround Technology, N7950, Jan. 2006
  21. ISO/IEC JTC 1/SC 29/WG 11, Report on MPEG Surround Veri-fication Test, N8851, Jan. 2007
  22. ITU-R BS 1534-1, Method for the Subjective Assessment of Intermediate Quality Levels of Coding Systems, 2003
  23. MP3 Surround, http://www.mp3surround.com, 2009