채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화

DOI QR코드

DOI QR Code

김현휘;김인철
Kim, Hyun-Hwi;Kim, Rin-Chul

  • 투고 : 2015.09.04
  • 심사 : 2016.05.23
  • 발행 : 2016.05.30

초록

본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.

키워드

MPEG Surround(MPS);Unified speech and audio coding(USAC);Inter-channel phase difference(IPD);Overall phase difference(OPD)

참고문헌

  1. ISO/IEC 23003-1 : Information technology - MPEG audio technologies -Part 1 : MPEG Surround, 2006.
  2. ISO/IEC 23003-3 : Information technology - MPEG audio technologies -Part 3 : Unified speech and audio coding, 2011.
  3. C. Faller and F. Baumgarte, “Binaural cue coding –part I : psychoacoustic fundamentals and design principles,” IEEE Trans. On Speech and Audio Proc., vol. 11, no. 6, pp. 509-519, 2003. https://doi.org/10.1109/TSA.2003.818109
  4. J. Breebaart, G. Hotho, J. Koppens, E. Schuijers, W. Oomen, and S. van de Par, “Background, concept, and architecture for recent MPEG surround standard on multichannel audio compression,” J. Audio Eng. Soc. Vol. 55, no. 5, pp. 331-351, 2007.
  5. J. Kim, E. Oh, and J. Robilliard, "Enhanced stereo coding with phase parameters for MPEG unified speech and audio coding," AES 127th Convention, paper no. 7875, 2009.
  6. J. Breebaart, S. van de Par, A. Kohlrausch, and E. Schuijers, “Parametric coding of stereo audio,” EURASIP J. Appl. Signal Process., vol. 9, pp. 1305-1322, 2004.
  7. B. Rakerd and W. Hartmann, “Localization of sound in room. V. Binaural coherence and human sensitivity to interaural time differences in noise,” J. Acoust. Soc. Am. Vol. 128, no. 5, pp. 3052-3063, 2010. https://doi.org/10.1121/1.3493447
  8. McFadden D., Jeffress L. A., and Lakey J. R, “Differences in interaural phase and level in detection and lateralization : 1000 and 2000 Hz,” J. Acoust. Soc. Am. 52, 1197-1206, 1972. https://doi.org/10.1121/1.1913232
  9. ITU-R BS.1534-1, Method for the subjective assessment of intermediate sound quality(MUSHRA), 2011.