DOI QR코드

DOI QR Code

An Optimized Hardware Design for High Performance Residual Data Decoder

고성능 잔여 데이터 복호기를 위한 최적화된 하드웨어 설계

  • Jung, Hong-Kyun (Dept. of Information and Communication Engineering, Hanbat National University) ;
  • Ryoo, Kwang-Ki (Dept. of Information and Communication Engineering, Hanbat National University)
  • 정홍균 (한밭대학교 정보통신공학과) ;
  • 류광기 (한밭대학교 정보통신공학과)
  • Received : 2012.05.09
  • Accepted : 2012.11.08
  • Published : 2012.11.30

Abstract

In this paper, an optimized residual data decoder architecture is proposed to improve the performance in H.264/AVC. The proposed architecture is an integrated architecture that combined parallel inverse transform architecture and parallel inverse quantization architecture with common operation units applied new inverse quantization equations. The equations without division operation can reduce execution time and quantity of operation for inverse quantization process. The common operation unit uses multiplier and left shifter for the equations. The inverse quantization architecture with four common operation units can reduce execution cycle of inverse quantization to one cycle. The inverse transform architecture consists of eight inverse transform operation units. Therefore, the architecture can reduce the execution cycle of inverse transform to one cycle. Because inverse quantization operation and inverse transform operation are concurrency, the execution cycle of inverse transform and inverse quantization operation for one $4{\times}4$ block is one cycle. The proposed architecture is synthesized using Magnachip 0.18um CMOS technology. The gate count and the critical path delay of the architecture are 21.9k and 5.5ns, respectively. The throughput of the architecture can achieve 2.89Gpixels/sec at the maximum clock frequency of 181MHz. As the result of measuring the performance of the proposed architecture using the extracted data from JM 9.4, the execution cycle of the proposed architecture is about 88.5% less than that of the existing designs.

본 논문에서는 H.264/AVC의 고성능 잔여 데이터 복호기를 위해 최적화된 하드웨어 구조를 제안한다. 제안하는 하드웨어 구조는 새로운 역영자화 수식들을 적용한 공통 연산기를 갖는 병렬 역양자화기와 병렬 역변환기를 통합한 하드웨어 구조이다. 새로운 역양자화 수식들은 기존 수식에서 나눗셈 연산을 제거하여 연산량 및 처리시간을 감소시키고 새로운 수식들을 처리하기 위해 곱셈기와 왼쪽 쉬프터로 구성된 하나의 공통 연산기를 사용한다. 역양자화기는 4개의 공통 연산기를 병렬처리하기 때문에 $4{\times}4$ 블록의 역양자화 수행 사이클 수를 1 사이클로 감소시키고, 제안하는 역변환기는 8개의 역변환 연산기를 사용하여 $4{\times}4$ 블록의 역변환 수행 사이클 수를 1 사이클로 감소시킨다. 또한 제안하는 구조는 역양자화 연산과 역변환 연산을 동시에 수행하기 때문에 하나의 $4{\times}4$ 블록을 처리하는 데 1 사이클이 소요되어 수행 사이클 수가 감소한다. 제안하는 구조를 Magnachip 0.18um CMOS 공정 라이브러리를 이용하여 합성한 결과 게이트 수는 21.9k, critical path delay는 5.5ns이고, 최대 동작 주파수는 181MHz이다. 최대 동작 주파수에서 제안하는 구조의 throughput은 2.89Gpixels/sec이다. 표준 참조 소프트웨어 JM 9.4에서 추출한 데이터를 이용하여 성능을 측정한 결과 제안하는 구조의 수행 사이클 수가 기존 구조들 대비 88.5% 이상 향상되었다.

Keywords

References

  1. I. E. Richardson, The H.264 Advanced Video Compression Standard : Second Edition, Wiley, pp. 81-98, 2010.
  2. Y. L. Lin, et al., VLSI Design for Video Coding, Springer, pp. 1-9, 2011.
  3. T. Wiegand, et al., "Overview of the H.264/AVC Video Coding Standard", IEEE Transactions on Circuits and Systems for Video Technology, Vol. 13, pp. 560-576, 2003. https://doi.org/10.1109/TCSVT.2003.815165
  4. W. Hwangbo, et al., "A High-Performance 2-D Inverse Transform Architecture for the H.264/AVC Decoder", Proc. of IEEE International Symposium on Circuits and Systems 2007, pp. 1613-1616, 2007.
  5. R. Husemann, et al., "New Integrated Architecture for H.264 Transform and Quantization Hardware Implementation", Proc. of 53rd IEEE International Midwest Symposium on Circuits and Systems, pp. 379-382, 2010.
  6. K. Xu, et al., "Low-Power Bitstream -Residual Decoder for H.264/AVC Baseline Profile Decoding", EURASIP Journal on Embedded Systems, vol. 2009, pp. 1-17, 2009.
  7. X. R. Hu, et al., "A High Performance Parallel Transform and Quantization Architecture for H.264 Decoder", Proc. of International Conference on Communications, Circuits and Systems 2009, pp. 1059-1060, 2009.
  8. Y. C. Chao, et al., "Combined CAVLC Decoder, Inverse Quantizer, and Transform Kernel in Compact H.264/AVC Decoder", IEEE Transactions on Circuits and systems for Video Technology, Vol. 19, No. 1, pp. 53-62, 2009 https://doi.org/10.1109/TCSVT.2008.2009251
  9. A. B. Atitallah, et al., "HW/SW TQ/IQT Design for H.264/AVC", Proc. of 18th IEEE International Conference on Electronics, Circuits and Systems, pp. 13-16, 2011.
  10. K. H. Chen et al., "An efficient direct 2-D transform coding IP design for MPEG-4 AVC/H.264," Proc. of IEEE International Symposium on Circuits and Systems 2005, pp. 4517-4520, 2005.