Reconfigurable Architecture Design for H.264 Motion Estimation and 3D Graphics Rendering of Mobile Applications

이동통신 단말기를 위한 재구성 가능한 구조의 H.264 인코더의 움직임 추정기와 3차원 그래픽 렌더링 가속기 설계

  • 박정애 (한양대학교 전자전기제어계측공학과) ;
  • 윤미선 (한양대학교 전자전기제어계측공학과) ;
  • 신현철 (한양대학교 전자컴퓨터공학부)
  • Published : 2007.02.25

Abstract

Mobile communication devices such as PDAs, cellular phones, etc., need to perform several kinds of computation-intensive functions including H.264 encoding/decoding and 3D graphics processing. In this paper, new reconfigurable architecture is described, which can perform either motion estimation for H.264 or rendering for 3D graphics. The proposed motion estimation techniques use new efficient SAD computation ordering, DAU, and FDVS algorithms. The new approach can reduce the computation by 70% on the average than that of JM 8.2, without affecting the quality. In 3D rendering, midline traversal algorithm is used for parallel processing to increase throughput. Memories are partitioned into 8 blocks so that 2.4Mbits (47%) of memory is shared and selective power shutdown is possible during motion estimation and 3D graphics rendering. Processing elements are also shared to further reduce the chip area by 7%.

휴대용 단말기에서의 동영상 및 3차원 영상을 처리하는 것이 일반화되면서, H.264 및 3차원 그래픽 가속기 데이타를 처리하기 위한 연산량이 크게 증가하고 있다. 본 연구에서는 H.264 인코더의 움직임 추정기 및 디코더의 움직임 보상기와 3차원 그래픽 렌더링 가속기를 재구성 가능하도록 설계하였다. 움직임 추정기는 효율적인 데이타 스캐닝 방법과 DAU, FDVS 알고리즘을 사용하여, JM8.2에 제시된 다중 프레임 움직임 추정보다 연산량을 평균적으로 70% 이상 감소시키면서 화질 열화가 없도록 하였다. 3차원 그래픽 렌더링 가속기는 중심선 트래버셜 알고리즘을 사용하여 병렬 처리하도록 함으로써 처리량을 증가시켰다. 움직임 추정기와 3차원 렌더링 가속기의 메모리를 재구성 가능한 구조로 설계하여, 2.4Mbits (47%)의 메모리를 공유하였으며, 메모리를 8개의 블록으로 분산시켜 사용되지 않는 부분의 전력 소모를 최소화 할 수 있도록 하였다. 또한, 움직임 보상기와 3차원 렌더링 가속기의 픽셀 프로세서를 공유하여 약 7%의 하드웨어면적을 감소 시켰다.

Keywords

References

  1. I. Richardson, 'H.264 and MPEG-4 Video Compression Video Coding for Next-generation Multimedia,' John Wiley & Sons, 2003
  2. http://www.kumnong.co.kr/
  3. Viet L. Do, Kenneth Y. Yun, 'A Low-Power VLSI Architecture for Full-Search Block-Matching Motion Estimation,' IEEE Trans on Circuits and Systems for Video Technology, Vol.8, No.4, pp.393-398, Aug. 1998 https://doi.org/10.1109/76.709406
  4. M. Chen, Y. Chiang, H. Li, M. Chi, 'Efficient multi-frame motion estimation algorithms for MPEG-4 AVC/JVT/H.264,' Circuits and Systems, 2004. ISCAS '04. Proceedings of the 2004 International Symposium on Vol.3, pp. 737-740, May 2004
  5. T. Akenine-Moller, E. Haines, 'Real-Time Rendering 2nd Edition,' AK Peters, 2002
  6. C. Yoon, R. Woo, J. Kook, S. Lee, K. Lee, and H. Yoo, 'An 80/20-MHz 160-mW Multimedia Processor Integrated With Embedded DRAM, MPEG-4 Accelerator, and 3-D Rendering Engine for Mobile Applications,' IEEE Journal of Solid-State Circuits. Vol.36. Nov. 2001
  7. S. Yeow Yap, J. V.McCanny, 'A VLSI Architecture for Variable Bloack Size Video Motion Estiamtion,' IEEE Trans on Ciruits and Systems, Vol.51, No.7, pp.384-389, Jul 2004 https://doi.org/10.1109/TCSII.2004.829555