DOI QR코드

DOI QR Code

Optimizing Shared Memory Accesses for GPGPU Computations

GPGPU를 위한 공유 메모리 최적화

  • Tran, Nhat-Phuong (Dept. of Compute Science and Engineering, Myongji University) ;
  • Lee, Myungho (Dept. of Compute Science and Engineering, Myongji University) ;
  • Hong, Sugwon (Dept. of Compute Science and Engineering, Myongji University)
  • Published : 2012.11.22

Abstract

Recently, a lot of general-purpose application programs in addition to graphic applications have been parallelized for boosting their performance using Graphic Processing Unit (GPU)'s excellent floating-point performance. In order to maximize the application performance on GPUs, optimizing the memory hierarchy and the on-chip caches such as the shared memory is essential. In this paper, we propose techniques to optimize the shared memory, and verify its effectiveness using a pattern matching application program.

최근 GPU 의 뛰어난 부동 소수점 연산 능력을 활용하여 그래픽 이외에 다양한 응용 프로그램들의 병렬화 및 성능최적화가 활발하게 이루어지고 있다. 이러한 GPU 의 성능을 극대화하기 위해서는 메모리 계층구조 및 shared memory 를 비롯한 on-chip 메모리의 사용을 최적화하는 것이 필수적이다. 본 논문에서는 이러한 shared memory 의 사용을 최적화하기 위한 기법들을 제안하고, 이를 패턴 매칭 응용 프로그램에 적용하여 효용성을 검증한다.

Keywords