A Design of Memory-efficient 2k/8k FFT/IFFT Processor using R4SDF/R4SDC Hybrid Structure

R4SDF/R4SDC Hybrid 구조를 이용한 메모리 효율적인 2k/8k FFT/IFFT 프로세서 설계

  • Published : 2004.04.01

Abstract

This paper describes a design of 8192/2048-point FFT/IFFT processor (CFFT8k2k), which performs multi-carrier modulation/demodulation in OFDM-based DVB-T receiver. Since a large size FFT requires a large buffer memory, two design techniques are considered to achieve memory-efficient implementation of 8192-point FFT/IFFT. A hybrid structure, which is composed of radix-4 single-path delay feedback (R4SDF) and radix-4 single-path delay commutator (R4SDC), reduces its memory by 20% compared to R4SDC structure. In addition, a memory reduction of about 24% is achieved by a novel two-step convergent block floating-point scaling. As a result, it requires only 57% of memory used in conventional design, reducing chip area and power consumption. The CFFT8k2k core is designed in Verilog-HDL, and has about 102,000 Bates, RAM of 292k bits, and ROM of 39k bits. Using gate-level netlist with SDF which is synthesized using a $0.25-{\um}m$ CMOS library, timing simulation show that it can safely operate with 50-MHz clock at 2.5-V supply, resulting that a 8192-point FFT/IFFT can be computed every 164-${\mu}\textrm{s}$. The functionality of the core is fully verified by FPGA implementation, and the average SQNR of 60-㏈ is achieved.

OFDM 방식의 DVB-T 수신기에서 다수 반송파의 변ㆍ복조를 수행하는 8192점/2048점 FFT/IFFT 프로세서 (CFFT8k2k)를 설계하였다. 8192점 FFT와 같이 변환 크기가 큰 경우에는 매우 큰 용량의 메모리가 필요하므로, 메모리 효율적인 설계가 중요하다. 본 논문에서는 R4SDC (Radix-4 Single-path Delay Commutator)와 R4SDF (Radix-4 Single-path Delay Feedback)를 혼합한 Hybrid 구조를 적용함으로써 R4SDC 단일 구조에 비해 약 20%의 메모리를 줄였으며, 2단계 수렴 블록 부동점 스케일링 기법을 적용함으로써 기존의 CBFP 방식에비해 약 24%의 메모리를 감소시켰다. 이와 같은 메모리 효율적인 설계를 통해, 기존 방식의 약 57%의 메모리만으로 구현되었으며, 칩 면적과 전력소모가 크게 감소되었다. CFFT8k2k 코어는 Verilog-HDL로 설계되었으며, 102,000여 개의 게이트, 292k 비트의 RAM, 그리고 39k 비트의 ROM으로 구현되었다. $0.25-{\um}m$ CMOS라이브러리로 합성된 게이트 레벨 netlst와 SDF를 이용한 타이밍 시뮬레이션 결과, 2.5-V 전원전압에서 50-MHz로 안전하게 동작함을 확인하였으며, 8192점 FFT/IFFT 연산에 164-${\mu}\textrm{s}$가 소요되어 DVB-T 사양을 만족하는 것으로 평가되었다. 설계된 CFFT8k2k 코어는 FPGA로 구현하여 정상 동작함을 확인하였으며, 8192점 FFT의 평균 SQNR은 약 60-㏈로 분석되었다.

Keywords

References

  1. 조용수, 무선 멀티미디어 통신을 위한 OFDM 기초, 대영사, 2001
  2. T. de Couasnon, R. Monnier, and J.B. Rault, 'OFDM for digital TV broadcasting', Signal Processing, vol. 39, pp. 1-39, Jan., 1994 https://doi.org/10.1016/0165-1684(94)90120-1
  3. IEEE 802.11a/D7.0, 'Wireless LAN Medium Access Control (MAC) and Physical Layer (PHY) specifications: High speed physical layer in the 5GHz band', ISO/IEC8802-11:1999/Amd 1:2000(E), 1999
  4. 'Digital Video Broadcasting (DVB); Framing structure, channel coding and modulation for digital terrestrial television', ETSIEN 300 744 V1.2.1, 1999
  5. E. Bidet, C. Joanblanq, and P. Senn, 'A fast single chip implementation of 8192 complex points FFT', IEEE 1994 Custom Integrated Circuits Conference, pp. 207-210, 1994
  6. E.O. Brigham, The Fast Fourier Transform and Its Application, Prentice Hall, 1998
  7. P. Duhamel and H. Hollman, 'Split radix FFT algorithm', Electronic Lett, vol. 20, no. 1, pp. 14-16, Jan., 1984 https://doi.org/10.1049/el:19840012
  8. L. Jia, Y. Gao, J. Isoaho and H. Tenhunen, 'A new VLSI-oriented FFT algorithm and implementation', Proceedings of 1998 IEEE International ASIC Conference, pp. 337-341, 1998
  9. S. He and M. Torkelson, 'Design and implementation of a 1024-point pipelined FFT processor', IEEE 1998 Custom Integrated Circuits Conference, pp. 131-134, 1998