Efficient Schemes for Scaling Ring Bandwidth in Ring-based Multiprocessor System

링 구조 다중프로세서 시스템에서 링 대역폭 확장을 위한 효율적인 방안

  • 장병순 (서울대학교 컴퓨터공학과) ;
  • 정성우 (서울대학교 컴퓨터공학과) ;
  • 장성태 (수원대학교 전자계산학과) ;
  • 전주식 (서울대학교 컴퓨터공학과)
  • Published : 2000.02.15

Abstract

In the past several years, many systems which adopted ring topology with high-speed unidirectional point-to-point links have emerged to overcome the limit of bus for interconnection network of clustered multiprocessor system. However, rapid increase of processor speed and performance improvement of local bus and memory system limit scalability of system with point-to-point link of standard bandwidth. Therefore, necessity to extend bandwidth is emphasized. In this paper, we adopt PANDA system as base model, which is clustering-based multiprocessor system. By simulating a model adopting commercial processor and local bus specification, we show that point-to-point link is bottleneck of system performance, and bandwidth expansion by more than 200% is needed. To expand bandwidth of interconnection network, it needs excessive design cost and time to develop new point-to-point link with doubled bandwidth. As an alternative to double bandwidth, we propose several ways to implement dual ring -simple dual ring, transaction-separated dual ring, direction-separated dual ring- by using off-the-shelf point-to-point links with IEEE standard bandwidth. We analyze pros. and cons. of each model compared with doubled-bandwidth single ring by simulation.

최근 몇 년간 클리스터링 기반 다중 프로세서 시스템에서의 상호 연결망으로서의 버스의 제약을 극복하기 위한 단방향 지점간 링크를 이용한 링 구조가 제안되었다. 하지만 계속되는 프로세서의 고속화와 지역 버스 및 메모리의 고성능화로 인해 지점간 링크의 현재 표준 대역폭으로는 시스템 확장성에 한계를 보이며 이에 따라 대역폭 확장에 대한 연구가 필요하다. 본 논문에서는 클리스터링 기반 다중프로세서 시스템으로 개발된 PANDA 시스템을 기본 모델로 채택한다. 최근 대중화된 프로세서 및 지역 버스의 사양을 반영한 모의실험을 통해 현재의 지점간 링크가 전체 시스템 성능에 병목이 됨을 보여주고 두 배 이상의 대역폭 확장이 필요함을 보인다. 상호 연결망의 대역폭을 확장하기 위해, 두 배 증가된 대역폭을 지닌 새로운 링크를 개발하는 것은 과다한 설계비용과 개발시간이 요구된다. 이에 대한 대안으로 본 논문에서는 상용화되어있어 쉽게 적용 가능한 기존 IEEE 표준 대역폭을 가진 링크를 이용해 이중으로 링을 구성하는 몇 가지 방법 단순 이중 링, 트랜잭션 분리 이중 링, 방향 분리 이중 링 - 을 제시하고 모의실험을 통해 두 배 대역폭 단일 링과 더불어 각각의 방식에 대한 장단점을 분석한다.

Keywords

References

  1. IEEE Computer Society, IEEE Standard for Scalable Coherent Interface(SCI), Institute of Electrical and Electronics Engineers, August 1993
  2. Tom Lovett and Russell Clapp, 'STiNG : A CC-NUMA Computer System for the Commercial Marketlpace,' the 23th ISCA(International Symposium on Computer Architecture), pp. 308-317, May 1996 https://doi.org/10.1109/ISCA.1996.10001
  3. Z. Vranesic, et al., 'The NUMAchine Multiprocessor,' Department of Computer Science, Toronto Univ., 1995
  4. L. Barroso and M. Dubois, 'The Performance of Cache-Coherent Ring-based Multiprocessors,' the 20th ISCA, pp.268-277, May 1993
  5. 김형호, 지점간 링크를 이용한 스누핑 버스의 설계 및 성능분석, 서울대학교 컴퓨터 공학과 석사학위 논문, 1996.
  6. Sung Woo Chung, Seong Tae Jhang and Chu Shik Jhon, 'PANDA : Ring-Based Multiprocessor System using New Snooping Protocol,' ICPADS'98, pp. 10-17, Dec. 1998 https://doi.org/10.1109/ICPADS.1998.741012
  7. AViiON AV 25000 ccNUMA Server, Available in http://www.dg.com/aviion/html/av_25000_enterprise_server.html
  8. Intel Announces Fastest Pentium(R)II Xeon(TM) Processor, Available in http://www.intel.com/pressroom/archive/releases/wp100698.htm
  9. Memory-Specifications, Available in http://developer.intel.com/design/pcisets/memory/Index.htmn
  10. Standard High-Volume Servers, Available in http://www.intel.com/procs/SERVERS/feature/shv
  11. Daniel Lenoski, et al., 'The Stanford Dash Multiprocessor,' IEEE Computer, March 1992 https://doi.org/10.1109/2.121510
  12. Zhang, Z. and J. Torrellas, 'Reducing Remote Conflict Misses: NUMA with Remote Cache versus COMA,' In Proc. of the 3rd IEEE Symp. on High Performance Computer Architecture(HPCA-3), pp. 272-281, Feb. 1997 https://doi.org/10.1109/HPCA.1997.569686
  13. J. R. Goodman, 'Using Cache Memory to Reduce Processor-Memory Traffic,' the 10th ISCA, pp. 124-131, June 1983
  14. R. H. Katz, S. J. Eggers, D. A. Wood, C. L. Perkins, and R. G. Sheldon, 'Implementing a Cache Consistency Protocol,' the 12th ISCA, pp. 276-283, June 1985 https://doi.org/10.1145/327010.327237
  15. SES/Workbench Technical Reference, Scientific and Engineering Software, 1995
  16. Transaction Processing Performance Council, Overview of the TPC Benchmark A:, Available in http://www.tpc.org/adetail.html