DOI QR코드

DOI QR Code

A study on how to build a supercomputer monitoring and performance analysis system based on Performance Co-Pilot, Bpftrace and Grafana

Performance Co-Pilot, Bpftrace, Grafana 기반 슈퍼컴퓨터 모니터링 및 성능 분석 시스템 구축 방안 연구

  • 곽재혁 (한국과학기술정보연구원)
  • Published : 2021.11.04

Abstract

슈퍼컴퓨터는 수백~수천 노드의 컴퓨팅 자원이 연결되어 복잡한 계산이나 대규모 데이터를 병렬 처리하며 일부 노드에서 발생하는 예상치 못한 문제는 전체적인 시스템 성능 저하로 이어질 수 있기 때문에 슈퍼컴퓨터 모니터링과 성능 분석은 슈퍼컴퓨터를 구축하고 운영하는데 필수적인 요소로 볼 수 있다. 본 논문에서는 오픈소스 소프트웨어인 Performance Co-Pilot, Bpftrace, Grafana를 활용한 슈퍼컴퓨터 모니터링 및 성능분석 시스템 구축 방안을 제안하였으며 이를 통해서 확장가능하면서도 유연한 구조의 슈퍼컴퓨터 모니터링 및 성능 분석이 가능함을 보였다.

Keywords

Acknowledgement

본 연구는 2021년도 한국과학기술정보연구원(KISTI) 주요사업 과제(K-21-L02-C08-S01, 초고성능컴퓨팅 공동활용을 위한 통합 환경 개발 및 구축)로 수행한 결과임