• 제목/요약/키워드: Parallel Computing

검색결과 807건 처리시간 0.03초

Appropriate Synchronization Time Allocation for Distributed Heterogeneous Parallel Computing Systems

  • Nidaw, Biruk Yirga;Oh, Myeong-Hoon;Kim, Young Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5446-5463
    • /
    • 2019
  • Parallel computing system components should be harmonized, and this harmonization is kept existent using synchronization time. Synchronization time affects the system in two ways. First, if we have too little synchronization time, some tasks face the problem of harmonization, as they need appropriate time to update and synchronize with the system. Second, if we allocate a large amount of time, stall system created. Random allocation of synchronization time for parallel systems slows down not only the booting time of the system but also the execution time of each application involved in the system. This paper presents a simulator used to test and allocate appropriate synchronization time for distributed and parallel heterogeneous systems. The simulator creates the parallel and heterogeneous system to be evaluated, and lets the user vary the synchronization time to optimize the booting time. NS3-cGEM5 simulator in this paper is formed by HLA-RTI federation integration of the two independent architecture and network simulators - NS3 and cGEM5. Therefore, nodes created on these simulators need synchronizations for harmonized system performance. We tested and allocated the appropriate synchronization time for our sample parallel system composed of one x86 server and three ARM clients.

Parallel processing in structural reliability

  • Pellissetti, M.F.
    • Structural Engineering and Mechanics
    • /
    • 제32권1호
    • /
    • pp.95-126
    • /
    • 2009
  • The present contribution addresses the parallelization of advanced simulation methods for structural reliability analysis, which have recently been developed for large-scale structures with a high number of uncertain parameters. In particular, the Line Sampling method and the Subset Simulation method are considered. The proposed parallel algorithms exploit the parallelism associated with the possibility to simultaneously perform independent FE analyses. For the Line Sampling method a parallelization scheme is proposed both for the actual sampling process, and for the statistical gradient estimation method used to identify the so-called important direction of the Line Sampling scheme. Two parallelization strategies are investigated for the Subset Simulation method: the first one consists in the embarrassingly parallel advancement of distinct Markov chains; in this case the speedup is bounded by the number of chains advanced simultaneously. The second parallel Subset Simulation algorithm utilizes the concept of speculative computing. Speedup measurements in context with the FE model of a multistory building (24,000 DOFs) show the reduction of the wall-clock time to a very viable amount (<10 minutes for Line Sampling and ${\approx}$ 1 hour for Subset Simulation). The measurements, conducted on clusters of multi-core nodes, also indicate a strong sensitivity of the parallel performance to the load level of the nodes, in terms of the number of simultaneously used cores. This performance degradation is related to memory bottlenecks during the modal analysis required during each FE analysis.

평면 다물체 동역학 해석에서 GPU 병렬 프로그래밍의 계산효과 (Calculation Effect of GPU Parallel Programing for Planar Multibody System Dynamics)

  • 전철웅;손정현
    • 동력기계공학회지
    • /
    • 제16권4호
    • /
    • pp.12-16
    • /
    • 2012
  • In this paper, the equations of motions for planar multibody dynamics are established for considering the parallel programming based on GPU. Cartesian coordinates are used to formulate the equations of motion and implicit integration method called HHT-alpha is employed. Open chain multibody system is considered for computer simulation. CUDA toolkit is employed for establishing the GPU parallel programming. The exactness of the analysis is verified from the comparison with ADAMS. The results from parallel computing based on GPU are compared with the results from the sequential programming based on CPU in terms of calculation time. The multiple pendulum with bodies and joints is employed for the computer simulation. In the pendulum system that has 290 bodies, the parallel program indicates an improved efficiency of about 25.5 second(15.5% improvement). It is noted that the larger the size of system is, the time efficiency is better.

Performance Study of Satellite Image Processing on Graphics Processors Unit Using CUDA

  • Jeong, In-Kyu;Hong, Min-Gee;Hahn, Kwang-Soo;Choi, Joonsoo;Kim, Choen
    • 대한원격탐사학회지
    • /
    • 제28권6호
    • /
    • pp.683-691
    • /
    • 2012
  • High resolution satellite images are now widely used for a variety of mapping applications including photogrammetry, GIS data acquisition and visualization. As the spectral and spatial data size of satellite images increases, a greater processing power is needed to process the images. The solution of these problems is parallel systems. Parallel processing techniques have been developed for improving the performance of image processing along with the development of the computational power. However, conventional CPU-based parallel computing is often not good enough for the demand for computational speed to process the images. The GPU is a good candidate to achieve this goal. Recently GPUs are used in the field of highly complex processing including many loop operations such as mathematical transforms, ray tracing. In this study we proposed a technique for parallel processing of high resolution satellite images using GPU. We implemented a spectral radiometric processing algorithm on Landsat-7 ETM+ imagery using CUDA, a parallel computing architecture developed by NVIDIA for GPU. Also performance of the algorithm on GPU and CPU is compared.

실시간 시뮬레이션을 위한 병렬적분 (Parallel Integration for Real-Time Simulation)

  • 이운성
    • 한국자동차공학회논문집
    • /
    • 제2권1호
    • /
    • pp.106-115
    • /
    • 1994
  • A parallel integration approach is proposed for real-time simulation of controlled mechanical systems. The proposed approach, which employs the dual-rate integration method in a parallel computing environment, is developed to deal with stiffness and high frequency characteristics of the controlled mechanical systems effectively. Numerical experiments are performed to demonstrate the effectiveness of the approach in shared memory multiprocessors, Alliant FX/8 and Alliant FX/80.

  • PDF

NUMA구조를 가진 고성능 컴퓨팅 시스템에서의 메쉬 재배열의 라플라시안 스무딩에 대한 효과 (The Effect of Mesh Reordering on Laplacian Smoothing for Nonuniform Memory Access Architecture-based High Performance Computing Systems)

  • 김지범
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.82-88
    • /
    • 2014
  • 우리는 고성능 컴퓨팅 (high performance computing) 시스템에서 메쉬 재배열이 라플라시안 스무딩에 대해서 어떠한 효과가 있는지 연구한다. 구체적으로, 우리는 nonuniform memory access (NUMA) 구조의 고성능 컴퓨팅 시스템에서 Reverse-Cuthill Mckee 알고리즘을 사용하여 메쉬를 재배열하고 메쉬질을 높이기 위하여 라플라시안 스무딩을 사용한다. 먼저 하나의 코어를 사용하여 메쉬 재배열의 라플라시안 스무딩에 대한 속도 향상을 조사한 후에 NUMA구조의 멀티코어 시스템에서 OpenMP를 이용하여 병렬화할 경우 메쉬 재배열의 라플라시안 스무딩에 대한 속도 향상에 대하여 조사한다.

자바를 기반으로 한 글로벌 인터넷 컴퓨팅 환경 (Global Internet Computing Environment based on Java)

  • 김희철;신필섭;박영진;이용두
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2320-2331
    • /
    • 1999
  • 본 연구에서는 한정된 자원만을 사용하는 기존의 워크스테이션 클러스터링 환경의 제한성을 극복하기 위하여 인터넷에 연결된 혼합 이기종 컴퓨터들을 병렬 컴퓨팅 플랫폼으로 활용하고자 하는 인터넷 컴퓨팅 환경의 구축 기법을 제안한다. 제안하는 글로벌 인터넷 컴퓨팅 환경(Global Internet Computing Environment)은 프로그램의 용이성, 이기종 지원의 효율성, 시스템의 확장성, 그리고 시스템 성능에 초점을 두고 자바를 프로그래밍 및 수행 환경으로 채택하여 인터넷 컴퓨팅 구축에 있어 필수적인 동적 자원 중계 및 관리, 효율적인 병렬 테스크 수행 기법을 제시한다. 본 논문에서는 제안하는 글로벌 인터넷 컴퓨팅 환경의 구성모델 및 동작모델 그리고 시험시스템 구축 내용 및 벤치마킹을 통한 성능 평가 결과를 제시하며 이를 바탕으로 인터넷 컴퓨팅 환경의 구축 개념, 복잡성, 성능의 문제에 대한 분석결과를 기술한다.

  • PDF

이동 객체 기반 병렬 및 분산 응용 수행을 위한 전역 프레임워크 (A Global Framework for Parallel and Distributed Application with Mobile Objects)

  • 한연희;박찬열;황종선;정영식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권6호
    • /
    • pp.555-568
    • /
    • 2000
  • 월드 와이드 웹은 가장 커다란 가상 시스템이 되고 있다. 최근의 연구 분야에서, 많은 계산량을 지닌 응용을 수행시키기 위해 월드 와이드 웹에 존재하는 여러 휴지 호스트들을 이용하는 아이디어가 등장하고 있으며, 이러한 새로운 컴퓨팅 패러다임을 전역 컴퓨팅이라고 부른다. 우리는 이 논문에서 Tiger라 불리우는 이동 객체 기반 전역 컴퓨팅 프레임워크를 구현하여 제시한다. Tiger의 첫 번째 목표는 객체들의 분산, 전달, 이동과 계산행위의 동시성을 지원하는 객체 지향 프로그래밍 라이브러리를 제시하는 것이다. 이 프로그래밍 라이브러리는 프로그래머에게 분산 및 이동 객체에 대한 접근, 위치 및 이동 투명성을 제공한다. Tiger의 두 번째 목표는 전역 컴퓨팅의 요구 조건인 확장성 및 자원, 위치 관리를 지원하는 것이다. Tiger 시스템과 제공하는 프로그래밍 라이브러리는 프로그래머로 하여금 전역적으로 확장된 컴퓨팅 자원을 활용하여 객체 지향 병렬 및 분산 응용을 쉽게 작성하게 해준다. 또한, 우리는 병렬 프랙탈 이미지 처리 및 유전자 뉴로 퍼지 알고리즘과 같은 매우 많은 연산량을 지닌 응용을 Tiger 시스템에 적용하여 성능 향상 정도를 보인다.

  • PDF

전산유체역학 병렬해석을 위한 클러스터 네트웍 장치 성능분석 (Performance Analysis of Cluster Network Interfaces for Parallel Computing of Computational Fluid Dynamics)

  • 이보성;홍정우;이동호;이상산
    • 한국항공우주학회지
    • /
    • 제31권5호
    • /
    • pp.37-43
    • /
    • 2003
  • 전산유체역학분야에서의 효율적인 해석을 위해서 병렬처리기법이 널리 사용되고 있다. 병렬처리기법과 함께 최근에는 저가의 리눅스 클러스터 컴퓨터들이 기존의 슈퍼컴퓨터들을 대체하는 추세이다. 리눅스 클러스터 컴퓨터에서 수행되는 해석프로그램의 성능은 클러스터 시스템의 프로세서 성능 뿐 아니라 클러스터 시스템에서 사용되는 네트웍 장비의 성능에 크게 영향을 받는다. 본 연구에서는 미리넷2000, 기가비트 이더넷, 패스트 이더넷 등 네트웍 장비에 따라서 클러스터 시스템의 성능이 어떻게 달라지는지를 Netpipe, LINPACK, NAS NPB, 그리고 MIPNS2D Navier-Stokes 해석프로그램을 사용하여 비교하였다. 이러한 연구결과를 바탕으로 전산유체역학 분야에서 사용될 고성능 저비용 리눅스 클러스터 시스템을 구축하는 방법을 제시하고자 하였다.

하이브리드 병렬 프로그램을 이용한 타키온 슈퍼컴퓨터의 성능 (Performance Characterization of Tachyon Supercomputer using Hybrid Multi-zone NAS Parallel Benchmarks)

  • 박남규;정윤수;이홍석
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.138-144
    • /
    • 2010
  • 최근에 도입되어 운영되고 있는 타키온 1차 시스템은 쿼드코어 AMD 바로셀로나 노드로 구성된 고성능 슈퍼컴퓨터이다. 본 논문에서는 하이브리드 병렬화 기법을 도입한 프로그램 중 하나로 사용되고 있는 멀티존(Multi-zone) NAS 병렬 벤치마크(NPB)를 이용하여 타키온 성능 및 병렬 확장성을 검증하고자 한다. 하이브리드 병렬 성능 시험을 위하여 NPB-3.3 버전 BT-MZ의 B 및 C클래스를 사용하였으며, 실제로 타키온 시스템의 1024개의 프로세스까지 병렬 확장성을 테스트를 하였다. 프로세서 1024개 이상 이용한 하이브리드 병렬컴퓨팅 계산 결과는 국내 최초이다. 이러한 하이브리드 병렬화 기법은 타키온처럼 멀티코어 기술을 적용한 고성능 컴퓨팅 시스템에서 매우 효율적이고 유용한 병렬 성능 벤치마크가 될 수 있음을 기술하였다.