• 제목/요약/키워드: Parallel Computing

검색결과 807건 처리시간 0.031초

대면적 고분자전해질연료전지의 병렬계산 시뮬레이션 (Parallel Computing Simulation of Large-Scale Polymer Electrolyte Fuel Cells)

  • 곽건희;푸루소타마;강경문;주현철
    • 한국수소및신에너지학회논문집
    • /
    • 제22권6호
    • /
    • pp.868-877
    • /
    • 2011
  • This paper presents a parallel computing methodology for polymer electrolyte fuel cells (PEFCs) and detailed simulation contours of a real-scale fuel cell. In this work, a three-dimensional two-phase PEFC model is applied to a large-scale 200 $cm^2$ fuel cell geometry that requires roughly 13.5 million grid points based on grid-independence study. For parallel computing, the large-scale computational domain is decomposed into 12 sub-domains and parallel simulations are carried out using 12 processors of 2.53 GHz Intel core i7 and 48GB RECC DDR3-1333. The work represents the first attempt to parallelize a two-phase PEFC code and illustrate two-phase contours in a representative industrial cell.

클라우드컴퓨팅에서 메시지패싱방식 응용프로그램의 효율적인 체크포인트 알고리즘 (Efficient Checkpoint Algorithm for Message-Passing Parallel Applications on Cloud Computing)

  • Le, Duc Tai;Dao, Manh Thuong Quan;Ahn, Min-Joon;Choo, Hyun-Seung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.156-157
    • /
    • 2011
  • In this work, we study the checkpoint/restart problem for message-passing parallel applications running on cloud computing environment. This is a new direction which arises from the trend of enabling the applications to run on the cloud computing environment. The main objective is to propose an efficient checkpoint algorithm for message-passing parallel applications considering communications with external systems. We further implement the novel algorithm by modifying gSOAP and OpenMPI (the open source libraries) which support service calls and checkpoint message-passing parallel programs, especially. The simulation showed that additional costs to the executing and checkpointing application of the algorithm are negligible. Ultimately, the algorithm supports efficiently the checkpoint/restart service for message-passing parallel applications, that send requests to external services.

병렬 컴퓨팅을 이용한 DES 키 탐색 안정성 분석 (Evaluation of DES key search stability using Parallel Computing)

  • 윤준원;최장원;박찬열;공기식
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권1호
    • /
    • pp.65-72
    • /
    • 2013
  • 기상, 바이오, 천문학, 암호학 등 다양한 분야의 대규모 작업을 처리하기 위하여 다수의 계산 자원을 동시에 사용하기 위한 병렬 컴퓨팅 기법들이 제안되어져 왔다. 병렬 컴퓨팅은 여러 프로세서에게 작업을 분담시켜 동시에 계산을 수행하게 함으로써 프로그램의 실행시간을 단축시킬 수 있을 뿐만 아니라 해결할 수 있는 문제의 규모를 확장 시킬 수 있다. 본 논문에서는 실제 암호 알고리즘 분석하기 위하여 병렬 처리 방식을 적용하여 그 효율성을 분석하였다. 암호 알고리즘의 실질적인 안전성 요소인 키의 길이는 전수조사 계산량에 의존한다. 이에 병렬 처리 환경에서 DES 키 탐색 암호 알고리즘의 키 전수조사 작업을 수행하기 위한 세부적인 절차에 대해서 논하였고, 클러스터링 장비에 적용하여 시뮬레이션 수행하였다. 그 결과 컴퓨터의 양에 따라서 계산량의 추이를 실증적으로 예측함으로써 암호 알고리즘의 안전성 강도를 측정할 수 있다.

하둡 기반 대규모 작업처리 프레임워크에서의 Adaptive Parallel Computability 기술 연구 (A Study on Adaptive Parallel Computability in Many-Task Computing on Hadoop Framework)

  • 김직수
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1122-1133
    • /
    • 2019
  • 본 연구팀에서는 YARN 기반의 하둡 플랫폼에서 대규모의 태스크들로 구성된 Many-Task Computing(MTC) 응용들을 효율적으로 지원할 수 있는 신규 프레임워크로서 MOHA(Mtc On HAdoop)를 연구/개발해왔다. MTC 응용들은 수십만 개에서 수백만 개 이상의 대규모 태스크들로 구성되고 각 응용별로 자원의 사용 패턴이 다를 수 있기 때문에, 전체적인 시스템 성능 향상을 위해 MOHA-TaskExecutor(MTC 응용 태스크를 실행하는 주체)의 Adaptive Parallel Computability 기술 연구를 수행하였다. 이는 한 번에 하나의 태스크를 실행하던 기존의 처리 모델을 고도화하여 하나의 TaskExecutor가 동시에 여러 개의 태스크들을 실행함으로써 YARN Container의 병렬 컴퓨팅 능력을 극대화하기 위함이다. 이를 위해 각각의 TaskExecutor들이 "독립적이고, 동적으로" 동시에 실행시키는 MTC 응용 태스크들을 조정할 수 있도록 하였으며, 최적의 동시 실행 태스크 숫자를 찾기 위해서 Hill-Climbing 알고리즘을 활용하였다.

병렬 컴퓨팅 환경 하에서 인공위성 어댑터 가상최적설계 (Virtual Optimal Design of Satellite Adapter in Parallel Computing Environment)

  • 문종근;윤영하;김경원;김선원;김진희;김승조
    • 한국항공우주학회지
    • /
    • 제35권11호
    • /
    • pp.973-982
    • /
    • 2007
  • 연구는 병렬 컴퓨팅 기반에서 자동화된 격자 생성 기법과 입자 군집 최적화(PSO) 알고리즘을 적용한 최적 설계 프레임워크를 개발하여 이를 인공위성 어댑터 모듈의 구조 최적 설계에 적용하였다. 자동화된 격자 생성 기법을 적용하여 구조 형상 변화를 가능하게 함으로써 폭넓은 범위에서 최적 형상 모델을 도출할 수 있었다. 또한 최적화 알고리즘인 PSO 알고리즘을 병렬 계산환경과 접목하고, 계산 성능을 최대화하기 위해 비동기식 PSO 알고리즘을 개발하였다. 그 결과 최적화에 걸리는 계산 시간을 줄일 수 있었다. 최적화 작업에서 제한 조건으로는 고유진동수와 어댑터에 발생하는 최대 응력 값을 고려하였다. 결과적으로 인공위성 어댑터 모듈의 최적 설계를 통해 인공위성 구조 질량 감소를 유도해 내었다.

클러스터 시스템에서 프리스트레스트 콘크리트 프레임의 병렬 비선형해석 (Parallel Nonlinear Analysis of Prestressed Concrete Frame on Cluster System)

  • 이재석;최규천
    • 한국전산구조공학회논문집
    • /
    • 제14권3호
    • /
    • pp.287-298
    • /
    • 2001
  • 본 논문에서는 클러스터 시스템을 이용하여 프리스트레스트 콘크리트 프레임의 병렬 비선형해석이 가능한 해석수단을 제시하였다. Win 98 및 Linux 운영체제 하의 PC 및 Ethernet을 활용하여 저가의 클러스터 시스템을 구축하였고 메시지 전송을 위하여 MPI를 사용하였다. 비선형해석에 있어 해석시간의 대부분을 차지하는 반복계산과정 중 병렬계산에 의한 효율이 높은 접선강도매트릭스의 형성 및 요소응력계산, 재료상태 결정, 부재파괴 검토, 불평형하중 계산과정에 대한 병렬계산 알고리즘을 메시지 전송방식을 이용하여 제시하고 클러스터 시스템 상에서 구현했다. 캔틸레버 보와 PSC 거더교를 대상으로 클러스터 컴퓨팅을 이용한 비 선형해석을 수행한 결과 노트가 4개일 경우의 성능향상은 고려한 비선형형성 및 문제의 크기에 따라 다르나 Win98 환경에서 최소 2.46배에서 최대 3.18배로 나타났고 Linux 환경에서 최소 3.16배에서 최대 3.74배로 나타났으며 통신환경의 개선에 따라 증대될 것으로 기대된다.

  • PDF

이질적 계산 능력을 가진 NOW를 위한 공간 공유 스케쥴링 기법 (Space-Sharing Scheduling Schemes for NOW with Heterogeneous Computing Power)

  • 김진성;심영철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권7호
    • /
    • pp.650-664
    • /
    • 2000
  • NOW(Network of Workstations)는 병렬 프로그램들을 수행하기 위한 플랫폼으로 많이 고려되어지고 있다. NOW에서 병렬 프로그램이 좋은 성능으로 실행되기 위해 해결되어야할 기본적인 문제들 중 하나가 작업의 스케쥴링 문제를 효율적으로 결정하는 것이다. 현재 NOW에 관한 대부분의 연구는 NOW를 구성하는 모든 워크스테이션이 같은 처리 능력을 가지고 있다고 가정하고 있다. 본 논문에서는 NOW를 구성하는 워크스테이션들이 다른 계산 능력을 가지고 있는 것을 고려한다. 이질적인 계산 능력을 가지고 있는 워크스테이션들로 구성된 NOW에 적용할 수 있는 10가지 공간 분할 스케쥴링 방법을 제시하 고, 시뮬레이터를 통하여 이 스케쥴링 정책들을 비교한다. 시뮬레이터는 합성된 순차/병렬 부하를 입력으로 받아 병렬 작업의 응답 사간과 기다림 시간을 성능 지표로 발생시킨다. 실험 결과 워크스테이션의 계산 능력에 비례하여 병렬 프로그램을 이질적으로 분할하는 경우가 균등 분할하는 경우보다 성능이 우수함을 알 수 있었다. 병렬 프로세스를 수행하는 워크스테이션에 소유자가 돌아온 경우 병렬 프로세스를 새 유휴 워크스테이션에 이주하는 것보다는 단지 우선 순위를 낮추는 것이 높은 성능을 보여 주었다. 우선 순위 낮춤을 사용하는 이질적 분할의 경우 적응 할당 정책이 넓은 범위의 병렬 프로그램 도착시간에서 좋은 성능을 보이나 부하 불균형이 높아지는 경우 수정된 적응 할당 정책이 높은 성능을 보여준다 .

  • PDF

Efficient Parallel Block-layered Nonbinary Quasi-cyclic Low-density Parity-check Decoding on a GPU

  • Thi, Huyen Pham;Lee, Hanho
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권3호
    • /
    • pp.210-219
    • /
    • 2017
  • This paper proposes a modified min-max algorithm (MMMA) for nonbinary quasi-cyclic low-density parity-check (NB-QC-LDPC) codes and an efficient parallel block-layered decoder architecture corresponding to the algorithm on a graphics processing unit (GPU) platform. The algorithm removes multiplications over the Galois field (GF) in the merger step to reduce decoding latency without any performance loss. The decoding implementation on a GPU for NB-QC-LDPC codes achieves improvements in both flexibility and scalability. To perform the decoding on the GPU, data and memory structures suitable for parallel computing are designed. The implementation results for NB-QC-LDPC codes over GF(32) and GF(64) demonstrate that the parallel block-layered decoding on a GPU accelerates the decoding process to provide a faster decoding runtime, and obtains a higher coding gain under a low $10^{-10}$ bit error rate and low $10^{-7}$ frame error rate, compared to existing methods.

Lagrangean 근사과정의 병렬계산 (On Parallel Implementation of Lagrangean Approximation Procedure)

  • 이호창
    • 한국경영과학회지
    • /
    • 제18권3호
    • /
    • pp.13-34
    • /
    • 1993
  • By operating on many part of a software system concurrently, the parallel processing computers may provide several orders of magnitude more computing power than traditional serial computers. If the Lagrangean approximation procedure is applied to a large scale manufacturing problem which is decomposable into many subproblems, the procedure is a perfect candidate for parallel processing. By distributing Lagrangean subproblems for given multiplier to multiple processors, concurrently running processors and modifying Lagrangean multipliers at the end of each iteration of a subgradient method,a parallel processing of a Lagrangean approximation procedure may provide a significant speedup. This purpose of this research is to investigate the potential of the parallelized Lagrangean approximation procedure (PLAP) for certain combinational optimization problems in manufacturing systems. The framework of a Plap is proposed for some combinatorial manufacturing problems which are decomposable into well-structured subproblems. The synchronous PLAP for the multistage dynamic lot-sizing problem is implemented on a parallel computer Alliant FX/4 and its computational experience is reported as a promising application of vector-concurrent computing.

  • PDF