• Title, Summary, Keyword: Parallel Computing

검색결과 695건 처리시간 0.036초

평행사변형 분류 알고리즘의 성능에 대한 연구 (A Study on the Performance of Parallelepiped Classification Algorithm)

  • 용환기
    • 한국지리정보학회지
    • /
    • v.4 no.4
    • /
    • pp.1-7
    • /
    • 2001
  • 위성영상은 GIS 정보획득을 위한 가장 중요한 초기자료로서, 이로부터 주제도와 같은 유용한 정보를 추출하기 위해서는 위성영상 즉 다중스펙트럼 영상을 목적에 적합하게 분류하는 처리과정이 필요하다. 위성영상의 분류기법은 크게 감독기법과 무감독기법으로 나뉘는데, 본 논문에서는 감독분류기법 중의 하나인 평행사변형 알고리즘에서 군집의 초기값 설정이 알고리즘의 성능에 미치는 영향을 분석한다. 본 연구에서는 우선 직렬컴퓨터에서 평행사변형 알고리즘의 성능과 초기값 변화와의 관계를 살펴보고, 이를 확장하여 MIMD 병렬구조 컴퓨터 모델을 사용한 경우에 초기값의 변화가 평행사변형 알고리즘의 성능에 미치는 영향을 분석한다. 평행사변형 알고리즘의 성능은 초기값의 설정에 따라 직렬구조의 컴퓨터를 사용하는 경우에는 최고 2.4배, 그리고 MIMD 병렬구조 모델을 사용한 경우에는 최고 2.5배의 성능 향상을 보였다. 전산모의실험을 통해 위성영상의 감독분류기법에서 초기값이 평행사변형 분류알고리즘의 성능에 상당한 영향을 미치며, 직렬컴퓨터와 MIMD 병렬컴퓨터에서 초기값의 적절한 설정을 통해 분류기법의 성능이 향상됨을 확인하였다.

  • PDF

Windows 운영체제 기반의 병렬 계산 환경 (Parallel Computing Environment based on Windows Operating System)

  • 최정열;신재렬;김명호
    • 한국항공우주학회지
    • /
    • v.31 no.4
    • /
    • pp.16-25
    • /
    • 2003
  • Windows 운영체제 기반의 병렬처리 환경을 구축하였으며, 리눅스 운영체제 기반의 시스템과 비교하여 병렬처리 성능을 살펴보았다. Windows 클러스터는 Fast-Ethernet으로 연결된 서버와 클라이언트로 구성되어 있으며, 두 개의 클러스터가 동시에 또는 개별적으로 운용될 수 있도록 구성하였다. 계산 도구로서 Compaq Visual Fortran 컴파일러와 두 개의 MPI 라이브러리, MPICH.NT.1.2.2 와 MP-MPICHNT.1.2 를 설치하였다. 병렬 처리 성능 시험은 이차원 예조건화 Navier-Stokes 코드를 이용하여 수행하였으며, 리눅스 클러스터의 결과와 비교하여, 프로세서의 수, 문제의 크기 그리고 MPI 라이브러리에 따른 의존성을 살펴보았다. 이 결과는 사용자에게 친숙한 Windows 운영체제 기반의 클러스터가 병렬 계산 환경에서도 유용하며, 이전의 리눅스 클러스터에 버금가는 우수한 성능을 보여주었다.

3차원 대형구조물의 동적해석을 위한 병렬 알고리즘 개발 (Development of Parallel Algorithm for Dynamic Analysis of Three-Dimensional Large-Scale Structures)

  • 김국규;성창원;박효선
    • 한국전산구조공학회:학술대회논문집
    • /
    • /
    • pp.307-314
    • /
    • 2000
  • A parallel condensation algorithm for efficient dynamic analysis of three-dimensional large-scale structures is presented. The algorithm is developed for a user-friendly and cost effective high-performance computing system on a collection of Pentium processors connected via a 100 Mb/s Ethernet LAN. To harness the parallelism in the computing system effectively, a large-scale structure is partitioned into a number of substructures equal to the number of computers in the computing system Then, for reduction in the size of an eigenvalue problem the computations required for static condensation of each substructure is processed concurrently on each slave computer. The performance of th proposed parallel algorithm is demonstrated by applying to dynamic analysis of a three dimensional structure. The results show that how the parallel algorithm facilitates the efficient use of a small number of low-cost personal computers for dynamic analysis of large-scale structures.

  • PDF

병렬처리를 이용한 화력발전소의 실시간 시뮬레이션 (Real time simulation using multiple DSPs for fossil power plants)

  • 박희준;김병국
    • 제어로봇시스템학회:학술대회논문집
    • /
    • /
    • pp.480-483
    • /
    • 1997
  • A fossil power plant can be modeled by a lot of algebraic equations and differential equations. When we simulate a large, complicated fossil power plant by a computer such as workstation or PC, it takes much time until overall equations are completely calculated. Therefore, new processing systems which have high computing speed is ultimately needed to develope real-time simulators. Vital points of real-time simulators are accuracy, computing speed, and deadline observing. In this paper, we present a enhanced strategy in which we can provide powerful computing power by parallel processing of DSP processors with communication links. We designed general purpose DSP modules, and a VME interface module. Because the DSP module is designed for general purpose, we can easily expand the parallel system by just connecting new DSP modules to the system. Additionally we propose methods about downloading programs, initial data to each DSP module via VME bus, DPRAM and processing sequences about computing and updating values between DSP modules and CPU30 board when the simulator is working.

  • PDF

모바일 작업을 위한 수정된 GOMS-model에 대한 연구 (Modified GOMS-Model for Mobile Computing)

  • 이석재;명노해
    • 산업경영시스템학회지
    • /
    • v.32 no.2
    • /
    • pp.85-93
    • /
    • 2009
  • GOMS model is a cognitive modeling method of human performance based on Goal, Operators, Methods, Selection rules. GOMS model was originally designed for desktop environment so that it is difficult for GOMS model to be implemented into the mobile environment. In addition, GOMS model would be inaccurate because the original GOMS model was based on serial processing, excluding one of most important human information processing characteristics, parallel processing. Therefore this study was designed to propose a modified GOMS model including mobile computing and parallel processing. In order to encompass mobile environment, an operator of 'look for' was divided into 'visual move to' and 'recognize' whereas 'point to' and 'click' were combined into 'tab.' The results showed that newly introduced operators were necessary to estimate more accurate mobile computing behaviors. In conclusion, modified-GOMS model could predict human performance more accurately than the original GOMS model in the mobile computing environment.

Optimal Design of a Direct-Driven PM Wind Generator Aimed at Maximum AEP using Coupled FEA and Parallel Computing GA

  • Jung, Ho-Chang;Lee, Cheol-Gyun;Hahn, Sung-Chin;Jung, Sang-Yong
    • Journal of Electrical Engineering and Technology
    • /
    • v.3 no.4
    • /
    • pp.552-558
    • /
    • 2008
  • Optimal design of the direct-driven Permanent Magnet(PM) wind generator, combined with F.E.A(Finite Element Analysis) and Genetic Algorithm(GA), has been performed to maximize the Annual Energy Production(AEP) over the entire wind speed characterized by the statistical model of wind speed distribution. Particularly, the proposed parallel computing via internet web service has contributed to reducing excessive computing times for optimization.

OpenCL을 활용한 CPU와 GPU 에서의 CMMB LDPC 복호기 병렬화 (Parallel LDPC Decoder for CMMB on CPU and GPU Using OpenCL)

  • 박주열;홍정현;정기석
    • 대한임베디드공학회논문지
    • /
    • v.11 no.6
    • /
    • pp.325-334
    • /
    • 2016
  • Recently, Open Computing Language (OpenCL) has been proposed to provide a framework that supports heterogeneous computing platforms. By using an OpenCL framework, digital communication systems can support various protocols in a unified computing environment to achieve both high portability and high performance. This article introduces a parallel software decoder of Low Density Parity Check (LDPC) codes for China Multimedia Mobile Broadcasting (CMMB) on a heterogeneous platform. Each step of LDPC decoding has different parallelization characteristics. In this paper, steps suitable for task-level parallelization are executed on the CPU, and steps suitable for data-level parallelization are processed by the GPU. To improve the performance of the proposed OpenCL kernels for LDPC decoding operations, explicit thread scheduling, loop-unrolling, and effective data transfer techniques are applied. The proposed LDPC decoder achieves high performance by using heterogeneous multi-core processors on a unified computing framework.

병렬컴퓨팅 환경에서의 대용량 퍼지 추론 (Fuzzy Inference of Large Volumes in Parallel Computing Environments)

  • 김진일;이상구
    • 한국지능시스템학회논문지
    • /
    • v.10 no.4
    • /
    • pp.293-298
    • /
    • 2000
  • 대단히 많은 수의 퍼지 규칙을 갖거나 대용량의 퍼지 데이터를 갖는 퍼지 전문가 시스템 또는 퍼지 데이터베이스 시스템에서는 많은 추론 시간을 요구한다. 따라서 이러한 추론 시간을 줄이기 위해서는 고성능 병렬 퍼지 컴퓨팅 환경을 필요로 한다. 본 온문에서는 병렬 컴퓨팅 환경에서 병렬 퍼지 추론 기법을 제안한다. 여기에서 퍼지 규칙은 분산되어 있고 동시에 수행된다. ONE_TO_ALL 알고리즘은 모든 노드에 퍼지 입력 백터를 broadcasting하는데 사용한다. MIN/MAX 연산의 결과는 ALL_TO_ONE 알고리즘에 의해 출력 프로세서로 전송된다. 퍼지 규칙 또는 데이터의 병렬 처리로 인해, 병렬 추론 알고리즘은 효과적인 병렬성의 추출 및 속도 향상을 가져온다.

  • PDF

외연 Lagrangian 유한요소법 기반의 대규모 유한요소 모델 병렬처리 (Parallel Computing of Large Scale FE Model based on Explicit Lagrangian FEM)

  • 백승훈;김승조;이민형
    • 한국항공우주학회지
    • /
    • v.34 no.8
    • /
    • pp.33-40
    • /
    • 2006
  • 비선형 외연 유한요소법에서 유한요소 병렬 처리 방안을 기술하고 코드에 구현하였다. 성능테스트 장비로 자체 구축한 520 개의 CPU를 갖는 리눅스 클러스터 슈퍼컴퓨터를 사용하였다. 대규모 모델 테스트 결과 256 개의 CPU 까지도 거의 이상적인 속도 증가를 보였다. 유한요소 계산시간 대비 통신시간 계산이 전체 성능에 미치는 영향도 검토하였다. 사용 프로세서가 증가할수록 상용코드의 병렬 성능 대비 더 좋은 성능을 보이는 것으로 나타났다.

High Performance Computing: Infrastructure, Application, and Operation

  • Park, Byung-Hoon;Kim, Youngjae;Kim, Byoung-Do;Hong, Taeyoung;Kim, Sungjun;Lee, John K.
    • Journal of Computing Science and Engineering
    • /
    • v.6 no.4
    • /
    • pp.280-286
    • /
    • 2012
  • The last decades have witnessed an increasingly indispensible role of high performance computing (HPC) in science, business and financial sectors, as well as military and national security areas. To introduce key aspects of HPC to a broader community, an HPC session was organized for the first time ever for the United States and Korea Conference (UKC) during 2012. This paper summarizes four invited talks that each covers scientific HPC applications, large-scale parallel file systems, administration/maintenance of supercomputers, and green technology towards building power efficient supercomputers of the next generation.