• Title, Summary, Keyword: 공유 메모리

Search Result 398, Processing Time 0.036 seconds

Performance of the Finite Difference Method Using Cache and Shared Memory for Massively Parallel Systems (대규모 병렬 시스템에서 캐시와 공유메모리를 이용한 유한 차분법 성능)

  • Kim, Hyun Kyu;Lee, Hyo Jong
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.50 no.4
    • /
    • pp.108-116
    • /
    • 2013
  • Many algorithms have been introduced to improve performance by using massively parallel systems, which consist of several hundreds of processors. A typical example is a GPU system of many processors which uses shared memory. In the case of image filtering algorithms, which make references to neighboring points, the shared memory helps improve performance by frequently accessing adjacent pixels. However, using shared memory requires rewriting the existing codes and consequently results in complexity of the codes. Recent GPU systems support both L1 and L2 cache along with shared memory. Since the L1 cache memory is located in the same area as the shared memory, the improvement of performance is predictable by using the cache memory. In this paper, the performance of cache and shared memory were compared. In conclusion, the performance of cache-based algorithm is very similar to the one of shared memory. The complexity of the code appearing in a shared memory system, however, is resolved with the cache-based algorithm.

Implementation of Kernel Module for Shared Memory in Dual Bus System (듀얼 버스 시스템에서의 공유 메모리 커널 모듈 구현)

  • Moon, Ji-Hoon;Oh, Jae-Chul
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.5
    • /
    • pp.539-548
    • /
    • 2015
  • In this paper, shared memory feature was developed in multi-core system with different OS for different processor-specific bus, while conducting an experiment on shared memory feature between the two processors based on embedded Linux system. For the purpose of developing shared memory in dual bus structure, memory controller was used, while managing shared memory segment through list data structure. For AMP multi-core test, Linux OS was installed in 2 processor cores. In addition, it verified the creation and use of shared memory by using kernel module implemented to test shared memory.

Call-Site Tracing-based Shared Memory Allocator for False Sharing Reduction in DSM Systems (분산 공유 메모리 시스템에서 거짓 공유를 줄이는 호출지 추적 기반 공유 메모리 할당 기법)

  • Lee, Jong-Woo
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.32 no.7
    • /
    • pp.349-358
    • /
    • 2005
  • False sharing is a result of co-location of unrelated data in the same unit of memory coherency, and is one source of unnecessary overhead being of no help to keep the memory coherency in multiprocessor systems. Moreover. the damage caused by false sharing becomes large in proportion to the granularity of memory coherency. To reduce false sharing in a page-based DSM system, it is necessary to allocate unrelated data objects that have different access patterns into the separate shared pages. In this paper we propose call-site tracing-based shared memory allocator. shortly CSTallocator. CSTallocator expects that the data objects requested from the different call-sites may have different access patterns in the future. So CSTailocator places each data object requested from the different call-sites into the separate shared pages, and consequently data objects that have the same call-site are likely to get together into the same shared pages. We use execution-driven simulation of real parallel applications to evaluate the effectiveness of our CSTallocator. Our observations show that by using CSTallocator a considerable amount of false sharing misses can be additionally reduced in comparison with the existing techniques.

Enhancing the Performance of Fault-Tolerant Software Distributed Shared Memory (고장을 허용하는 분산공유메모리 시스템의 성능 향상 기법)

  • 김영재;박소연;맹승렬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.76-78
    • /
    • 2003
  • 클러스터 시스템의 규모가 커짐에 따라 소프트웨어 분산공유메모리 시스템의 고장 발생 확률은 점차 증가하고 있다. 그래서 최근에는 소프트웨어 분산공유메모리 시스템에 고장 허용 기능을 추가하는 연구가 활발히 이루어지고 있다. 연구의 초점은 소프트웨어 분산공유메모리 시스템이 정상 실행을 하는 동안 고장 허용 기능을 추가로 지원하면서 발생하는 오버헤드를 줄이는데 있다. 본 논문은 고장 허용 기능을 위해 원격 로깅 기법을 사용하는 소프트웨어 분산공유메모리 시스템에서 로그를 이용함으로써 전체적인 성능 향상을 기대한다.

  • PDF

The Design of Memory Sharing Pattern Predictors with Cache Structure (캐쉬 구조의 메모리 공유 패턴 예측기 설계)

  • 박소연;손영철;신규환;맹승렬;이준원;조정완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.639-641
    • /
    • 2000
  • 캐쉬를 사용하는 분산 공유 메모리 시스템에서는 캐쉬들 사이의 일관성 유지를 위한 지연 시간이 성능에 큰 영향을 미친다. 최근에는 각 공유 메모리의 일반적인 접근 패턴을 학습하여 일관성 유지의 예측적 수행을 가능하게 하는 메모리 공유 패턴 예측기가 연구되고 있다. 기존의 메모리 공유 패턴 예측기는 패턴 정보를 저장하기 위해서 모든 메모리 블락마다 예측 테이블들을 할당하지만 실제로 성능 향상에 도움을 주는 테이블들은 소수에 불과하다. 본 논문에서는 적은 양의 패턴 저장 공간을 사용하면서 기존의 예측기와 유사한 성능을 낼 수 있는 캐쉬 구조의 메모리 공유 패턴 예측기를 제안한다, 제안된 예측기에서는 좋은 성능을 내는 예측 테이블들을 선택적으로 저장하게 하는 효율적인 테이블 교체 기법이 요구된다. 본 논문에서는 LRU 교체 기법을 캐쉬 구조의 예측기에 적용시켰을 때의 문제점을 분석하고 제안된 예측기의 특성에 적합한 테이블 교체 기법을 제안한다.

  • PDF

Design and Implementation of HLRC Protocol for Software Distributed Shared Memory System (소프트웨어 분산공유메모리 시스템을 위한 HLRC 프로토콜의 설계 및 구현)

  • 윤희철;이상권;이준원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.624-626
    • /
    • 2000
  • 통신 오버헤드 및 거짓 공유(false sharing)등의 문제를 해결하기 위하여 소프트웨어 분산공유메모리 시스템을 위한 다양한 메모리 모델등이 제안되었다. HLRC(Home based Lazy Release)[1]는 Keleher에 의해 제안된 LRC[2] 모델에 home 개념을 도입한 모델로서 최근의 소프트웨어 분산공유 메모리 시스템에서 널리 채용되고 있다. 본 논문에서는 HLRC 모델을 기반으로 한 메모리 일관성 프로토콜의 설계, 구현, 그리고 성능 측정 결과에 관하여 기술한다.

  • PDF

Object-Size and Call-Site Tracing based Shared Memory Allocator for False Sharing Reduction in DSM Systems (분산 공유 메모리 시스템에서 거짓 공유를 줄이는 객체-크기 및 호출지-추적 기반 공유 메모리 할당 기법)

  • Lee, Jong-Woo;Park, Young-Ho;Yoon, Yong-Ik
    • Journal of Digital Contents Society
    • /
    • v.9 no.1
    • /
    • pp.77-86
    • /
    • 2008
  • False sharing is a result of co-location of unrelated data in the same unit of memory coherency, and is one source of unnecessary overhead being of no help to keep the memory coherency in multiprocessor systems. Moreover, the damage caused by false sharing becomes large in proportion to the granularity of memory coherency. To reduce false sharing in page-based DSM systems, it is necessary to allocate unrelated data objects that have different access patterns into the separate shared pages. In this paper we propose sized and call-site tracing-based shared memory allocator, shortly SCSTallocator. SCSTallocator places each data object requested from the different call-sites into the separate shared pages, and at the same time places each data object that has different size into different shared pages. Consequently data objects that have the different call-site and different object size prohibited from being allocated to the same shared page. Our observations show that our SCSTallocator outperforms the existing dynamic shared memory allocators. By combining the two existing allocation technique, we can reduce a considerable amount of false sharing misses.

  • PDF

공유 메모리를 갖는 다중 프로세서 컴퓨터 시스팀의 설계 및 성능분석

  • Choe, Chang-Yeol;Park, Byeong-Gwan;Park, Seong-Gyu;O, Gil-Rok
    • ETRI Journal
    • /
    • v.10 no.3
    • /
    • pp.83-91
    • /
    • 1988
  • This paper describes the architecture and the performance analysis of a multiprocessor system, which is based on the shared memory and single system bus. The system bus provides the pended protocol for the multiprocessor environment. Analyzing the processor utilization, address/data bus utilization and memory conflicts, we use a simulation model. The hit ratio of private cache memory is a major factor on the linear increase of the performance of a shared memory based multiprocessor system.

  • PDF

An Efficient Consistency Model for Software Distributed Shared Memory Systems (소프트웨어 분산 공유메모리 시스템 상에서 효율적인 일관성 모델)

  • 김태규;홍영식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.133-135
    • /
    • 1998
  • 분산 공유메모리 시스템(DSM)의 성능 향상을 위해 일관성 모델의 측면에서 많은여구가 진행되었다. 분산 공유메모리 시스템의 성능을 저하시키는 가장 큰 요인은 거짓 공유 문제와 별도의 통신비용 문제를 들 수 있는데 , 동기화 연산에 의한 일관성 유지 방법, 흠-기반 접근방법 등의 보다 완화된 메모리 모델로서, 이러한 문제점을 해결하려는 연구가 진행되어 왔고, 어느 정도 타당한 결과를 보았다. 본 논문에서는 동기화 연산에 의한 일관성 모델을 기초로 동적 흠-기반 접근 방법을 제안하며, 이것은 흠에서의 이점 및 부하를 여러 프로세서에게 분산시켜 시스템 전반의 성능 향상을 가져온다.

  • PDF

A Home Migrating Protocol for Distributed Shared Memory Systems (분산 공유메모리 시스템 상에서 홈-이전 프로토콜)

  • 김태규;홍영식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.603-605
    • /
    • 2000
  • 분산 공유메모리 시스템(DSM)의 성능 향상을 위해 일관성 모델의 측면에서 많은 연구가 진행되었다. 분산 공유메모리 시스템의 성능을 저하시키는 가장 큰 요인은 거짓공유 문제와 별도의 통신비용 문제를 들 수 있는데, 동기화 연산에 의한 일관성 유지 방법, 홈-기반 접근방법 등의 보다 완화된 메모리 모델로서 이러한 문제점을 해결하려는 연구가 진행되어 왔고, 어느 정도 타당한 결과를 보였다. 본 논문에서는 동기화 연산에 의한 일관성 모델을 기초로 동적 홈-기반 접근방법을 제안하며, 이것은 홈에서의 이점 및 부하를 여러 프로세서에게 분산시켜 시스템 전반의 성능향상을 가져온다.

  • PDF