• 제목/요약/키워드: Page prefetching

검색결과 9건 처리시간 0.022초

NAND 플래시 메모리용 파일 시스템 계층에서 프로그램의 페이지 참조 패턴을 고려한 캐싱 및 선반입 정책 (Caching and Prefetching Policies Using Program Page Reference Patterns on a File System Layer for NAND Flash Memory)

  • 김경산;김성조
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.777-778
    • /
    • 2006
  • In this thesis, we design and implement a Flash Cache Core Module (FCCM) which operates on the YAFFS NAND flash memory. The FCCM applies memory replacement policy and prefetching policy based on the page reference pattern of applications. Also, implement the Clean-First memory replacement technique considering the characteristics of flash memory. In this method the decision is made according to page hit to apply prefetched waiting area. The FCCM decrease I/O hit frequency up to 37%, Compared with the linux cache and prefetching policy. Also, it operated using less memory for prefetching(maximum 24% and average 16%) compared with the linux kernel.

  • PDF

APC: 가상 메모리 시스템에서 적응적 페이지 선반입 제어 기법 (APC: An Adaptive Page Prefetching Control Scheme in Virtual Memory System)

  • 안우현;양종철;오재원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권3호
    • /
    • pp.172-183
    • /
    • 2010
  • 가상 메모리 시스템(VM)에서 페이지 부재로 발생하는 디스크 I/O를 감소시키기 위해 페이지 선반입 기법을 사용한다. 이 기법은 부재 페이지와 함께 추가적인 페이지들을 한 번의 디스크 I/O로 미리 읽는다. 그런데, 4.4BSD와 같은 운영체제의 VM은 응용 프로그램의 페이지 참조 패턴을 고려하지 않고 항상 가능한 많은 페이지들을 선반입하고자 한다. 이 방법은 선반입된 페이지들 중 일부만 사용하는 참조패턴에서 디스크 참조 시간을 증가시키며, 유용한 페이지들을 메모리에서 내보내는 메모리 오염을 야기한다. 이런 문제를 해결하기 위해 본 논문은 적응적 페이지 선반입 제어 기법(APC)을 제안한다. APC는 선반입 페이지들 중에서 메모리에 존재하는 동안 참조된 페이지들의 비율을 프로세스 단위로 주기적으로 측정하고, 이 비율을 사용하여 4.4BSD VM이 선반입하고자 하는 페이지의 개수를 조절한다. 그래서 실행도중 페이지 참조 패턴이 바뀌더라도 적절한 수의 페이지를 선반입할 수 있다. 성능 검증을 위해 APC를 4.4BSD 기반의 FreeBSD 6.2에 구현하였으며, SOR, SMM, FFT 벤치마크를 통해 성능을 측정하였다. 성능 측정 결과 APC는 기존 BSD VM보다 벤치마크의 실행 시간을 최대 57% 단축하였다.

NAND 플래시 메모리용 파일 시스템 계층에서 프로그램의 페이지 참조 패턴을 고려한 캐싱 및 선반입 정책 (Caching and Prefetching Policies Using Program Page Reference Patterns on a File System Layer for NAND Flash Memory)

  • 박상오;김경산;김성조
    • 정보처리학회논문지A
    • /
    • 제14A권4호
    • /
    • pp.235-244
    • /
    • 2007
  • 메인메모리와 저장장치사이의 속도차이에 대한 소프트웨어적 보완 기법으로서 캐싱 및 선반입 정책이 대부분의 시스템에서 사용되고 있다. 본 논문에서는 프로그램의 페이지 참조 패턴을 고려하지 않은 리눅스 커널의 캐싱 및 선반입 정책을 개선하고자 NAND 플래시 메모리용 파일시스템 계층에서 동작하는 Flash Cache Core Module(FCCM)을 YAFFS 상에서 설계 및 구현하였다. FCCM은 커널의 안정성과 호환성을 지원하기위해 커널과 독립적인 구조를 가지며, 플래시 메모리의 특성을 고려한 Dirty-Last 메모리 교체 기법과 페이지의 히트 여부에 따른 선반입 페이지 대기큐를 구현하였다. FCCM은 리눅스의 캐시 및 선반입 정책과 비교해 I/O 횟수와 요구되는 선반입양이 각각 최대 55%(평균 20%) 및 최대 55%(평균 24%)까지 감소했다.

페이지 접근 정보에 기반한 효율적인 명령어 캐쉬 선인출 기법 (An Efficient Instruction Prefetching Scheme Based on the Page Access Information)

  • 신숭현;김철홍;전주식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권5호
    • /
    • pp.306-315
    • /
    • 2006
  • 컴퓨터 시스템의 1차 캐쉬 적중률은 시스템의 성능을 평가함에 있어 가장 중요한 요소 중 하나이다. 하위 메모리 구조로부터 1차 캐쉬로의 선인출은 1차 캐쉬의 적중률을 증가시키기 위해 사용되는 대표적인 기술 중 하나이다. 본 논문에서는 명령어 캐쉬의 선인출 효율은 높이고 선인출에 소모되는 비용은 감소시키는 재 접근 페이지 선인출 정책을 제안하고자 한다. 재 접근 페이지 선인출 정책은 수행되는 명령어들의 소속 페이지를 추적하여, 이 정보를 바탕으로 일정 횟수 이상 같은 페이지를 접근하는 경우에 한하여 선인출을 수행함으로써, 명령어 캐쉬로의 선인출 횟수는 줄이고 선인출 성공률은 향상시킨다. 또한, 일반적인 컴퓨터 시스템에서 하나의 2차 캐쉬 블록에 여러 개의 1차 캐쉬 블록이 포함되는 특성을 이용하여 미스 블록과 선인출 블록이 같은 2차 캐쉬 블록에 포함된 경우로 선인출을 한정함으로써 선인출에 소모되는 비용을 줄인다. 모의 실험에 따르면 제안하는 구조는 최대 6.7%의 성능향상을 보인다.

고성능 PCM&DRAM 하이브리드 메모리 시스템 (High Performance PCM&DRAM Hybrid Memory System)

  • 정보성;이정훈
    • 대한임베디드공학회논문지
    • /
    • 제11권2호
    • /
    • pp.117-123
    • /
    • 2016
  • In general, PCM (Phase Change Memory) is unsuitable as a main memory because it has limitations: high read/write latency and low endurance. However, the DRAM&PCM hybrid memory with the same level is one of the effective structures for a next generation main memory because it can utilize an advantage of both DRAM and PCM. Therefore, it needs an effective page management method for exploiting each memory characteristics dynamically and adaptively. So we aim reducing an access time and write count of PCM by using an effective page replacement. According to our simulation, the proposed algorithm for the DRAM&PCM hybrid can reduce the PCM access count by around 60% and the PCM write count by 42% given the same PCM size, compared with Clock-DWF algorithm.

MySQL InnoDB엔진의 Secondary Index Scan을 위한 Prefetch 기능 구현 (Implementation of a Prefetch method for Secondary Index Scan in MySQL InnoDB Engine)

  • 황다솜;이상원
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.208-212
    • /
    • 2017
  • 플래시 SSD는 기존 하드디스크에 비해 높은 에너지 효율성, 외부 충격에 강한 내구성, 높은 입출력 처리량 등 여러 장점을 지니고 있다. 따라서 3D-NAND 및 V-NAND 등 단위 용량 당 비용을 획기적으로 개선하는 최신 기술의 등장과 맞물려서, 플래시 SSD가 많은 영역에서 하드디스크를 급격하게 대체하고 있다. 하지만, 주로 하드디스크를 가정하고 개발된 기존 데이터베이스 엔진은 플래시 SSD의 특성 (예를 들어, 내부 병렬성)을 제대로 활용하지 못하고 있다. 본 논문에서는, 더 빠른 질의 처리를 위해 플래시 SSD에 내재한 내부 병렬성을 활용하는 방법으로, MySQL InnoDB엔진에서 보조 인덱스(Secondary Index)를 이용한 스캔을 위해 비 동기적 입출력을 활용한 Prefetch 기능을 구현하였다. Prefetching을 사용한 스캔 기법은, 기존 InnoDB엔진의 보조 인덱스 스캔과 비교해서, 데이터 페이지 크기가 16KB일 경우, 약 3배 이상, 데이터 페이지 크기가 4KB일 경우, 약 4.2배 이상 성능 향상을 보인다.

객체관계형 DBMS에서 타입수준 액세스 패턴을 이용한 선인출 전략 (Prefetching based on the Type-Level Access Pattern in Object-Relational DBMSs)

  • 한욱신;문양세;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.529-544
    • /
    • 2001
  • 선인출은 데이타베이스 관리 시스템에서 클라이언트와 서버 사이에 발생하는 라운드트립을 줄 일 수 있는 효과적인 방법이다. 본 논문에서는 타입수준 액세스 패턴과 타입수준 지역성이라는 새로운 개 념을 제시하고, 이 개념에 기반한 새로운 선인출 방법을 제시한다. 타입수준 액세스 패턴이란 항해에 사 용된 애트리뷰트들의 패턴이며, 타입수준 엑세스 지역성이란 항해 응용에서 타입수준 액세스 패턴이 반복 적으로 나타나는 현상이다. 기존의 선인출 방법은 항해 응용에서 액세스된 객체 흑은 페이지 식별자들간의 패턴인 객체수준 혹은 페이지수준 액세스 패턴을 선인룰에 이용하는데, 이 방법은 동일한 객체 혹은 페이 지들이 반복적으로 액세스될 때에만 선인출 효과를 가지는 문제점이 있다. 이에 반해 제안하는 방법은 항 해 응용에서 같은 객체들이 반복적으로 액세스되지 않더라도 같은 애트리뷰트들이 반복적으로 참조되는 경우. 즉, 타입수준 액세스 지역성이 존재하면, 효과적인 선인출을 수행하는 장점이 있다 객체관계형 DHMS(ORDBMS)의 많은 항해 응용들은 타입수준 액세스 지역성이 있다 따라서, 제안하는 방법을 ORDBMS에 적용하면 라운드트립의 횟수를 효과적으로 줄일 수 있고 성능을 크게 향상시킬 수 있다. 제 안하는 방법의 우수성을 증명하기 위해, ORDBMS 프로토타입에 구현하여 많은 종류의 실험을 수행하였 다. 실험결과, 복잡한 구조를 탐색하는 007 벤치마크나 실제 GIS 응용에서, 제안하는 선인출 방법은 단순 한 요구인출 방법 및 최근의 문맥 기반 선인출 방법과 비교하여 라운드트림 횟수를 수십 배에서 수백배가 지 줄이고 성능을 수배가지 향상시켰다. 이와 같은 결과로 볼 때, 제안하는 방법은 객체지향 항해 응용의 성능을 크게 향상시키는 결과로서, 상용 ORDBMS에 구현될 수 있는 실용적인 결과라 믿는다.

  • PDF

Prefetch R-tree: 디스크와 CPU 캐시에 최적화된 다차원 색인 구조 (Prefetch R-tree: A Disk and Cache Optimized Multidimensional Index Structure)

  • 박명선
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.463-476
    • /
    • 2006
  • R-tree는 일반적으로 트리 노드의 크기를 디스크 페이지의 크기와 같게 함으로써 I/O 성능이 최적화 되도록 구현한다. 최근에는 주메모리 환경에서 CPU 캐시 성능을 최적화하는 R-tree의 변형이 개발되었다. 이는 노드의 크기를 캐시 라인 크기의 수 배로 하고 MBR에 저장되는 키를 압축하여 노드 하나에 더 많은 엔트리를 저장함으로써 성능을 높였다. 그러나, 디스크 최적 R-tree와 캐시 최적 R-tree의 노드 크기 사이에는 수십-수백 바이트와 수-수십 킬로바이트라는 큰 차이가 있으므로, I/O 최적 R-tree는 캐시 성능이 나쁘고 캐시 최적 R-tree는 디스크 I/O 성능이 나쁜 문제점을 가지고 있다. 이 논문에서는 CPU 캐시와 디스크 I/O에 모두 최적인 R-tree, PR-tree를 제안한다. 캐시 성능을 위해 PR-tree 노드의 크기를 캐시 라인 크기보다 크게 만든 다음 CPU의 선반입(prefetch) 명령어를 이용하여 캐시 실패 횟수를 줄이고, 트리 노드를 디스크 페이지에 낭비가 적도록 배치함으로써 디스크 I/O 성능도 향상시킨다. 또한, 이 논문에서는 PR-tree에서 검색 연산을 수행하는데 드는 캐시 실패 비용을 계산하는 분석 방법을 제시하고, 최적의 캐시와 I/O 성능을 보이는 PR-tree를 구성하기 위해, 가능한 크기의 내부 단말 노드, 중간 노드를 갖는 PR-tree 생성하여 성능을 비교하였다. PR-tree는 디스크 최적 R-tree보다 삽입 연산은 3.5에서 15.1배, 삭제 연산은 6.5에서 15.1배, 범위 질의는 1.3에서 1.9배, k-최근접 질의는 2.7에서 9.7배의 캐시 성능 향상이 있었다. 모든 실험에서 매우 작은 I/O 성능 저하만을 보였다.

ABRN:주문형 멀티미디어 데이터 베이스 서비스 시스템을 위한 버퍼 교체 알고리즘 (ABRN:An Adaptive Buffer Replacement for On-Demand Multimedia Database Service Systems)

  • 정광철;박웅규
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1669-1679
    • /
    • 1996
  • In this paper, we address the problem of how to replace huffers in multimedia database systems with time-varying skewed data access. The access pattern in the multimedia database system to support audio-on-demand and video-on-demand services is generally skewed with a few popular objects. In addition the access pattem of the skewed objects has a time-varying property. In such situations, our analysis indicates that conventional LRU(least Recently Used) and LFU(Least Frequently Used) schemes for buffer replacement algorithm(ABRN:Adaptive Buffer Replacement using Neural suited. We propose a new buffer replacement algorithm(ABRN:Adaptive Buffer Replacement using Neural Networks)using a neural network for multimedia database systems with time-varying skewed data access. The major role of our neural network classifies multimedia objects into two classes:a hot set frequently accessed with great popularity and a cold set randomly accessed with low populsrity. For the classification, the inter-arrival time values of sample objects are employed to train the neural network.Our algorithm partitions buffers into two regions to combine the best roperties of LRU and LFU.One region, which contains the 핫셋 objects, is managed by LFU replacement and the other region , which contains the cold set objects , is managed by LRUreplacement.We performed simulation experiments in an actual environment with time-varying skewed data accsee to compare our algorithm to LRU, LFU, and LRU-k which is a variation of LRU. Simulation resuults indicate that our proposed algorthm provides better performance as compared to the other algorithms. Good performance of the neural network-based replacement scheme means that this new approach can be also suited as an alternative to the existing page replacement and prefetching algorithms in virtual memory systems.

  • PDF