• 제목/요약/키워드: Memory subsystem

검색결과 35건 처리시간 0.03초

WARP: Memory Subsystem Effective for Wrapping Bursts of a Cache

  • Jang, Wooyoung
    • ETRI Journal
    • /
    • 제39권3호
    • /
    • pp.428-436
    • /
    • 2017
  • State-of-the-art processors require increasingly complicated memory services for high performance and low power consumption. In particular, they request transfers within a burst in a wrap-around order to minimize the miss penalty of a cache. However, synchronous dynamic random access memories (SDRAMs) do not always generate transfers in the wrap-round order required by the processors. Thus, a memory subsystem rearranges the SDRAM transfers in the wrap-around order, but the rearrangement process may increase memory latency and waste the bandwidth of on-chip interconnects. In this paper, we present a memory subsystem that is effective for the wrapping bursts of a cache. The proposed memory subsystem makes SDRAMs generate transfers in an intermediate order, where the transfers are rearranged in the wrap-around order with minimal penalties. Then, the transfers are delivered with priority, depending on the program locality in space. Experimental results showed that the proposed memory subsystem minimizes the memory performance loss resulting from wrapping bursts and, thus, improves program execution time.

TCP/IP Using Minimal Resources in IoT Systems

  • Lee, Seung-Chul;Shin, Dongha
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.125-133
    • /
    • 2020
  • 본 연구에서는 Internet of Things(IoT) 시스템에서 최소의 메모리 및 프로세서 자원을 사용하는 4계층의 TCP/IP에 관하여 연구하고 설계한다. 본 연구에서 설계한 TCP/IP는 다음과 같은 특징을 가지고 있다. 첫째, 메모리 할당량을 최소화하여 메모리 자원을 최소로 사용한다. 둘째, 메모리 복사량을 최소화하여 프로세서 자원을 최소로 사용한다. 셋째, TCP/IP의 수행 시간이 고정 시간에 완료될 수 있다. 넷째, 메모리 누수 문제가 발생하지 않는다. 본 연구에서 도출된 메모리 할당량 및 복사량에 대한 최소 자원 기준은 기 구현된 IoT 시스템의 통신 서브시스템이 효율적으로 구현되었는지를 점검하기 위해 유용하게 사용될 수 있다. 최근 리눅스 재단에서 발표한 공개 소스 커널인 Zephyr의 통신 서브시스템의 메모리 할당량 및 복사량을 측정한 결과, 본 연구에서 도출한 최소 자원 기준보다 더 크다는 것을 발견하였다. 본 연구에서 제안한 설계 방법에 따라 Zephyr 통신 서브시스템을 개선하여 메모리 할당량 및 복사량이 각각 약 39% 및 67% 감소함을 확인하였으며, 이에 따른 수행 시간도 약 28% 감소하였다.

임베디드 시스템을 위한 메모리 서브시스템 파라미터의 자동 검출 (Automatic Detection of Memory Subsystem Parameters for Embedded Systems)

  • 하태준;서상민;전보성;이재진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.350-354
    • /
    • 2009
  • 임베디드 시스템에서 프로그램 성능을 향상시키기 위해서는 시스템의 하드웨어를 이해하고 활용하는 것이 중요하다. 특히 메모리 서브시스템에 대한 이해는 프로그램을 주어진 하드웨어에 최적화하여 성능을 향상시키는 데 큰 역할을 한다. 본 논문에서는 cache, TLB, DRAM과 같은 메모리 서브시스템의 파라미터를 자동적으로 검출하는 기존의 알고리즘을 임베디드 시스템에 적용해 보고, 새롭게 메모리 뱅크 개수 검출 알고리즘을 제안한다. 제안한 알고리즘은 실제 여러 가지 임베디드 시스템 환경에서 실험을 통해 검증하였고, 실험 결과 메모리 서브시스템의 파라미터를 정확히 검출해 낼 수 있는 것을 확인하였다.

학습과 기억의 생물학적 기초(I):신경심리학적 개관 (The Biological Base of Learing and Memory(I):A Neuropsychological Review)

  • 김문수
    • 인지과학
    • /
    • 제7권3호
    • /
    • pp.7-36
    • /
    • 1996
  • 본 논문에서는 인간을 대상으로 한 신경심리학적 연구결과들을 중심으로 기억의 뇌생리적 기초에 관하여 지금까지 알려진 바를 개관하고자 하였다. 현재 인지심리학자들은 기억이 하나의 단일한 체계가 아니라 여러가지 독자적인 하위체계들로 구분된다고 생각한다. 이러한 다중기억체계의 관점을 따라 본 논문에서는 뇌의 어느부위가 손상될때 어떤 종류의 기억에 장애가 생기는가,그리고 뇌영상 기법을 사용하요 특정 기억과제를 수행하는 도중에 뇌의 어느 부위가 그 제시방식에 따라 약간씩 다르지만 대개 후두염,두정엽,그리고 측두엽의 경계선을 중심으로 한 비교적 넓은 부위가 중요한 것으로 보인다. 장기기억의 경우,그 한 하위체계인 암묵기억은 하나의 단일한 기억체계가 아니어서 어떤 학습과제가 사용되는가에 다라 관련되는 부위가 많이 달라진다. 반면에 외현기억의 형성(즉,응고화)에는 내측측두엽이 결정적인 역할을 한다는 사실을 잘 알려져 있다. 일화기억과 의미기억의 저장 그리고/또는 인출에는 측두피질과 전두전피질이 중요한 역할을 하는것으로 보인다. 끝으로,장기기억의 저장장소에 관한 최근의 견해가 소개되었다.

  • PDF

Distributed Simulator for General Control System in CEMTool

  • Lee, Tai-Ri;Lee, Young-Sam;Lee, Kwan-Ho;Kwon, Wook-Hyun
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.2230-2234
    • /
    • 2003
  • This paper proposes a distributed simulator for general control system in CEMTool. Systems can be described by SIMTool likes the simulink in Matlab. For distributed simulation, we can seperate any system into several parallel subsystems in SIMTool. The number of parallel subsystem can be determined by the system's property. After seperation, parallel simulator will do initialization, one-step-ahead simulation, block-distribution and ordering and so on. Finally, simulator will create independent C codes and executive files for each subsystem. The whole system is fulfilled by several PCs, and each PC executes one subsystem. There are communications among these subsystem using reflective memory or ethernet. We have made several experiments, and the 5-stand cold rolling mill control system is our main target. The result of parallel simulation has shown effective speedup in comparison with one pc simulation.

  • PDF

동적 메모리 사용 감소를 위한 OSEK OS 커널 구현 메커니즘 (OSEK PS Kernel Mechanisms for Reducing Dynamic Memory Usage)

  • 임진택;금한홍;박지용;홍성수
    • 한국자동차공학회논문집
    • /
    • 제17권3호
    • /
    • pp.127-141
    • /
    • 2009
  • While the ever-increasing complexity of automotive software systems can be effectively managed through the adoption of a reliable real-time operating system (RTOS), it may incur additional resource usage to a resultant system. Due to the mass production nature of the automotive industry, reducing physical resources used by automotive software is of the utmost importance for cost reduction. OSEK OS is an automotive real-time kernel standard specifically defined to address this issue. Thus, it is very important to develop and exploit kernel mechanisms such that they can achieve minimal resource usage in the OSEK OS implementation. In this paper, we analyze the task subsystem, resource subsystem, application mode and conformance classes of OSEK OS as well as the OSEK Implementation Language (OIL). Based on our analysis, we in turn devise and implement kernel mechanisms to minimize the dynamic memory usage of the OSEK OS implementation. Finally, we show that our mechanisms effectively reduce the memory usage of OSEK OS and applications.

SSD를 위한 최적화 파일시스템 (An Optimized File System for SSD)

  • 박제호
    • 반도체디스플레이기술학회지
    • /
    • 제9권2호
    • /
    • pp.67-72
    • /
    • 2010
  • Recently increasing application of flash memory in mobile and ubiquitous related devices is due to its non-volatility, fast response time, shock resistance and low power consumption. Following this trend, SSD(Solid State Disk) using multiple flash chips, instead of hard-drive based storage system, started to widely used for its advantageous features. However, flash memory based storage subsystem should resolve the performance bottleneck for writing in perspective of speed and lifetime according to its disadvantageous physical property. In order to provide tangible performance, solutions are studied in aspect of reclaiming of invalid regions by decreasing the number of erasures and distributing the erasures uniformly over the whole memory space as much as possible. In this paper, we study flash memory recycling algorithms with multiple management units and demonstrate that the proposed algorithm provides feasible performance. The proposed method utilizes the partitions of the memory space by utilizing threshold values and reconfigures the management units if necessary. The performance of the proposed policies is evaluated through a number of simulation based experiments.

다중 플래시 메모리 기반 파일시스템의 성능개선을 위한 파일시스템 (File System for Performance Improvement in Multiple Flash Memory Chips)

  • 박제호
    • 반도체디스플레이기술학회지
    • /
    • 제7권3호
    • /
    • pp.17-21
    • /
    • 2008
  • Application of flash memory in mobile and ubiquitous related devices is rapidly being increased due to its low price and high performance. In addition, some notebook computers currently come out into market with a SSD(Solid State Disk) instead of hard-drive based storage system. Regarding this trend, applications need to increase the storage capacity using multiple flash memory chips for larger capacity sooner or later. Flash memory based storage subsystem should resolve the performance bottleneck for writing in perspective of speed and lifetime according to its physical property. In order to make flash memory storage work with tangible performance, reclaiming of invalid regions needs to be controlled in a particular manner to decrease the number of erasures and to distribute the erasures uniformly over the whole memory space as much as possible. In this paper, we study the performance of flash memory recycling algorithms and demonstrate that the proposed algorithm shows acceptable performance for flash memory storage with multiple chips. The proposed cleaning method partitions the memory space into candidate memory regions, to be reclaimed as free, by utilizing threshold values. The proposed algorithm handles the storage system in multi-layered style. The impact of the proposed policies is evaluated through a number of experiments.

  • PDF

가상 I/O 세그먼트를 이용한 OneNAND 플래시 메모리의 읽기 성능 향상 기법 (Improving the Read Performance of OneNAND Flash Memory using Virtual I/O Segment)

  • 현승환;고건
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.636-645
    • /
    • 2008
  • OneNAND 플래시는 NAND 플래시와 NOR 플래시의 장점을 모두 가진 고성능 하이브리드 플래시 메모리이다. OneNAND 플래시는 NAND 플래시의 장점들을 그대로 가지고 있을 뿐 아니라, 그동안 NAND 플래시의 단점으로 지적되던 느린 읽기 성능을 획기적으로 개선하였다. 그 결과 OneNAND 플래시는 휴대폰 및 디지털 카메라, PMP, 휴대용 게임기와 같은 고성능 휴대용 정보기기를 위한 최적의 스토리지 솔루션으로 각광받고 있다. 하지만 Linux를 비롯하여 현재 사용되고 있는 대부분의 범용 운영체제들은 가상 메모리와 블록 I/O 계층 구조의 제약으로 인해 OneNAND 플래시의 뛰어난 위기 성능을 제대로 활용하지 못하는 문제를 안고 있다. 이에 본 연구에서는 기존의 소프트웨어 계층 구조 하에서 OneNAND 플래시의 읽기 성능을 최대한 활용하기 위한 기법인 가상 I/O 세그먼트의 활용을 제안한다. 실제 구현을 통한 실험 결과는 제안된 기법이 OneNAND 플래시의 읽기 수행 시간을 기존에 비해 최고 54%까지 단축할 수 있음을 증명하였다.

Scratch-Pad Memory를 위한 코드 변환 기법 (Code Transformation Techniques for Scratch-Pad Memory)

  • 문대경;이재진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.577-579
    • /
    • 2004
  • 전원을 전적으로 배터리에 의존하는 모바일 임베디드 시스템은 배터리 용량의 한계 때문에 효율적인 에너지의 사용이 매우 중요하다. 특히 memory subsystem은 전체 system에서 소모되는 에너지에서 큰 비중을 차지한다. 이 논문은 성능 면에서 cache의 대안이 되고, cache보다 간단한 구조 때문에 전력소모가 훨씬 적은 on-chip scratch-pad memory(SPM)를 효율적으로 이용할 수 있는 소스 코드 변환 방법 및 SPM 관리방법을 제안한다. 각 함수 단위로 코드 변환을 하며, 어떤 변수를 SPM에 할당하기 위한 소스코드 변환을 했을 때, 소스코드 분석만으로 알 수 있는 변수의 정적인 참조 횟수를 가중치로 고려하여, 코드 변환 후 메모리 참조에 의한 실행 시간과 에너지 소모를 계산하고 이를 바탕으로 SPM에 할당한 변수를 결정한 다음 실제 그 코드 변환을 적용한다. 제안된 코드 변환은 컴파일러에 의해 자동화 될 수 있다. 10개의 임베디드 벤치마크 프로그램을 이용하여 본 논문에서 제안하는 방법의 성능 평가를 한 결과, 실행 시간은 평균 23% 향상되고 에너지 소모는 평균 49% 감소함을 알 수 있다.

  • PDF