DOI QR코드

DOI QR Code

Taking Point Decision Mechanism of Page-level Incremental Checkpointing based on Cost Analysis of Process Execution Time

프로세스 수행 시간의 비용 분석에 기반을 둔 페이지 단위 점진적 검사점의 작성 시점 결정 기법

  • 이상호 (서울대학교 컴퓨터공학부) ;
  • 허준영 (서울대학교 컴퓨터공학부) ;
  • 홍지만 (광운대학교 컴퓨터공학부)
  • Published : 2006.08.01

Abstract

Checkpointing is an effective mechanism that allows a process to resume its execution that was discontinued by a system failure without having to restart from the beginning. Especially, page-level incremental checkpointing saves only the modified pages of a process to minimize the checkpointing overhead. This means that in incremental checkpointing, the time consumed for checkpointing varies according to the amount of modified pages. Thus, the efficient interval of checkpointing must be determined on run-time of the process. In this paper, we present an efficient and adaptive page-level incremental checkpointing facility that is based on the cost analysis of process execution time. In our simulation, results show that the proposed mechanism significantly reduced the average process execution time compared with existing fixed-interval-based page-level incremental checkpointing.

검사점 기법은 시스템이 장애를 내재한 경우에 효과적으로 프로세스가 장애 지점으로부터 다시 시작 할 수 있게 하는 결함 허용 방법이다. 특히, 페이지 단위 점진적 검사점 기법은 검사점 사이에서 변경된 페이지 데이터만을 저장함으로써 검사정 기록 오버헤드를 감소시킨다. 이 기법은 매 검사점 사이에서 변화하는 데이터의 크기가 가변적이므로 검사점 수행 시간도 매번 변하는 성질을 갖고 있다. 기존의 연구로 고정적인 검사점 수행 시간을 갖는 경우에 대한 효율적인 검사점 작성 시점 결정 방법이 제시된 바 있다. 그러나 매 검사점 마다 가변적인 시간을 필요로 하는 페이지 단위 점진적 검사점 기법에 대한 효율적인 작성 시점 결정 방법은 아직 연구되지 않은 분야이다. 본 논문에서는 효율적이고 적응성 있는 검사점 작성 시점 결정 방법을 제안하고, 이 방법에 기반을 둔 적응성 있는 페이지 단위 점진적 검사점 기법을 보인다. 여러 가지 용용 프로그램의 실험 결과를 통하여, 제안한 방법을 사용하는 것이 기존의 고정적인 인터벌을 갖는 페이지 단위 점진적 검사점을 사용하는 경우보다 프로세스의 평균 수행 시간을 현저히 줄임을 알 수 있다.

Keywords

References

  1. J. Hong, S. Kim and Y. Cho, Cost Analysis of Optimistic Recovery Model for Forked Checkpointing, IEICE Transactions on Information and Systems, Vol.E86-D, No.9, pp.1534-1541, Sep., 2003
  2. J. Plank, M. Beck and G. Kingsley, Compiler-Assisted Memory Exclusion for Fast Checkpointing, IEEE Technical Committee on Operating Systems and Application Environments, Special Issue on Fault-Tolerance, pp.62-67, Dec., 1995
  3. A. Ziv and J. Bruck, An On-Line Algorithm for Checkpoint Placement, IEEE Transactions on Computers, Vol.46, No.9, pp. 976-985, Sep., 1997 https://doi.org/10.1109/12.620479
  4. J. Lawall and G. Muller, Efficient Incremental Checkpointing of Java Programs, IEEE Proceedings of the International Conference on Dependable Systems and Networks, pp.61-70, Jun., 2000 https://doi.org/10.1109/ICDSN.2000.857515
  5. J. Plank, M. Beck and G. Kingsley, and K. Li, Libckpt:Transparent Checkpointing under Unix, Usenix Winter Technical Conference, pp.213-223, Jan., 1995
  6. J. Plank, J. Xu, and R. Netzer, Compressed differences: An algorithm for fast incremental checkpointing, Technical Report CS-95-302, Aug., 1995
  7. J. Plank, K. Li and M. Puening, Diskless Checkpointing, IEEE Transactions on Parallel and Distributed Systems, Vol.9, No. 10, pp.303-308, Oct., 1998 https://doi.org/10.1109/71.730527
  8. J. Plank, Y. Chen, K. Li, M. Beck and G. Kingsley, Memory exclusion: optimizing the performance of checkpointing systems, Software Practice and Experience, Vol.29, No.2, pp.125-142, Feb., 1999 https://doi.org/10.1002/(SICI)1097-024X(199902)29:2<125::AID-SPE224>3.0.CO;2-7
  9. M. Beck, J. S. Plank and G. Kingsley, Compiler-Assisted Checkpointing, Technical Report of University of Tennessee, UT-CS-94-269, 1994
  10. A. Duda, The effects of checkpointing on program execution time. Information Processing Letters 16, pp.221-229, 1983 https://doi.org/10.1016/0020-0190(83)90093-5
  11. J. Heo, S. Yi Y. Cho, J. Hong, S.Y. Shin, Space-efficient Page-level Incremental Checkpointing. Proceedings of the 2005 ACM symposium on Applied computing, pp.1558-1562, 2005 https://doi.org/10.1145/1066677.1067026