DOI QR코드

DOI QR Code

Efficient Storage Management Scheme for Graph Historical Retrieval

그래프 이력 데이터 접근을 위한 효과적인 저장 관리 기법

  • 김기훈 (충북대학교 정보통신공학과) ;
  • 김이나 (충북대학교 빅데이터협동과정) ;
  • 최도진 (충북대학교 정보통신공학과) ;
  • 김민수 (충북대학교 정보통신공학과) ;
  • 복경수 (충북대학교 정보통신공학과) ;
  • 유재수 (충북대학교 정보통신공학과)
  • Received : 2017.11.15
  • Accepted : 2017.12.13
  • Published : 2018.02.28

Abstract

Recently, various graph data have been utilized in various fields such as social networks and citation networks. As the graph changes dynamically over time, it is necessary to manage the graph historical data for tracking changes and retrieving point-in-time graphs. Most historical data changes partially according to time, so unchanged data is stored redundantly when data is stored in units of time. In this paper, we propose a graph history storage management method to minimize the redundant storage of time graphs. The proposed method continuously detects the change of the graph and stores the overlapping subgraph in intersection snapshot. Intersection snapshots are connected by a number of delta snapshots to maintain change data over time. It improves space efficiency by collectively managing overlapping data stored in intersection snapshots. We also linked intersection snapshots and delta snapshots to retrieval the graph at that point in time. Various performance evaluations are performed to show the superiority of the proposed scheme.

최근 소셜 네트워크, 인용 네트워크 등 여러 분야에서 다양한 그래프 데이터가 활용되고 있다. 시간에 따라 그래프가 동적으로 변화함에 따라 변경 내용 추적 및 특정 시점 그래프 검색을 위해 그래프 이력 데이터를 관리하는 것이 필요하다. 대부분의 이력 데이터는 시간에 따라 부분적인 변화가 발생하기 때문에 시간 단위로 데이터를 저장할 경우 변경되지 않은 데이터가 중복 저장된다. 본 논문에서는 시간별 그래프의 중복 저장을 최소화하기 위한 그래프 이력 저장 관리 기법을 제안한다. 제안하는 기법은 그래프의 변화를 계속적으로 탐지하여 과거 그래프와 중복되는 서브 그래프를 하나의 중복 스냅샷에 저장한다. 중복 스냅샷에는 다수의 델타 스냅샷이 연결되어 각 시간에 따른 변화 데이터를 유지한다. 중복 스냅샷에 저장된 중복 데이터를 공통으로 관리하여 공간의 효율을 향상시킨다. 또한, 해당 시점의 그래프를 탐색하기 위해서 중복 스냅샷과 델타 스냅샷을 연결하였다. 제안하는 기법의 우수성을 보이기 위해 다양한 성능평가를 수행한다.

Keywords

Acknowledgement

Supported by : 한국연구재단, 한국에너지기술평가원(KETEP)

References

  1. J. E. Gonzalez, R. S. Xin, A. Dave, D. Crankshaw, M. J. Franklin, and I. Stoica, "GraphX: graph processing in a distributed dataflow framework," Proc. USENIX Symposium on Operating Systems Design and Implementation, pp.599-613, 2014.
  2. G. Malewicz, M. Austern, A. Bik, J. Dehnert, I. Horn, N. Leiser, and G. Czajkowski, "Pregel: a system for large-scale graph processing," Proc. ACM SIGMOD International Conference on Management of Data, pp.135-146, 2010.
  3. 임종태, 복경수, 유재수, "대용량 그래프 환경에서 스카이라인을 이용한 서브 그래프 유사도 측정 기법," 한국콘텐츠학회 종합학술대회, pp.47-48, 2017.
  4. 유병국, 김순홍, "소셜네트워크 분석을 통한 마케팅 전략," 한국콘텐츠학회논문지, 제13권, 제5호, pp.396-407, 2013. https://doi.org/10.5392/JKCA.2013.13.05.396
  5. A. Ching, S. Edunov, M. Kabiljo, D. Logothetis, and S. Muthukrishnan, "One trillion edges: Graph processing at facebook-scale," Proceedings of the VLDB Endowment, Vol.8, No.12, pp.184-1815, 2015.
  6. https://carestruck.org/happens-internet-minute
  7. H. He and A. K. Singh, "Graphs-at-a-time: query language and access methods," Proc. ACM SIGMOD International Conference on Management of Data, pp.405-418, 2008.
  8. K. Semertzidis and E. Pitoura, "Time Traveling in Graphs using a Graph Database," Proc. Workshops of the EDBT/ICDT 2016 Joint Conference, 2016.
  9. A. G. Labouseur, P. W. Olsen, and J. H. Hwang, "Scalable and Robust Management of Dynamic Graph Data," Proc. International Workshop on Big Dynamic Distributed Data, pp.43-48, 2013.
  10. B. Salzberg and V. Tsotras, "Comparison of access methods for time-evolving data," ACM Computing Surveys, Vol.31, No.2, pp.158-221,1999. https://doi.org/10.1145/319806.319816
  11. K. Semertzidis, E. Pitoura, and K. Lillis, "TimeReach: Historical Reachability Queries on Evolving Graphs," Proc. International Conference on Extending Database Technology, pp.121-132, 2015.
  12. U. Khurana and A. Deshpande, "Efficient snapshot retrieval over historical graph data," Proc. International Conference on Data Engineering, pp.997-1008, 2013.
  13. D. A. Bader, J. Berry, A. Amos-Binks, D. Chavarria-Miranda, C. Hastings, K. Madduri, and S. C. poulos, "STINGER: Spatio-temporal interaction networks and graphs (STING) extensible representation," Georgia Institute of Technology, Tech. Rep., 2009.
  14. K. Iwabuchi, S. Sallinen, R.Pearce, B. Van Essen, M. Gokhale, and S. Matsuoka, "Towards a Distributed Large-Scale Dynamic Graph Data Store," Proc. International Parallel and Distributed Processing Symposium Workshops, pp.892-901, 2016.
  15. P. Macko, V. J. Marathe, D. W. Margo, and M. I. Seltzer, "LLAMA: Efficient graph analytics using Large Multiversioned Arrays," Proc. International Conference on Data Engineering, pp.363-374, 2015.
  16. Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, and H. van der Vorst, "Templates for the Solution of Algebraic Eigenvalue Problems: A Practical Guide," SIAM, pp.315-336, 2000.