DOI QR코드

DOI QR Code

Incremental Processing Scheme for Graph Streams Considering Data Reuse

데이터 재사용을 고려한 그래프 스트림의 점진적 처리 기법

  • 조중권 (충북대학교 빅데이터학과) ;
  • 한진수 (충북대학교 정보통신학과) ;
  • 김민수 (충북대학교 정보통신학과) ;
  • 최도진 (충북대학교 정보통신학과) ;
  • 복경수 (충북대학교 정보통신학과) ;
  • 유재수 (충북대학교 정보통신학과)
  • Received : 2017.10.17
  • Accepted : 2017.10.31
  • Published : 2018.01.28

Abstract

Recently, as the use of social media and IoT has increased, large graph streams has been generating and studies on real-time processing for them have been actively carrying out. In this paper we propose a incremental graph stream processing scheme that reuses previous result data when the graph changes continuously. We also propose a cost model to selectively perform incremental processing and static processing. The proposed cost model computes the predicted value of the detection cost and the processing cost of the recalculation area based on the actually processed history and performs the incremental processing when the incremental processing is more profit than the static processing. The proposed incremental processing increases the efficiency by processing only the part that changes when the graph update occurs. Also, by collecting only the previous result data of the changed part and performing the incremental processing, the disk I/O costs are reduced. It is shown through various performance evaluations that the proposed scheme outperforms the existing schemes.

최근 소셜 미디어, IoT 등에 대한 활용이 증가됨에 따라 대용량의 그래프 스트림이 생성되고 있으며 그래프 스트림을 실시간으로 처리하기 위한 많은 연구들이 진행되고 있다. 본 논문에서는 그래프가 지속적으로 변경될 때 이전 결과 데이터를 재사용하는 점진적인 그래프 스트림 처리 기법을 제안한다. 또한, 점진적 처리와 정적인 처리를 선택적으로 수행하기 위한 비용 모델을 제안한다. 제안하는 비용 모델은 실제 처리된 이력을 바탕으로 재계산 영역의 탐색 비용 및 처리 비용의 예측 값을 계산하여 점진적 처리가 정적인 처리보다 이득인 경우 점진적 처리를 수행한다. 제안하는 점진적 처리는 그래프 갱신이 발생하면 변경되는 부분만을 처리하여 효율성을 증가시킨다. 또한, 변경되는 부분의 이전 결과 데이터만을 수집하여 점진적인 처리를 수행함으로써 디스크 I/O 비용을 감소시킨다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법에 비해 성능이 우수함을 보인다.

Keywords

References

  1. O. Salem, L. Yaning, and M. Ahmed, "Anomaly detection in medical wireless sensor networks," Computing Science and Engineering, Vol.7, No.4, pp.272-284, 2013. https://doi.org/10.5626/JCSE.2013.7.4.272
  2. F. Elijorde, K. Sungho, and L. Jaewan, "A wind turbine fault detection approach based on cluster analysis and frequent pattern mining," KSII Transactions on Internet and Information Systems, Vol.8, No.2, pp.664-677, 2014. https://doi.org/10.3837/tiis.2014.02.020
  3. Y. A. Kim and G. W. Park, "Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network," Knowledge-Based Systems, Vol.54, pp.230-242, 2013. https://doi.org/10.1016/j.knosys.2013.09.011
  4. 서복일, 김재인, 황부현, "스트림 데이터 환경에서 배치 가중치를 이용하여 사용자 특성을 반영한 빈발항목 집합 탐사," 한국콘텐츠학회논문지, 제11권, 제1호, pp.56-64, 2011. https://doi.org/10.5392/JKCA.2011.11.1.056
  5. https://carestruck.org/happens-internet-minute/
  6. G. Malewicz, H. M. Austern, J. A. Bik, J. Dehnert, I. Horn, N. Leiser, and G. M. Czajkowski, "Pregel: a system for large-scale graph processing," Proc. ACM SIGMOD International Conference on Management of data, pp.135-146, 2010.
  7. Y. Low, J. Gonzalez, A. Kyrola, D. Bickson, C. Guestrin, and J. Hellerstein, "Distributed GraphLab: A Framework for Machine Learning in the Cloud," Proceedings of the VLDB Endowment, Vol.5, No.8, pp.716-727, 2012. https://doi.org/10.14778/2212351.2212354
  8. J. Gonzalez, Y. Low, H. Gu, D. Bickson, and C. Guestrin, "PowerGraph: Distributed graphparallel computation on natural graphs," Proc. USENIX Symposium on Operating Systems Design and Implementation, pp.17-30, 2012.
  9. R. S. Xin, J. Gonzalez, F. J. Michael, and S. Ion, "Graphx: A resilient distributed graph system on spark," Proc. International Workshop on Graph Data Management Experiences and Systems, p.2, 2013.
  10. U. Gupta and L. Fegaras, "Distributed Incremental Graph Analysis," Proc. IEEE International Congress on Big Data, pp.75-82, 2016.
  11. B. Pramod, W. Alexander, A. E. Istemi, R. Rodrigo, and A. A. Umut, "Large-scale incremental data processing with change propagation," Proc. USENIX Workshop on Hot Topics in Cloud Computing, 2011.
  12. J. Wuyang, L. Jianxin, Y. Weiren, and Z. Richong, "iGraph: an incremental data processing system for dynamic graph," Frontiers of Computer Science, Vol.10, No.3, pp.462-476, 2016. https://doi.org/10.1007/s11704-016-5485-7
  13. https://snap.stanford.edu/data/