XML 문서에 대한 편집스크립트 생성 알고리즘

An Algorithm Generating Edit Scripts for XML Documents

  • 이석균 (단국대학교 공과대학 컴퓨터학부)
  • Lee, Suk-Kyoon (Division of Computer Science and Engineering, Dankook University)
  • 투고 : 2010.09.10
  • 심사 : 2010.12.30
  • 발행 : 2011.01.25

초록

최근 XML문서의 변화탐지가 중요한 연구 분야로 등장하고 있지만 변화탐지의 결과, 즉 편집스크립트에 대한 연구는 아직 초보적인 수준이다. 본 연구에서는 XML 문서의 변화탐지 알고리즘인 X-treeDiff+의 편집스크립트 생성알고리즘인 X-treeESgen을 제시한다. 이는 실행시간 O(n)의 성능을 가지면서 기존의 다른 알고리즘과 달리 삽입, 삭제, 갱신의 기본연산 이외에 이동 및 복사 연산을 지원한다. 또한 편집스크립트 생성과정이 변화탐지의 대용과정과 독립적으로 설계되어 있어 다양한 튜닝이 가능한 특정이 있다.

While detecting changes in XML documents has emerged as a major research area, the level of research on edit scripts, which are the result of the change detection, is not far from satisfactory. In this paper, we present X-treeESgen, the algorithm generating edit scripts used in X-treeDiff+, a change detection algorithm for XML documents. X-treeESgen shows the time complexity of O(n), and support move and copy operations in addition to the basic set that is update, insert, and delete operations. Note that no other change detection algorithm provide all the operations. Also, since the process of generating edit scripts in X-treeESgen is designed independent of the process of matching, various tuning techniques may be applied.

키워드

참고문헌

  1. S. Ronnau, J. Scheffczyk, and U. Borghoff, "Towards XML Version Control of Office Documents," In Proc. of ACE Symposium on Document Engineering, pp. 10-19, Nov. 2005.
  2. R. Wagner and M. Fischer, "The string-tostring correction problem," Journal of the ACM, 21, pp.168-173, 1974. https://doi.org/10.1145/321796.321811
  3. K. Tai, "The tree-to-tree correction problem," Journal of the ACM, 26(3), pp.422-433, July 1979. https://doi.org/10.1145/322139.322143
  4. S. Selkow, "The tree-to-tree editing problem," Information Processing Letters, 6, 1977.
  5. E. W. Myers, "An O(ND) Difference Algorithm and Its Variations," Algorithmica, 1(2), pp.251-266, 1986.
  6. S. Chawathe and H. Molina, "Meaningful Change Detection in Structured Data," In SIGMOD '97, pp.26-37, 1997.
  7. G. Cobena, S. Abiteboul and A. Marian, "Detecting Changes in XML Documents," The 18th ICDE, 2002.
  8. K. Zhang and D. Shasha, "Simple fast algorithms for the editing distance between trees and related problems," SIAM Journal of Computing, 18(6), pp.1245-1262, 1989. https://doi.org/10.1137/0218082
  9. S. Chawathe and H. G. Molina, "Meaningful Change Detection in Structured Data," In SIGMOD '97, pp.26-37, 1997.
  10. S. Lee and D. Kim, "X-treeDiff+: Efficient Change Detection Algorithm in XML Documents," LNCS 4096, pp.1037-1046, 2006.
  11. Y. Wang, D. DeWitt, J. Cai, "X-Diff: An Effective Change Detection Algorithm for XML Documents," in Proc. of ICDE, pp519-530, Mar., 2003.
  12. S. Chawathe, "Comparing Hierarchical Data in External Memory," Proc. of VLDB, Sept. 1999.
  13. diffxml, http://diffxml.sourceforge.net/
  14. R. Fontaine, "Change Control for XML:Do it right," In Proc. of XML Europe 2003.
  15. DeltaXML, http://www.deltaxml.com
  16. 김동아, "XML 문서에 대한 변화 탐지 및 관리," 단국대학교 전산통계학과 박사학위논문, pp.1-111, 2005.
  17. 한글과 컴퓨터, http://www.hancom.co.kr/
  18. S. Chawathe, A. Garcia-Molina, and J Widom, "Change Detection in hierarchically structured information," In Proc. of SIGMOD, pp493-504, 1996.
  19. 이석균, "X-treeDiff+기반의 프로그램 복제 탐지," 전자공학회논문지, 제47권 CI편, 4호, 2010년 7월.