DOI QR코드

DOI QR Code

XML-based Modeling for Semantic Retrieval of Syslog Data

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링

  • 이석준 (중앙대학교 대학원 정보시스템학과) ;
  • 신동천 (중앙대학교 정보시스템학과) ;
  • 박세권 (중앙대학교 정보시스템학과)
  • Published : 2006.04.01

Abstract

Event logging plays increasingly an important role in system and network management, and syslog is a de-facto standard for logging system events. However, due to the semi-structured features of Common Log Format data most studies on log analysis focus on the frequent patterns. The extensible Markup Language can provide a nice representation scheme for structure and search of formatted data found in syslog messages. However, previous XML-formatted schemes and applications for system logging are not suitable for semantic approach such as ranking based search or similarity measurement for log data. In this paper, based on ranked keyword search techniques over XML document, we propose an XML tree structure through a new data modeling approach for syslog data. Finally, we show suitability of proposed structure for semantic retrieval.

이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

Keywords

References

  1. B. Babcock and S. Babu and M. Datar and R. Motwani and J. Widom, 'Models and Issues in Data Stream Systems', ACM Symposium on Principles of Database Systems, pp. 1-16, June, 2002 https://doi.org/10.1145/543613.543615
  2. C. Lonvick, 'The BSD syslog Protocol', RFC3164, 2001
  3. J. Abela and T. Debeaupuis, 'Universal Format for Logger Messages', Herve Schauer Consultants, http:/www.hsc.fr/, 1999
  4. H. Mannila and H. Toivonen and A. I. Verkamo, 'Discovery of Frequent Episodes in Event Sequences', Data Mining and Knowledge Discovery, (1, 3), pp.259-289, 1997 https://doi.org/10.1023/A:1009748302351
  5. J. Clark and S. DeRose, 'XML Path Language', W3C Recommendation, 1999
  6. J. Punin and M. Krishnamoorthy and M. Zaki, 'LOGML-Log Markup Language for Web Usage Mining', Lecture Notes In Computer Science; Vol.2356, pp.88-112, 2001
  7. L. Feng and E. Chang and T. Dillon, 'A Semantic Network-Based Design Methodology for XML Documents', ACM Transactions on Information Systems, (20, 4), pp.390-421, Oct., 2002 https://doi.org/10.1145/582415.582417
  8. L. Guo and F. Shao and C. Botev and J. Shanmugasundaram, 'XRANK: Ranked Keyword Search over XML Documents', In Proc. 2003 ACM SIGMOD International Conference on Management of Data, pp.16-27, June, 2003 https://doi.org/10.1145/872757.872762
  9. Lire Documentation, http://logreport.org/lire/, 2004
  10. L. Page and S. Brin and R. Motwani and T. Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', Stanford Digital Library Technologies Project, 1998
  11. P. Berkhin, 'Survey of Clustering Data Mining Techniques', Accrue Software, http://www.accrue.com, 2002
  12. R. Baeza-Yates and B. Ribeiro-Neto, Modern Information Retrieval, Addison-Wesley Longman Publishing Company, 1999
  13. R. Gerhards, 'The syslog Protocol', syslog Working Group, http://www.ietf.org, 2005
  14. R. Vaarandi, 'A Breadth-First Algorithm for Mining Frequent Patterns from Event Logs', INTELLCOMM, Vol. 3283, pp.293-308, Nov., 2004
  15. R. Vaarandi, 'A Data Clustering Algorithm for Mining Patterns From Event Logs', Proc. of the 2003 IEEE Workshop on IP Operations and Management, pp.119-126, 2003
  16. S. Cohen and Y. Kanza and Y Sagiv, 'Generating Relations from XML Documents', ICDT, Vol. 2572, pp.285-299, Jan., 2003
  17. S. Cohen and J. Mamou and Y. Kanza, and Y. Sagiv, 'XSEarch : A Semantic Search Engine for XML', Proc. of 29th International Conference on Very Large Data Bases, pp.45-56, Sep., 2003
  18. XML Interface to Syslog Messages, http://www.cisco.com, 2004
  19. XML-Logs : Analyse your logs using XML encoding, Herve Schauer Consultants, http://www.hsc.fr/ressources/outils/xml-logs/index.html.en, 2004