DOI QR코드

DOI QR Code

Design and Implementation of Input and Output System for Unstructured Big Data

비정형 대용량 데이터 입력 및 출력 시스템 설계 및 구현

  • Received : 2013.12.22
  • Accepted : 2014.01.23
  • Published : 2014.02.28

Abstract

In recent years, the spread of computers is increasing, and efficient processing effort for unstructured Big Data is required. In this paper, we are proposed a system to extract the data typed in a word processor quickly by user creating and XML mapping file after converting XML data that has been entered in the office file(HWP, MS-office). In addition, we proposed a system is able to lookup the necessary data from a database by entered form in advance and convert word processor document to office files by the application program. The unstructured big data will be available to be used.

컴퓨터의 보급에 따라 비정형 대용량 데이터가 범람하고 이를 효율적으로 처리하기 노력이 요구되고 있다. 이에 본 논문에서는 오피스(office) 파일(아래한글, MS-Office 등)에 입력된 데이터를 바로 XML로 변환하고, 사용자가 XML 매핑 파일을 만들어서 워드프로세서에 입력 된 데이터를 바로 추출하여 데이터베이스에 저장하는 시스템을 제안하였다. 또한, 본 시스템은 워드프로세스에 양식을 미리 작성하여 필요한 데이터를 데이터베이스에서 조회하여 워드프로세서 문서를 응용프로그램에서 오피스 파일을 생성 할 수 있다. 이는 대용량의 비정형 데이터를 활용가능하게 할 것이다.

Keywords

References

  1. D Rentz, "Microsoft Compound Document File Format," [Internet]. Available: http://www.openoffice.org.zaxyproxy.com/.
  2. Hangul and Computer Co., Ltd.. Hangul document file formats Open project [Internet]. Available: http://www.hancom.com/.
  3. J. H. Yun, J. H. Park, and S. J. Lee, "Methods for Investigating of Edit History about MS PowerPoint Files That Using the OOXML Formats," Journal of Korea Information Processing Society, vol. 19, no. 4, pp. 215-224, Apr. 2011. https://doi.org/10.3745/KIPSTC.2012.19C.4.215
  4. Apache[Internet]. Available: http://www.apache.org/.
  5. S. M. Han, "Open Source DBMS based Design and Implementation of Query and Transformation Processor for Geo-Spatial Information Metadata," M. S. dissertation, Hansung University, Seoul, MA, 2010.