Text Visualization and Concordance Search Using Gutenberg Project Text Data

구텐베르그 프로젝트 텍스트 데이터를 활용한 시각화 및 용례 검색

  • Kim, Dongsung (College of Art & Science, Ewha Womans University) ;
  • Shin, Yeonsu (College of Art & Science, Ewha Womans University) ;
  • Lee, Jian (College of Art & Science, Ewha Womans University) ;
  • Yu, Jimin (College of Art & Science, Ewha Womans University)
  • Published : 2017.10.13

Abstract

본 연구는 거시적 빅데이터 인문학과 미시적 언어 텍스트 검색 시스템을 구축하고, 이를 통해서 언어를 통한 문화의 역동적 변화를 시간적 순서에 따라 살펴보고자 한다. 연구의 최종적인 목표는 문화도 생물체처럼 변화하는 존재라 여기고 그 구성요소들을 연구한다는 뜻인 '문화체학(文化體學; Culturomics)'과 같은 '인문학 + 정보과학 + 사회과학' 등등의 다학문간의 융합적 연구에 있다. 이 시스템을 통해서 인류 역사의 기록인 텍스트 빅데이터를 통한 인문학적 성찰을 시각화하고 있다. 이러한 구글의 업적은 인문학과 정보기술의 융합을 통해서 인문학 자체의 지평을 넓히고, 사회과학을 변형시키고, 산업과 상아탑 사이의 관계를 재조정하는데 있다[1].

Keywords