A Study of Library Grouping using Cluster Analysis Methods

군집분석 기법을 이용한 공공도서관 그룹화에 대한 연구

  • 곽철완 (강남대학교 산업데이터사이언스학부)
  • Received : 2020.08.19
  • Accepted : 2020.09.03
  • Published : 2020.09.30


The purpose of this study is to investigate the model of cluster analysis techniques for grouping public libraries and analyze their characteristics. Statistical data of public libraries of the National Library Statistics System were used, and three models of cluster analysis were applied. As a result of the study, cluster analysis was conducted based on the size of public libraries, and it was largely divided into two clusters. The size of the cluster was largely skewed to one side. For grouping based on size, the ward method of hierarchical cluster analysis and the k-means cluster analysis model were suitable. Three suggestions were presented as implications of the grouping method of public libraries. First, it is necessary to collect library service-related data in addition to statistical data. Second, an analysis model suitable for the data set to be analyzed must be applied. Third, it is necessary to study the possibility of using cluster analysis techniques in various fields other than library grouping.

이 연구의 목적은 공공도서관 그룹화를 위해 적합한 군집분석 모델을 파악하고 그 특징을 분석하는데 있다. 국가도서관통계시스템의 공공도서관 통계 데이터를 사용하였으며, 군집분석 기법의 3가지 모델을 적용하였다. 공공도서관 규모를 기준으로 군집분석을 실시한 결과 크게 2가지 군집으로 구분되었으며, 군집의 크기는 크게 한쪽으로 치우쳤다. 그룹화 모델로 도서관 규모를 기준으로 삼으면, 계층적 군집분석의 와드측정법과 k-평균군집분석 모델이 적합하였다. 공공도서관 그룹화 연구 결과에 대한 시사점은 다음과 같다. 첫째, 통계 데이터 외에 도서관 서비스 관련 다양한 데이터 수집이 진행되어야 한다. 둘째, 분석 대상이 되는 데이터 세트에 적합한 분석 모델이 적용되어야 한다. 셋째, 도서관 서비스 향상을 위해 군집분석 기법의 다양한 분야 적용 가능성에 대한 적극적인 연구가 필요가 있다.



  1. 국가도서관통계시스템. 2020a. 열린마당. 2020년 전국 도서관 운영평가 공공도서관 그룹핑 변경 안내. [online]. [cited 2020.8.10]. .
  2. 국가도서관통계시스템. 2020b. 공공도서관 통계보기. [online]. [cited 2020.8.10]. .
  3. Kim, Jaehee and Yoon Sil Ko. 2009. "A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls." Korean Journal of Applied Statistics, 22(4): 745-758.
  4. Jang, Chul-Ho. 2009. "A Study on Efficiency Analysis about the Public Libraries Using Clustering DEA/AHP Model." Journal of Korean Library and Information Science Society, 40(2): 491-514.
  5. Cho, Min Ho. 2019. R Data Analysis for Data Scientists. Seoul: Information Publishing Group.
  6. Cho, Yongjoon. 2009. "The Similarities Analysis of Location Fishing Information through 2 Step Clustering." Journal of the Korean Data & Information Science Society, 20(3): 551-562.
  7. Cha, Mikyeong and Soon Hee Pyo. 2015. "A Study on the Results of the National Evaluation on Public Library Management during 2010-2013." Journal of the Korean Biblia Society for Library and Information Science, 26(2): 241-268.
  8. Korea Research Institute for Vocational Education & Training and Myongji University. Industry and Academia Cooperation Foundation. [2017]. 07 Data Analysis based upon Machine Learning. [online]. [cited 2020.2.10]. .