Study about Research Data Citation Based on DCI (Data Citation Index)

Data Citation Index를 기반으로 한 연구데이터 인용에 관한 연구

  • 조재인 (인천대학교 문헌정보학과)
  • Received : 2016.01.22
  • Accepted : 2016.02.11
  • Published : 2016.02.29


Sharing and reutilizing of research data could not only enhance efficiency and transparency of research process, but also create new science through data integrating and reinterpretationing. Diverse policies about research data sharing and reutilizing have been developing, along with extending of research evaluating spectrum that across research data citation rate to social impact of research output. This study analyzed the scale and citation number of research data which has not been analyzed before in korea through data citation index using Kruskal-Wallis H analysis. As result, genetics and biotechnology are identified as subject areas which have most huge number of research data, however the subject areas that have been highly cited are identified as economics and social study such as, demographic and employment. And Uk Data Archive, Inter-university Consortium for Political and Social Research are analyzed as data repositories which have most highly cited research data. And the data study which describes methodology of data survey, type and so on shows high citation rate than other data type. In the result of altmetrics of research data, data study of social science shows relatively high impact than other areas.

연구데이터의 개방과 공유는 연구의 효율성과 연구 과정의 투명성을 제고할 뿐 아니라, 데이터 통합과 재해석을 통해 새로운 과학으로의 창출도 가능하다. 서구를 중심으로 연구데이터 공개와 재사용을 위한 다양한 정책이 개발되면서 표준적인 인용 체계도 자리를 잡아가고 있다. 본 연구는 연구데이터 인용색인 DCI(Data Citation Index)를 기반으로 연구데이터의 구축 규모와 인용 정도를 파악하고, 기술통계분석과 Kruskal-Wallis H 분석을 통해서 고인용 데이터의 특성과 인용 경향을 분석해 보았다. 또한 알트매트릭스(Altmetrics) 분석 도구인 Impactstory를 통하여 연구데이터의 사회적 영향력도 진단해 보았다. 그 결과 연구데이터의 규모는 유전학과 생명공학 분야가 압도적으로 크지만, 다수 인용된 분야는 인구, 고용 등 경제 사회과학분야인 것으로 나타났으며, UK Data Archive, ICPSR(Inter-University Consortium For Political And Social Research)에 구축된 연구데이터가 가장 많이 인용되고 있는 것으로 분석되었다. 또한 데이터세트보다는 조사방법과 연구방법론이 포함된 데이터스터디가 높은 피인용도를 보이는 것으로 나타났으며, 연구데이터의 알트매트릭스 분석 결과에서도 사회과학분야의 데이터스터디가 상대적으로 많이 참조되고 있는 것으로 나타났다.



  1. 김운봉, 김용민, 양진옥. 2014. 유전체 빅데이터 연구 동향. [online] [cited 2015. 10. 10.] (Kim, U. B., Kim, Y. M. and Yang, J. O. 2014. Study on Trend of Research about GenomBigdata. [online] [cited 2015. 10. 10.])
  2. 김지현. 2014. 대학도서관의 연구데이터관리서비스에 관한 연구: 미국 연구중심대학도서관을 중심으로. 한국비블리아학회지, 25(3): 165-189.(Kim, Jihyun. 2014. "A Study on Research Data Management Services of Research UniversityLibraries in the U.S." Journal of Korea Biblia Society for Library and Information Science,25(3): 165-189.)
  3. 西薗, 由依. 2013. オープンアクセス時代の研究成果のインパクトを再定義する: 再利用とAltmetricsの現在. 第3回 SPARC Japan セミナー2013. [online] [cited 2015. 10. 10.]
  4. 池内, 有為. 2014. 研究データ共有時代における図書館の新たな役割:研究データマネジメントとデータキュレーション. カレントアウェアネス, 319. [online] [cited 2015. 9. 10.]
  5. DataOne. Education Modules Homepage. [online] [cited 2015. 9. 10.]
  6. DataCite. DataCite Homepage. [online] [cited 2015. 11. 15.]
  7. DataCite. 2015. DataCite Metadata Schema for the Publication and Citation of Research Data. [online] [cited 2015. 8. 15.]
  8. Department for Business, Innovation & Skills Prime Minister's office. 2013. G8 Science Ministers Statement London UK. [online] [cited 2015. 8. 15.]
  9. Force, M. M. and Auld, D. M. 2014. "Data Citation Index: Promoting Attribution, Use and Discovery of Research Data." Information Services and Use, 34: 97-98.
  10. Force, M. M. and Robinson, N. J. 2014. "Encouraging Data Citation and Discovery with the Data Citation Index." J Comput Aided Mol Des, 28: 1043-1048. [online] [cited 2015. 8. 15.]
  11. Haustein, S., Costas, R. and Larivière, V. 2015. "Characterizing Social Media Metrics of Scholarly Papers: The Effect of Document Properties and Collaboration Patterns." PLoS ONE, 10(3): e0120495.
  12. Havard Library. Citing Your Data Homepage. [online] [cited 2015. 8. 10.]
  13. Mohammadi, E. and Thelwall, M. 2014. "Mendeley Readership Altmetrics for the Social Sciences and Humanities: Research Evaluation and Knowledge Flows." Journal of the Association for Information Science and Technology, 65(8): 1627-1638.
  14. National Science Foundation. 2012. Issuance of a New NSF Proposal & Award Policies and Procedures Guide. [online] [cited 2015. 8. 15.]
  15. OECD. 2007. OECD Principles and Guidelines for Access to Research Data from Public Funding. Paris: OECD Publication. [online] [cited 2015. 9. 10.]
  16. Sayogo, D. S. and Pardo, T. A. 2013. "Exploring the Determinants of Scientific Data Sharing: Understanding the Motivation to Publish Research Data." Government Information Quarterly, 30(1): S19-S31.
  17. Torres-Salinas, D., Martin-Martin, A. and Fuente-Gutierrez, E. 2014. "Analysis of the Coverage of the Data Citation Index-Thomson Reuters: Disciplines, Document Types and Repositories." Revista Espanola de Documentacion Científica, 37(1): 1-6. [online] [cited 2015. 9. 10.]
  18. The Office of Science and Technology Policy. 2013. Increasing Access to the Results of Federally Funded Scientific Research. Washington, D.C. [online] [cited 2015. 8. 15.]
  19. Thomson Reuters. 2015. "Data Citation Index, 2 November 2015". Personal Communication.
  20. Zahedi, Z., Costas, R. and Wouters, P. 2014. "How Well Developed Are Altmetrics? A Cross-Disciplinary Analysis of the Presence of 'Alternative Metrics' in Scientific Publications." Scientometrics, 101(2): 1491-1513.

Cited by

  1. Subject analysis of LIS data archived in a Figshare using co-occurrence analysis pp.1468-4527, 2018,