• 제목/요약/키워드: research data

검색결과 69,778건 처리시간 0.07초

Development of a National Research Data Platform for Sharing and Utilizing Research Data

  • Shin, Youngho;Um, Jungho;Seo, Dongmin;Shin, Sungho
    • Journal of Information Science Theory and Practice
    • /
    • 제10권spc호
    • /
    • pp.25-38
    • /
    • 2022
  • Research data means data used or created in the course of research or experiments. Research data is very important for validation of research conducted and for use in future research and projects. Recently, convergence research between various fields and international cooperation has been continuously done due to the explosive increase of research data and the increase in the complexity of science and technology. Developed countries are actively promoting open science policies that share research results and processes to create new knowledge and values through convergence research. Communities to promote the sharing and utilization of research data such as RDA (Research Data Alliance) and COAR (Confederation of Open Access Repositories) are active, and various platforms for managing and sharing research data are being developed and used. OpenAIRE (Open Access Infrastructure for Research In Europe), a research data platform in Europe, ARDC (Australian Research Data Commons) in Australia, and IRDB (Institutional Repositories DataBase) in Japan provide research data or research data related services. Korea has been establishing and implementing a research data sharing and utilization strategy to promote the sharing and utilization of research data at the national level, led by the central government. Based on this strategy, KISTI has been building a Korean research data platform (DataON) since 2018, and has been providing research data sharing and utilization services to users since January 2020. This paper reviews the characteristics of DataON and how it is used for research by showing its applications.

Data Citation Index를 기반으로 한 연구데이터 인용에 관한 연구 (Study about Research Data Citation Based on DCI (Data Citation Index))

  • 조재인
    • 한국문헌정보학회지
    • /
    • 제50권1호
    • /
    • pp.189-207
    • /
    • 2016
  • 연구데이터의 개방과 공유는 연구의 효율성과 연구 과정의 투명성을 제고할 뿐 아니라, 데이터 통합과 재해석을 통해 새로운 과학으로의 창출도 가능하다. 서구를 중심으로 연구데이터 공개와 재사용을 위한 다양한 정책이 개발되면서 표준적인 인용 체계도 자리를 잡아가고 있다. 본 연구는 연구데이터 인용색인 DCI(Data Citation Index)를 기반으로 연구데이터의 구축 규모와 인용 정도를 파악하고, 기술통계분석과 Kruskal-Wallis H 분석을 통해서 고인용 데이터의 특성과 인용 경향을 분석해 보았다. 또한 알트매트릭스(Altmetrics) 분석 도구인 Impactstory를 통하여 연구데이터의 사회적 영향력도 진단해 보았다. 그 결과 연구데이터의 규모는 유전학과 생명공학 분야가 압도적으로 크지만, 다수 인용된 분야는 인구, 고용 등 경제 사회과학분야인 것으로 나타났으며, UK Data Archive, ICPSR(Inter-University Consortium For Political And Social Research)에 구축된 연구데이터가 가장 많이 인용되고 있는 것으로 분석되었다. 또한 데이터세트보다는 조사방법과 연구방법론이 포함된 데이터스터디가 높은 피인용도를 보이는 것으로 나타났으며, 연구데이터의 알트매트릭스 분석 결과에서도 사회과학분야의 데이터스터디가 상대적으로 많이 참조되고 있는 것으로 나타났다.

Data Framework Design of EDISON 2.0 Digital Platform for Convergence Research

  • Sunggeun Han;Jaegwang Lee;Inho Jeon;Jeongcheol Lee;Hoon Choi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2292-2313
    • /
    • 2023
  • With improving computing performance, various digital platforms are being developed to enable easily utilization of high-performance computing environments. EDISON 1.0 is an online simulation platform widely used in computational science and engineering education. As the research paradigm changes, the demand for developing the EDISON 1.0 platform centered on simulation into the EDISON 2.0 platform centered on data and artificial intelligence is growing. Herein, a data framework, a core module for data-centric research on EDISON 2.0 digital platform, is proposed. The proposed data framework provides the following three functions. First, it provides a data repository suitable for the data lifecycle to increase research reproducibility. Second, it provides a new data model that can integrate, manage, search, and utilize heterogeneous data to support a data-driven interdisciplinary convergence research environment. Finally, it provides an exploratory data analysis (EDA) service and data enrichment using an AI model, both developed to strengthen data reliability and maximize the efficiency and effectiveness of research endeavors. Using the EDISON 2.0 data framework, researchers can conduct interdisciplinary convergence research using heterogeneous data and easily perform data pre-processing through the web-based UI. Further, it presents the opportunity to leverage the derived data obtained through AI technology to gain insights and create new research topics.

머신러닝 기법을 활용한 에너지 데이터 분석에 관한 연구 (A Research on the Energy Data Analysis using Machine Learning)

  • 김동주;권성철;문종희;심기도;배문성
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제7권2호
    • /
    • pp.301-307
    • /
    • 2021
  • After the spread of the data collection devices such as smart meters, energy data is increasingly collected in a variety of ways, and its importance continues to grow. However, due to technical or practical limitations, errors such as missing or outliers in the data occur during data collection process. Especially in the case of customer-related data, billing problems may occur, so energy companies are conducting various research to process such data. In addition, efforts are being made to create added value from data, which makes it difficult to provide such services unless reliability of data is guaranteed. In order to solve these challenges, this research analyzes prior research related to bad data processing specifically in the energy field, and propose new missing value processing methods to improve the reliability and field utilization of energy data.

Functional Requirements for Research Data Repositories

  • Kim, Suntae
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제8권1호
    • /
    • pp.25-36
    • /
    • 2018
  • Research data must be testable. Science is all about verification and testing. To make data testable, tools used to produce, collect, and examine data during the research must be available. Quite often, however, these data become inaccessible once the work is over and the results being published. Hence, information and the related context must be provided on how research data are preserved and how they can be reproduced. Open Science is the international movement for making scientific research data properly accessible for research community. One of its major goals is building data repositories to foster wide dissemination of open data. The objectives of this research are to examine the features of research data, common repository platforms, and community requests for the purpose of designing functional requirements for research data repositories. To analyze the features of the research data, we use data curation profiles available from the Data Curation Center of the Purdue University, USA. For common repository platforms we examine Fedora Commons, iRODS, DataONE, Dataverse, Open Science Data Cloud (OSDC), and Figshare. We also analyze the requests from research community. To design a technical solution that would meet public needs for data accessibility and sharing, we take the requirements of RDA Repository Interest Group and the requests for the DataNest Community Platform developed by the Korea Institute of Science and Technology Information (KISTI). As a result, we particularize 75 requirement items grouped into 13 categories (metadata; identifiers; authentication and permission management; data access, policy support; publication; submission/ingest/management, data configuration, location; integration, preservation and sustainability, user interface; data and product quality). We hope that functional requirements set down in this study will be of help to organizations that consider deploying or designing data repositories.

Introduction of the Korea BioData Station (K-BDS) for sharing biological data

  • Byungwook Lee;Seungwoo Hwang;Pan-Gyu Kim;Gunwhan Ko;Kiwon Jang;Sangok Kim;Jong-Hwan Kim;Jongbum Jeon;Hyerin Kim;Jaeeun Jung;Byoung-Ha Yoon;Iksu Byeon;Insu Jang;Wangho Song;Jinhyuk Choi;Seon-Young Kim
    • Genomics & Informatics
    • /
    • 제21권1호
    • /
    • pp.12.1-12.8
    • /
    • 2023
  • A wave of new technologies has created opportunities for the cost-effective generation of high-throughput profiles of biological systems, foreshadowing a "data-driven science" era. The large variety of data available from biological research is also a rich resource that can be used for innovative endeavors. However, we are facing considerable challenges in big data deposition, integration, and translation due to the complexity of biological data and its production at unprecedented exponential rates. To address these problems, in 2020, the Korean government officially announced a national strategy to collect and manage the biological data produced through national R&D fund allocations and provide the collected data to researchers. To this end, the Korea Bioinformation Center (KOBIC) developed a new biological data repository, the Korea BioData Station (K-BDS), for sharing data from individual researchers and research programs to create a data-driven biological study environment. The K-BDS is dedicated to providing free open access to a suite of featured data resources in support of worldwide activities in both academia and industry.

연구데이터 관리를 위한 온톨로지 설계에 대한 연구 (A Study on Ontology Design for Research Data Management)

  • 박옥남
    • 한국기록관리학회지
    • /
    • 제18권1호
    • /
    • pp.101-127
    • /
    • 2018
  • 연구데이터의 연구의 정확성이나 신뢰성 확보를 위한 정보적 가치, 연구의 재현 또는 검증, 재사용 가능성을 연구데이터에 대한 체계적 관리가 강조되고 있다. 표준 메타데이터는 연구데이터 생산, 관리, 구조화, 기탁된 데이터 추출에 핵심 역할을 수행할 것이다. 연구데이터는 연구, 연구데이터, 데이터셋, 파일 등 다양한 계층적 관계를 가지고 있으며, 인용 및 연구성과 등의 엔터티와 연계되어 있다. 이에 본 연구에서는 연구데이터 관리를 위한 온톨로지 모델을 제시하고자 한다. NTIS 사례를 제시하여 연구의 적용가능성을 제시하였다. 이를 위해 기존 연구데이터 관련 선행연구, 메타데이터 표준의 분석, 연구데이터 리포지터리 사례조사를 실시하였다.

국가연구데이터커먼즈 서비스를 위한 데이터모델 연구 (Data Model Study for National Research Data Commons Service)

  • 조민희;이미경;송사광;임형준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.436-438
    • /
    • 2022
  • 국가연구데이터커먼즈는 연구데이터 활용 극대화를 위해 컴퓨팅 인프라, 데이터 분석을 위해 사용되는 SW, Toolkit, API, 서비스 등과 같은 분석리소스를 연구데이터와 함께 배치하여 연합 활용될 수 있는 체계를 구축하는 것을 목표로 한다. R&D 과정에서 연구 출판물, 연구데이터에 대한 공유·활용 체계는 이미 잘 알려져 있다. 하지만 데이터와 밀결합된 소프트웨어, 컴퓨팅 인프라들을 공유하고, 활용할 수 있는 환경은 미미하고, 관리체계가 없는 실정이다. 본 연구에서는 데이터 중심의 R&D 연구 과정에서 필요한 디지털 연구 자원 정보를 체계적으로 관리하기 위하여 데이터모델을 설계한다. 이는 국가연구데이터커먼즈 서비스에서 디지털 연구 자원 정보들을 등록하고 관리하는데 활용될 예정이다.

  • PDF

국내 과학기술분야 연구기관의 과학데이터 관리 현황 (Research Data Management of Science and Technology Research Institutes in Korea)

  • 최명석;이승복;이상환
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.117-126
    • /
    • 2017
  • 최근 연구 환경과 연구 패러다임이 데이터 중심(Data-Driven)으로 변화되고 있다. 특히, 공공 연구성과의 개방과 공유에 기반한 오픈 사이언스(Open Science)가 과학 연구의 글로벌 어젠다로 새롭게 부각되고 있다. 해외에서는 공적 지원에 의해 수행된 연구에서 생산되는 과학데이터의 공유 활용을 위한 정책이 적극적으로 시행되고 있어, 국내에서도 '오픈 연구데이터'를 위한 정책과 인프라 구축이 시급한 상황이다. 본 연구에서는 국내 과학기술 분야 연구기관의 과학데이터 생산, 관리, 활용 현황을 조사했다. 국가과학기술연구회 소속 22개 정부출연 연구기관과 국내 20개 대학의 연구자를 대상으로 과학데이터 생산, 관리, 활용현황, 과학데이터 공유 활용 참여 의지, 과학데이터 공유 활용 요구사항 등 5개 관점의 심층인터뷰를 실시했다. 이를 기반으로 과학데이터 공유 활용을 위한 시사점과 개선방향을 도출했다.

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.