• 제목/요약/키워드: RDBMS

검색결과 200건 처리시간 0.031초

XML 문서에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법 (An Efficient Inverted Index Technique based on RDBMS for XML Documents)

  • 서치영;이상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.27-40
    • /
    • 2003
  • XML 정보검색 시스템이 XML 문서에 대한 포함질의를 지원하기 위해서는 기존의 정의검색 분야에서 널리 쓰이는 역색인 기법을 XML 문서에 대해서도 적용이 가능하도록 확장해야 한다. 본 논문에서는 확장된 역색인 정보를 저장하고 XML 문서에 대한 포함질의를 처리하는 방법을 이전 연구에서와 같이 두 가지 관점에서 제시한다. 하나는 관계형 데이타베이스 관리 시스템(RDBMS)을 이용해서 역색인 정보를 저장하고 질의를 처리하는 방법이고 다른 하나는 RDBMS 대신 역 리스트 엔진(Inverted List Engine)을 이용하는 방법이다. 이전 연구에서 역색인을 확장한 방식은 두 가지 문제점이 존재한다. 하나는 RDBMS를 이용하는 방법이 역 리스트 엔진을 이용하는 방법에 비해 성능 상으로 많이 안 좋다는 점이고, 다른 하나는 RDBMS 상에서 포함질의를 처리 시, 질의의 경로길이에 비례해서 조인연산이 증가하고 조인연산도 크기가 큰 테이블간의 조인이 된다는 점이다. 본 논문에서는 이러한 문제점들을 해결하고자 이전연구와는 다르게 역색인을 확장하여 RDBMS를 이용하는 방법의 효율성을 밝힌다.

분산병렬처리 환경에서 오토매핑 기법을 통한 NoSQL과 RDBMS와의 연동 (Interoperability between NoSQL and RDBMS via Auto-mapping Scheme in Distributed Parallel Processing Environment)

  • 김희성;이봉환
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2067-2075
    • /
    • 2017
  • 최근 빅데이터가 주목받게 되면서 빅데이터를 처리하기 위한 시스템들도 중요하게 여겨지고 있다. 빅데이터 처리 시스템으로 분산파일시스템인 Hadoop과 비정형 데이터 처리를 위한 NoSQL 데이터 스토어가 주목받고 있다. 하지만 아직까지 NoSQL을 사용함에 있어 어려움이나 불편함도 존재한다. 저용량 데이터인 경우 NoSQL의 MapReduce는 불필요한 작업시간을 소모하게 되며, RDBMS 보다 상대적으로 많은 데이터 탐색 시간이 소요되기도 한다. 본 논문에서는 이러한 NoSQL의 문제점을 해결하기 위해 NoSQL과 RDBMS 간의 연동 기법을 제안하였다. 개발한 오토매핑 기법은 처리할 데이터의 양에 따라 적합한 데이터베이스를 사용하게 하여 결과적으로 검색시간을 빠르게 할 수 있다. 실험 결과 제안한 데이터베이스 연동 기법은 특정 데이터 셋의 경우 검색시간을 최대 35%까지 줄일 수 있다.

PSR : 효율적인 웹 서비스 컴포지션 검색을 위한 RDBMS 기반의 선 계산 기법 (PSR: Pre-Computing Solutions in RDBMS for Efficient Web Services Composition Search)

  • 권준호;박규호;이대욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.333-344
    • /
    • 2008
  • 최근 웹 서비스 컴포지션이 많은 관심을 받고 있다. 웹 서비스 컴포지션을 통해서, 현재 존재하는 웹 서비스를 이용하여 저장소에 존재하지 않는 새로운 웹 서비스를 제공할 수 있다. 이 논문에서는 웹 서비스 컴포지션 검색을 구성하기 위해서 관계형 데이타베이스(RDBMS)를 사용한 PSR 시스템을 제안한다. 웹 서비스 컴포지션을 선 계산하기 위한 조인과 인덱스를 사용하는 알고리즘을 제안한다. 또한 웹 서비스에서 추출한 온톨로지 정보도 테이블로 저장하고, PSR 시스템이 이를 사용하여 온톨로지 매칭 정도에 따라 사용자 질의와의 유사도를 통한 결과를 반환하도록 하였다. 실험을 통하여 RDBMS 상에서 웹 서비스 컴포지션을 선 계산하는 접근 방법이 많은 수의 웹 서비스와 사용자 질의를 처리할 때 빠른 실행 시간과 좋은 확장성을 가지고 있음을 보였다.

A Novel Method for Matching between RDBMS and Domain Ontology

  • Lee, Ki-Jung;WhangBo, Taeg-Keun
    • 한국멀티미디어학회논문지
    • /
    • 제9권12호
    • /
    • pp.1552-1559
    • /
    • 2006
  • In a web environment, similar information exists in many different places in diverse formats. Even duplicate information is stored in the various databases using different terminologies. Since most information serviced in the current World Wide Web however had been constructed before the advent of ontology, it is practically almost impossible to construct ontology for all those resources in the web. In this paper, we assume that most information in the web environment exist in the form of RDBMS, and propose a matching method between domain ontology and existing RDBMS tables for semantic retrieval. In the processing of extracting a local ontology, some problems such as losing domain in formation can occur since the correlation of domain ontology has not been considered at all. To prevent these problems, we propose an instance-based matching which uses relational information between RDBMS tables and relational information between classes in domain ontology. To verify the efficiency of the method proposed in this paper, several experiments are conducted using the digital heritage information currently serviced in the countrywide museums. Results show that the proposed method increase retrieval accuracy in terms of user relevance and satisfaction.

  • PDF

Improving Database System Performance by Applying NoSQL

  • Choi, Yong-Lak;Jeon, Woo-Seong;Yoon, Seok-Hwan
    • Journal of Information Processing Systems
    • /
    • 제10권3호
    • /
    • pp.355-364
    • /
    • 2014
  • Internet accessibility has been growing due to the diffusion of smartphones in today's society. Therefore, people can generate data anywhere and are confronted with the challenge that they should process a large amount of data. Since the appearance of relational database management system (RDBMS), most of the recent information systems are built by utilizing it. RDBMS uses foreign-keys to avoid data duplication. The transactions in the database use attributes, such as atomicity, consistency, isolation, durability (ACID), which ensures that data integrity and processing results are stably managed. The characteristic of RDBMS is that there is high data reliability. However, this results in performance degradation. Meanwhile, from among these information systems, some systems only require high-performance rather than high reliability. In this case, if we only consider performance, the use of NoSQL provides many advantages. It is possible to reduce the maintenance cost of the information system that continues to increase in the use of open source software based NoSQL. And has a huge advantage that is easy to use NoSQL. Therefore, in this study, we prove that the leverage of NoSQL will ensure high performance than RDBMS by applying NoSQL to database systems that implement RDBMS.

효율적인 RDBMS 기반 XML Transformation을 위한 XML Data Statistics의 확장 (Extension of XML Data Statistics for efficient XML transformation based RDBMS)

  • 이유진;차재혁;오성교;이성연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2004
  • XML 문서에 대한 데이터의 통계 정보는 XML 어플리케이션에 유용하다. 특히 XML 어플리케이션에 대해 RDBMS 테이블 형U로 유도하는 방법 중 cost-based approach를 적용할 때 다양한 Schema 변환 중 어플리케이션에 가장 적합한 것을 선택하는 데 사용한다. 본 논문에서는 정차한 통계 정보를 모으기 위해 Shared type과 변환 과정에 생기는 잠재적인 Shared type에 대해 해결한 X2R System을 개발하였고. 효율적으로 통계를 유지하도록 하였다.

  • PDF

HL7 FHIR 기반 의료 데이터 처리 시스템에서 YCSB를 통한 RDBMS와 MongoDB의 성능 분석 연구 (Performance Analysis of RDBMS and MongoDB through YCSB in Medical Data Processing System Based HL7 FHIR)

  • 전동철;이병문;황희정
    • 한국멀티미디어학회논문지
    • /
    • 제21권8호
    • /
    • pp.934-941
    • /
    • 2018
  • There are some limits on cost and efficiency for large amount of data in RDBMS, and NoSQL is starting to gain popularity. In medical institutions, data forms are different between organizations, and that makes difficulty for interoperability between organizations. In this paper we focused on performance issues between RDMBS and NoSQL in medical documents. We had built two different environment and had experiment comparative analysis of NoSQL with RDBMS based on medical data. We used medical HL7 FHIR as a medical data standard. Also YCSB benchmark tool was used for performance comparison. Experiments shows that NoSQL has better performance in large amounts of medical data processing systems that have over 10,000~100,000 records.

'객체관계형 DBMS' 열풍이 몰아친다

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 4호통권47호
    • /
    • pp.5-11
    • /
    • 1997
  • 관계형 데이터베이스관리시스템(이하 RDBMS)업계에 객체관계형 DBMS(이하 ORDBMS) 열풍이 몰아치고 있다. 지난해 인포믹스와 오라클의 유니버설 논쟁으로 시작된 ORDB 논쟁은 올들어 주요 RDBMS 업체들이 잇달아 ORDBMS 제품을 내놓거나 출시를 앞두고 있어 본격적인 시장경쟁으로 이어질 전망이다. DBMS 시장의 이같은 급속한 변화는 실상 인터넷 붐이 만들어 낸 또다른 현상이라고 해도 과언이 아니다. 인터넷의 속성상 데이터만이 아니라 비정형 멀티미디어 데이터를 처리할 수 있는 새로운 개념의 데이터베이스 관리시스템이 필요하기 때문이다. 지난 93년 유니SQL 공급을 시발로 시작된 국내 ORDBMS 시장은 지난해 일러스트라 공급과 인포믹스 유니버설 서버 발표로 시장형성기에 접어들었으며, 올 하반기면 주요 RDBMS 업체들이 모두 제품을 출시할 것으로 보여 본격적인 개화기에 접어들 것으로 보인다. 국내 주요 RDBMS 업체를 중심으로 변화하는 DBMS 시장과 ORDBMS 전략을 점검해 본다.

  • PDF

오브젝트 스토리지의 RDBMS 성능비교 (RDBMS Performance Comparison on Object Storage)

  • 김영롱;고석인;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.234-237
    • /
    • 2015
  • 현재 RDBMS는 대부분 블록기반의 스토리지를 사용하는데 오늘날 정형화 되지 않은 데이터 타입에 대한 요청이 많아지고 있어서 오브젝트 스토리지를 사용하려는 연구가 활발히 진행 되고 있다. 그래서 본 논문을 통해 오브젝트 스토리지를 사용하는 RDBMS 환경을 제안한다. 오브젝트 스토리지 중 오픈 소스로 많이 사용되고 있는 Swift와 Ceph를 사용하여 시스템을 구축, 두 시스템간의 파일 및 RDBMS 성능비교를 진행하였다. Swift와 Ceph는 동일한 인터페이스가 아니기에 중간에 새로운 레이어를 추가하여 POSIX 환경에서 테스트가 가능하도록 하였다. 데이터베이스는 Postgresql을 사용하였고 두 시스템 간의 성능측정은 파일벤치마크인 IOzone 그리고 Posgresql에서 지원하는 TPC-B 기반 pgbench를 사용, 노드 확장성과 가상 클라이언트 수를 비교표로 활용하여 실험을 진행하였다.

랭킹 SVM과 RDBMS의 밀결합 통합 (Tightly Coupled Integration of Ranking SVM and RDBMS)

  • 송재환;오진오;양은석;유환조
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.247-253
    • /
    • 2009
  • 지난 십 년간 랭킹은 데이터 마이닝 분야의 활발한 연구분야였다. 그러나 랭킹은 다른 데이터 마이닝 기법들과 비슷하게 RDBMS와는 독립적으로 개발되었고, 그로 인해 기존에 널리 사용되고 있는 RDBMS들과의 연동성이 떨어진다는 단점이 존재하게 되었다. 다른 데이터 마이닝 기법들은 소결합이나 밀결합 접근법을 이용하여 RDBMS와 연동하기 위한 연구가 활발하게 진행되어 왔고, 그 결과 실제로 사용 가능한 응용시스템들이 나오게 되었다. 그러나 랭킹에서는 이와 같은 노력들이 잘 이루어지지 않고 있다. 본 논문에서는 랭킹 작업을 RDBMS에 연동하여 효율적으로 수행하기 위하여 MySQL에 Ranking SVM을 통합하는 작업을 진행하였다. 밀결합 접근법을 기반으로 하는 우리의 구현은 MySQL에 랭킹을 위한 새로운 SQL 명령어를 추가하였고 랭킹 작업의 효율성을 확인하기 위해서 소결합 접근법을 기반으로 하는 Ranking SVM과 성능을 비교 평가하여 훈련단계에서 $10{\sim}40%$, 예측단계에서 평균 60%의 성능향상을 확인할 수 있었다.