• 제목/요약/키워드: Index Update

검색결과 136건 처리시간 0.026초

연속적인 이동 객체의 효과적인 갱신을 위한 색인 구조 (An Index Structure for Updating Continuously Moving Objects Efficiently)

  • 복경수;윤호원;김명호;조기형;유재수
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.477-490
    • /
    • 2006
  • 기존에 제안된 색인 구조는 연속적 이동 객체를 갱신하기 위해 이동 객체의 기존 위치를 삭제하고 새로운 위치를 삽입하는 과정을 반복하기 때문에 많은 갱신 비용을 소요한다. 본 논문에서는 연속적 이동 객체의 갱신 비용을 감소시키기 위한 새로운 색인 구조를 제안한다. 제안하는 색인 구조는 이동 객체의 위치를 저장한 공간 분할 방식의 색인 구조와 이동 객체의 위치를 직접 접근하기 위한 보조 색인 구조로 구성된다. 노드의 팬아웃을 증가시키기 위해 자식 노드에 대한 정보는 실제 분할 영역을 저장하는 것이 아니라 kd-tree로 저장한다. 또한, 이동 객체의 위치 갱신을 빠르게 처리하기 위해 색인 구조 전체를 순회하지 않고 단말 노드를 직접 접근하여 상향식으로 갱신을 수행한다. 제안하는 색인 구조의 우수성을 입증하기 위해 다양한 분포 특성에 따라 이동 객체를 생성하고 이동 객체에 대한 삽입, 갱신, 검색 성능을 비교 분석한다.

데이터 스트림에 대한 키워드 검색을 위한, 효율적인 갱신이 가능한 디스크 기반 역색인 구조 (An Update-Efficient, Disk-Based Inverted Index Structure for Keyword Search on Data Streams)

  • 박은주;이기용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권4호
    • /
    • pp.171-180
    • /
    • 2016
  • 트위터와 같은 소셜 네트워킹 서비스(social networking service)의 확산으로 스트림 형태의 데이터가 크게 증가하고 있다. 스트림 형태로 들어와 누적되는 데이터를 효율적으로 검색하기 위해서는 색인이 반드시 필요하다. 본 논문에서는 스트림 형태로 들어와 계속 누적되는 데이터에 대한 키워드 검색을 효율적으로 할 수 있게 해주는, 효율적인 갱신이 가능한 디스크 기반 역색인(inverted index) 구조를 제안한다. 데이터 스트림을 검색하기 위해서는 데이터의 유입에 따라 역색인을 계속해서 갱신해 주어야 한다. 전통적인 역색인을 사용하는 경우, 역색인을 갱신하기 위해서는 매번 디스크에 저장된 모든 색인 데이터를 읽고 다시 써야 하므로 디스크 I/O 측면에서 매우 비효율적이다. 이러한 문제를 해결하기 위해 본 논문에서는 역색인을 크기가 지수적으로 증가하는 여러 역색인들로 나누어 저장한다. 새로운 데이터가 들어오면 우선 가장 작은 크기의 역색인에 삽입하고, 작은 크기의 역색인들을 더 큰 크기를 가진 역색인들과 나중에 병합함으로써 평균적으로 역색인을 갱신하는 비용을 크게 낮춘다. 또한 디스크에 저장된 역색인들을 병합할 때 발생하는 디스크 I/O 비용을 최소화함으로써 역색인의 갱신 비용을 더욱 낮춘다. 다양한 실험을 통해 기존 방법과 제안 방법의 효율성을 비교하고, 제안 방법이 갱신 비용에 있어 기존 방법에 비해 훨씬 효율적임을 보인다.

인덱스 그래프 : 동적 문서 데이터베이스를 위한 IR 인덱스 구조 (Index Graph : An IR Index Structure for Dynamic Document Database)

  • 박병권
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제10권1호
    • /
    • pp.257-278
    • /
    • 2001
  • An IR(information retrieval) index for dynamic document databases where insertion, deletion, and update of documents happen frequently should be frequently updated. As the conventional structure of IR index is, however, focused on the information retrieval purpose, its structure is inefficient to handle dynamic update of it. In this paper, we propose a new structure for IR Index, we call it Index Graph, which is organized by connecting multiple indexes into a graph structure. By analysis and experiment, we prove the Index Graph is superior to the conventional structure of IR index in the performance of insertion, deletion, and update of documents as well as the performance of information retrieval.

  • PDF

효율적인 XML검색을 위한 상대 위치 좌표 기반의 BitmapInvert Index 기법 (An Efficient BitmapInvert Index based on Relative Position Coordinate for Retrieval of XML documents)

  • 김택곤;김우생
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.35-44
    • /
    • 2006
  • 최근 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. XML 문서를 위한 현재까지 연구된 대부분의 색인기법의 경우 절대좌표를 이용하여 표현하는 방법을 사용하므로 갱신연산이 커다란 부담으로 받아들여지고 있다. 본 논문에서는 이를 개선하기 위하여 상대위치좌표에 기반한 BitmapInvert 색인 기법을 제안하였다. 상대위치좌표는 부모 노드와 좌, 우 형제 노드들 간의 관계만을 표현하므로 갱신연산지 자주 발생하더라도 좋은 성능을 보인다. BitmapInvert 색인 기법은 bitwise 연산을 지원하는 텍스트 검색을 지원하고, PostUpdate 알고리즘을 적용하여 갱신에 따른 성능 저하를 줄이도록 하였다. 따라서, 제안하는 기법은 검색이나 갱신에 대해서 접근하는 노드를 줄임으로써 전체적인 성능을 향상시킬 수 있다.

이동 객체의 효율적인 처리를 위한 갱신 관리 기법 (An Update Management Technique for Efficient Processing of Moving Objects)

  • 최용진;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.39-47
    • /
    • 2004
  • 대부분의 시공간 데이타베이스 연구들은 색인 분야에서 진행되었다. 그러나, 색인 연구들은 시공간 색인 유지를 위해서 필요한 엄청난 오버헤드의 고려 없이, 색인 생성 후의 빠른 질의 처리에 초점이 맞추어져 있다. 이 논문에서, 우리는 이동체들의 갱신들을 시공간 색인에 반영하기 위해서 필요한 디스크 액세스 수를 줄이는 효율적인 갱신 관리 방법을 제안한다. 객체의 움직임을 잘 표현할 수 있는 현실적인 갱신 패턴을 고려하여 자주 갱신되는 소수의 객체들을 유지할 수 있는 메모리 구조를 제안한다. 실질적인 갱신 패턴을 고려한 실험 환경에서, 우리의 방법은 기존 색인들의 일반적인 갱신 방법보다 약 40%의 디스크 액세스 수를 줄인다.

유비쿼터스 센서 네트워크에서 불확실한 데이타의 효율적인 처리를 위한 인덱스 (An Index for Efficient Processing of Uncertain Data in Ubiquitous Sensor Networks)

  • 김동오;강홍구;홍동숙;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권3호
    • /
    • pp.117-130
    • /
    • 2006
  • 유비쿼터스 센서 네트워크 관련 기술의 급속한 발전으로 센서가 여러 응용 분야에서 널리 활용되고 있다. 일반적으로, 유비쿼터스 센서 네트워크에서 각 센서 노드로부터 센싱되는 데이타는 검색의 효율성을 위해 중앙 서버에 저장된다. 이러한 환경에서 센싱된 데이타의 갱신 비용을 줄이기 위한 갱신지연 등으로 인해 중앙 서버에 불확실한 데이타가 저장되며, 이로 인해 질의 처리 시 잘못된 결과를 야기할 수 있다. 본 논문에서는 유비쿼터스 센서 네트워크에서 불확실한 데이타 처리 방법에 대해서 살펴보고, 불확실한 데이타를 효율적으로 처리하기 위한 인덱스를 제시한다. 이 인덱스는 불확실한 데이타가 실제 존재할 가능성이 있는 영역인 불확실성 영역 내에서 갱신을 지연시킴으로써 갱신 비용을 감소시킨다. 특히, 갱신 지연은 특정 갱신 영역 내에서만 수행되도록 제한함으로써 갱신 지연으로 인해 검색의 정확성이 감소되는 문제를 해결한다. 마지막으로, 성능 평가를 통해 이 인덱스의 성능을 분석하여 우수성을 입증한다.

  • PDF

A Mobile P2P Semantic Information Retrieval System with Effective Updates

  • Liu, Chuan-Ming;Chen, Cheng-Hsien;Chen, Yen-Lin;Wang, Jeng-Haur
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권5호
    • /
    • pp.1807-1824
    • /
    • 2015
  • As the technologies advance, mobile peer-to-peer (MP2P) networks or systems become one of the major ways to share resources and information. On such a system, the information retrieval (IR), including the development of scalable infrastructures for indexing, becomes more complicated due to a huge increase on the amount of information and rapid information change. To keep the systems on MP2P networks more reliable and consistent, the index structures need to be updated frequently. For a semantic IR system, the index structure is even more complicated than a classic IR system and generally has higher update cost. The most well-known indexing technique used in semantic IR systems is Latent Semantic Indexing (LSI), of which the index structure is generated by singular value decomposition (SVD). Although LSI performs well, updating the index structure is not easy and time consuming. In an MP2P environment, which is fully distributed and dynamic, the update becomes more challenging. In this work, we consider how to update the sematic index generated by LSI and keep the index consistent in the whole MP2P network. The proposed Concept Space Update (CSU) protocol, based on distributed 2-Phase locking strategy, can effectively achieve the objectives in terms of two measurements: coverage speed and update cost. Using the proposed effective synchronization mechanism with the efficient updates on the SVD, re-computing the whole index on the P2P overlay can be avoided and the consistency can be achieved. Simulated experiments are also performed to validate our analysis on the proposed CSU protocol. The experimental results indicate that CSU is effective on updating the concept space with LSI/SVD index structure in MP2P semantic IR systems.

실시간 갱신을 통한 이동 객체의 색인 기법 (Indexing Moving Objects with Real-Time Updates)

  • 복경수;서동민;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제4권4호
    • /
    • pp.141-152
    • /
    • 2004
  • 본 논문에서는 위치 기반 서비스에서 이동 객체의 연속적인 위치를 효과적으로 갱신하면서 미래 위치 검색을 기인하는 색인 구조를 제안한다. 이동 객체의 갱신 비용을 감소시키기 위해 제안하는 색인 구조는 보조 색인 구조를 통해 이동 객체가 존재하는 단말 노드를 직접 접근하고 노드의 정보가 변경될 경우 상향식으로 갱신을 수행한다. 실제 이동 객체의 위치는 주 색인 구조에 저장되며 중간 노드에는 노드의 팬아웃을 증가시키기 위해 kd-트리와 유사한 분할 정보를 기록한다 또한 자식 노드에 포함된 이동 객체를 포함하는 속도 정보를 이용하여 미래 위치 검색을 지원한다.

  • PDF

내포 질의의 효율적 평가를 위한 분리 색인 기법 (A Separated Indexing Technique for Efficient Evaluation of Nested Queries)

  • 권영무;박용진
    • 전자공학회논문지B
    • /
    • 제29B권7호
    • /
    • pp.11-22
    • /
    • 1992
  • In this paper, a new indexing technique is proposed for efficient evaluation of nested queries on aggregation hierarchy in object-oriented data model. As an index data structure, an extended $B^{+}$ tree is introduced in which instance identifier to be searched and path information used for update of index record are stored in leaf node and subleaf node, respectively. the retrieval and update algorithm on the introduced index data structure is provided. Comparisons under a variety of conditions are given with current indexing techniques, showing improved performance in cost, i.e., the total number of pages accessed for retrieval and update.

  • PDF

CL 트리: 낸드 플래시 시스템에서 캐시 색인 리스트를 활용하는 B+ 트리 (CL-Tree: B+ tree for NAND Flash Memory using Cache Index List)

  • 황상호;곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.1-10
    • /
    • 2015
  • 낸드 플래시는 기존의 하드디스크와 다르게 지움 연산이 필요하고 제자리 갱신이 불가능한 특성을 가지고 있어 플래시 전환 계층(FTL: Flash Translation Layer)을 사용한다. 하지만 플래시 전환 계층을 이용하는 방법은 사상 테이블의 사용에 따른 메모리 소비량이 많은 단점이 있어서 최근에는 사상 테이블을 사용하지 않는 색인 구조에 대한 연구가 많이 이루어지고 있다. 하지만 이러한 연구들은 사상 테이블을 사용하지 않는 시스템에서 발생되고 있는 업데이트 파생문제를 해결하여야 한다. 논문에서는 이러한 업데이트 파생문제를 효과적으로 해결하고자 CL-트리(Cache List Tree)라 명명된 새로운 색인 구조를 제안한다. 제안하는 기법은 메모리상에 쓰기 연산이 이루어진 노드들의 주소를 다중 리스트로 이루어진 CL-트리에 저장함으로써, 추가적인 쓰기 연산을 줄일 뿐만 아니라 자주 접근되는 노드에 대하여 빠르게 접근할 수 있기 때문에 탐색 측면에서도 뛰어난 성능을 보인다. 성능평가 결과 제안하는 CL-트리 구조는 작업 수행 속도에서 기존의 B+ 트리와 주요 관련 연구에 비해 삽입 속도는 최대 173%, 탐색 속도는 179% 향상되었음을 보였다.