• 제목/요약/키워드: Graph Pattern Query

검색결과 7건 처리시간 0.019초

Is-A Node Type Modeling Methodology to Improve Pattern Query Performance in Graph Database

  • Park, Uchang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.123-131
    • /
    • 2020
  • 그래프 데이터베이스에서 패턴질의는 관계 데이터베이스 SQL과 비교하여 질의의 쉬운 표현, 높은 질의 처리 성능을 기대할 수 있는 장점이 있다. 그러나 그래프 데이터베이스는 관계 데이터베이스와 달리 논리적 데이터 모델을 구축하는 방법론이 정의되어 있지 않아 모델링에 따라 패턴 질의의 장점을 활용하지 못할 수 있다. 본 연구는 그래프 모델링 과정 중 나타나는 is-a 노드 모델링 방법에서 일반화 모델로 설계할 경우와 특수화 모델로 설계할 경우 그래프 패턴질의의 성능 차이가 있음을 실험하였다. 실험 결과 is-a 노드 설계를 특수화 모델로 설계할 경우 더 우수한 성능을 얻을 수 있음을 보였다. 또 추가로 패턴질의를 작성할 때 변수를 노드나 간선에 바인딩시키는 경우 그렇지 않는 경우보다 성능이 우수할 수 있음을 보였다. 실험 결과들은 그래프 데이터베이스에서 패턴질의에 대한 is-a 노드 모델링 방법 및 그래프 질의 작성 방법으로 제시될 수 있다.

사용자 상호작용에 기반한 그래프질의 생성 및 처리 (User Interaction-based Graph Query Formulation and Processing)

  • 정성재;김태홍;이승우;이화식;정한민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.242-248
    • /
    • 2014
  • RDF 데이터가 급속히 증가함에 따라 RDF데이터로부터 정보를 효율적으로 추출하는 기술의 중요성도 점차 커지고 있다. RDF데이터 질의를 위해 가장 많이 사용하는 질의언어인 SPARQL은 문법이 간단하고 그래프 패턴을 손쉽게 질의로 표현할 수 있는 장점이 있다. 그러나 사용자가 적절한 SPARQL을 작성하려면 데이터 셋에 대한 온톨로지 구조와 용어를 사전에 파악해야 한다. 이 연구에서는 데이터 셋으로부터 사전에 추출된 스키마정보를 이용한 그래프 질의 생성 및 처리방법을 제안한다. 제안된 방법에서 사용자는 RDF 데이터 셋에 대한 온톨로지 구조 사전파악 없이 화면상에서 동적으로 질의를 작성하여 정보를 조회할 수 있다. 사용자가 생성한 질의는 관계형데이터베이스에 저장된 트리플 데이터에 대해 그래프 탐색을 수행할 때 탐색공간 제약조건으로 활용된다. LUBM(10,0) 데이터 셋에 대하여 LUBM 질의 2, 8, 9번을 이용하여 질의 처리 성능과 완전성을 확인하였다.

온톨로지 추론 모델에 독립적인 SPARQL 추론 질의 처리를 위한 재작성 알고리즘 (A Rewriting Algorithm for Inferrable SPARQL Query Processing Independent of Ontology Inference Models)

  • 정동원;;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.505-517
    • /
    • 2008
  • 이 논문에서는 SPARQL로 작성된 OWL-DL 온톨로지 질의에 대한 재작성 알고리즘은 제안한다. 현재 웹 온톨로지 저장소는 주어진 SPARQL 질의의 추론 결과를 얻기 위해 추론 온톨로지 모델을 생성하고 SPARQL 질의와 생성된 추곤 온톨로지 모델과의 일치성을 비교한다. 추론 모델은 베이스 온톨로지 모델에 비해 보다 큰 공간을 필요로 하고 다른 추론 질의론 위해 재사용 될 수 없기 때문에 앞서 언급한 접근 방법은 보다 방대한 크기의 SPARQL 질의 처리에 부적합하다. 이러한 문제점을 해결하기 위해 이 논문에서는 비SPARQL 질의를 재작성하고 이를 기본 베이스 온톨로지 모델에 대해 질의 연산을 수행하여 결과를 획득할 수 있는 SPARQL 재작성 알고리즘을 제안한다. 이러한 목적을 이루기 위해, 먼저 OWL-DL 추론 규칙을 정의하고 이를 질의 그래프 패턴 재작성에 적용한다. 또한 추론 규칙들을 분류하고 이러한 규칙들이 질의 재작성에 미치는 영향에 대하여 기술한다. 제안 알고리즘의 장점을 보이기 위해, Jena 기반의 프로토타입 시스템을 구현한다. 비교 평가론 위해 테스트 질의를 이용하여 실험을 수행하고 제안 방법과 기존 접근 방법을 비교한다. 실험 결과에서, 제안 알고리즘이 완전성 및 정확성의 손실없이 메모리 공간 및 온톨로지 로딩 측면에서 향상된 성능을 보였다.

그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 인-메모리 압축 기법 (In-memory Compression Scheme Based on Incremental Frequent Patterns for Graph Streams)

  • 이현병;신보경;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.35-46
    • /
    • 2022
  • 최근 네트워크 기술 발전과 함께 IoT 및 소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 본 논문에서는 압축률 및 압축 시간에 대해 중점적으로 연구되던 기존의 압축 기법에 그래프 마이닝을 적용하여 스트림 그래프 환경을 함께 고려한 그래프 압축 기술을 제안한다. 또한, 최신 패턴을 유지하여 실시간으로 변화하는 스트림 그래프에서 압축 효율 및 처리속도를 향상시킨다. 본 논문에서는 그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 압축 기법을 제안하였다. 제안하는 기법의 우수성을 보이기 위해 압축률과 처리시간을 기존기법과 비교하여 성능평가를 수행한다. 제안하는 기법은 그래프 데이터의 크기가 커질 때 중복되는 데이터가 많아져 기존 기법보다 빠른 처리속도를 보인다. 따라서, 빠른 처리가 요구되는 스트림 환경에서 제안하는 기법을 활용할 수 있다.

포함관계 추론에서 접근 권한에 대한 효율적 RDF 질의 유효성 검증 (An Efficient RDF Query Validation for Access Authorization in Subsumption Inference)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.422-433
    • /
    • 2009
  • 시맨틱 웹을 위한 하나의 보안연구로, 본 논문에서는, 온톨로지 계층 구조와 RDF 트리플 패턴에 기반한 RDF 접근 권한 명세 모델을 소개한다. 또한 권한 명세 모델을 승인된 접근 권한들에 대한 RDF 질의 유효성 검증 과정에 적용한다. RDF 트리플 패턴을 가지는 대표적 RDF 질의 언어인 SPARQL 또는 RQL 질의는 RDF 트리플 패턴 형식으로 명세된 접근 권한에 따라 실행 거부되거나 인가될 수 있다. 이러한 질의 유효성 검증 과정을 효율적으로 수행하기 위하여 RDF 포함 관계 추론에서의 주요한 권한 충돌 조건들을 분석한다. 다음으로 분석된 충돌조건과 Dewey 그래프 레이블링 기술을 활용하는 효율적 질의 유효성 검증 알고리즘을 제시한다. 실험을 통하여 제시된 검증 알고리즘이 합리적인 유효성 검증 시간과, 데이터와 접근권한들이 증가할 때 확장성을 가짐을 보인다.

스키마가 없는 XML 문서에서의 재사용 가능한 XML Schema 추출 기법 (Technique for extracting reusable XML Schema from schema-less XML Documents)

  • 조정길;구연설
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.603-612
    • /
    • 2003
  • 웹의 발전으로 인터넷상에 XML 문서의 양이 증가하면서 클라이언트에서 수신된 XML 데이터를 검증하고 데이터베이스에 효율적으로 저장하고 질의하는데 필요한 많은 연구들이 진행되고 있다. 이러한 작업들을 처리하기 위해서는 XML 문서의 DTD나 XML Schema가 필요하다. 그러나 스키마가 없는 XML 문서는 DTD나 XML Schema가 없기 때문에 이러한 작업들을 처리할 수가 없다. 이에 이 논문에서는 well-formed XML 문서이거나 XML Schema가 없는 XML 문서에서 XML 데이터를 검증하고 데이터베이스에 효율적으로 저장하고 질의할 수 있도록 XML Schema론 추출한다. 이 논문에서 제안하는 XML Schema 추출 방법은 반구조적 데이터의 스키마 추출 기법인 데이터가이드와 시뮬레이션을 적용하여 스키마가 없는 XML 문서에서 스키마 그래프를 추출한다. 그리고 스키마 그래프와 재사용성을 고려한 패턴 테이블을 이용하여 XML Schema를 추출하는 기법을 제안한다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.