• 제목/요약/키워드: 데이터 베이스

검색결과 1,881건 처리시간 0.068초

데이터 베이스를 이용한 웹 기반 계통수 추론 시스템 설계 (Design of Web-based Phylogentic Tree Inference System Using DataBase)

  • 김신석;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.121-124
    • /
    • 2001
  • 계통수는 특정 객체의 분류 즉 특정 객체로부터 추출한 염기서열을 이용하여 그 객체의 소속 분류 집단을 결정하기 위해서 사용될 수 있다. 만약 특정지역에서 획득한 토끼의 종을 구분하기 위해서 이미 분류된 토끼의 염기서열들을 가지고 염기서열들과의 관계를 표현하는 계통수를 제작함으로써, 객체를 분류 할 수 있다. 계통수 제작은 기존의 계통수 제작 도구들(MEGA등)이 사용되지만, 이러한 계통수 제작 도구는 객체의 어떤 특성에 의해서 종이 나뉘어지는 가는 예측 할 수 없다. 계통수 제작에 이용되는 염기서열 데이터는 기존의 염기서열 데이터 베이스들(EMBL, GenBank, DDBJ)에서 인터넷을 이용하여 찾을 수 있지만, 계통생물학을 위해 누적된 데이터가 아니므로, 계통수 제작을 위해서는 사용이 제한적이다. 또 계통수 제작 도구을 사용하기 위해서는 자신이 관련 염기서열 데이터를 수집하여야 한다. 본 논문은 웹기반 계통수 추론 시스템을 제시한다. 본 시스템은 염기서열 데이터를 검색하여, 계통 분류 즉 계통수 제작을 위한 데이터로 저장하고, 이를 이용하여 계통수를 그릴 수 있다. 또한 이렇게 저장된 데이터는 데이터 마이닝 분류 기법을 사용하여, 각 객체 분류 집단을 모델링하며, 분류 속성을 예측할 수 있다.

  • PDF

객체 중심 측면 모델에 의한 KB/DB 통합 방법론 (A KB/DB Coupling Methodology based on the Object-Oriented Entity Aspect Model)

  • 오선영;백두권
    • 정보기술과데이타베이스저널
    • /
    • 제1권2호
    • /
    • pp.3-24
    • /
    • 1994
  • 기존의 데이타 모델 및 설계 방법론들은 실세계의 데이타 객체에 대해 고정된 한 측면의 모델 표현만을 허용하기 때문에 여러 측면으로 관측이 가능한 실세계 객체들의 표현에 어려움을 갖는다. 제시한 객체 중심 측면 모델(OOAM : Object-Oriented Entity Aspect Model)은 실세계의 각 객체에 대해 다수의 측면 표현을 가능하게 한 객체 중심의 데이타 모델로 데이타와 지식 표현에 유용한 모델이다. 데이타베이스 시스템과 지식베이스 시스템 중 어느 하나의 시스템이 다른 시스템의 특징을 빌리거나 통합할 수 있다면 두 시스템에게 서로 이득이 될 수 있다. 이러한 KB/DB(Knowledge Base/Data Base)의 통합은 최근에 객체 지향 개념과 연역 개념에 의해 연구가 활발히 진행되고 있다. 본 논문에서는 객체의 측면 개념을 제공하는 OOAM의 기본 개념을 보여주고 OOAM에 의해 구축되는 데이타베이스 스키마의 시맨틱을 분석하고 서술하기 위해 OOAM을 형식적으로 정의하였다. 그리고 KB/DB 통합에 관련된 연구들을 분석하고 데이타베이스에 관련된 지식의 종류를 서술한 후 OOAM을 사용하여 KB/DB 통합을 위한 지식베이스와 데이타베이스의 개발 방법론을 제시하였다.

  • PDF

블루투스 베이스밴드의 효율적인 FEC 설계 (Design of Efficient FEC for Bluetooth Baseband)

  • 문상국
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.681-684
    • /
    • 2008
  • 블루투스 베이스밴드에서는 송신한과 수신단의 데이터의 모뎀 인터페이스와 맞물려 FEC(forward Error Check)를 수행한다. 잘 설계한 FEC는 데이터 페이로드 재전송 효율성과 직결되기 때문에 FEC 설계방식이 매우 중요하다. 본 논문에서는 하드웨어의 효율성을 높이고 면적을 줄이기 위하여 1/3와 2/3 방식의 FEC를 설계하였다. 패킷 헤더는 항상 3번 반복 방식의 1/3 rate FEC로 설계하였고 2/3 FEC는 (15, 10) 방식의 축약 해밍코드를 기반으로 하여 각각의 데이터 패킷에 적용하였다. 설계한 하드웨어 FEC는 Verilog HDL로 기술하고 검증하여 자동 합성방식으로 합성하였다. 합성된 하드웨어 FEC는 기준으로 삼는 베이스밴드 마이크로콘트롤러의 동작주파수인 40MHz에서 정상적으로 동작하였다.

  • PDF

에세이 자동 평가 모델 성능 향상을 위한 데이터 증강과 전처리 (Data Augmentation and Preprocessing to Improve Automated Essay Scoring Model)

  • 고강희;김도국
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-332
    • /
    • 2023
  • 데이터의 품질과 다양성은 모델 성능에 지대한 영향을 끼친다. 본 연구에서는 Topic을 활용한 데이터 전처리와 BERT 기반 MLM, T5, Random Masking을 이용한 증강으로 데이터의 품질과 다양성을 높이고자 했으며, 이를 KoBERT 기반 에세이 자동 평가 모델에 적용했다. 데이터 전처리만 진행했을 때, Quadratic Weighted Kappa Score(QWK)를 기준으로 모델이 에세이의 모든 평가 항목에 대해 베이스라인보다 더욱 높은 일치도를 보였으며 평가항목별 일치도의 평균을 기준으로 0.5368029에서 0.5483064(+0.0115035)로 상승했다. 여기에 제안하는 증강 방식을 추가 할 경우 MLM, T5, Random Masking 모두 성능 향상 효과를 보였다. 특히, MLM 데이터 증강 방식을 추가로 적용하였을 때 최종적으로 0.5483064에서 0.55151645(+0.00321005)으로 상승해 가장 높은 일치도를 보였으며, 에세이 총점으로 QWK를 기준으로 성능을 평가하면 베이스라인 대비 0.4110809에서 0.4380132(+0.0269323)로의 성능 개선이 있었다.

  • PDF

효과적인 지식창출을 위한 인터넷 상의 지식채굴과정: 주식시장에의 응용 (Knowledge Discovery Process In Internet For Effective Knowledge Creation: Application To Stock Market)

  • 김경재;홍태호;한인구
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.105-113
    • /
    • 1999
  • 최근 데이터와 데이터베이스의 폭발적 증가에 따라 무한한 데이터 속에서 정보나 지식을 찾고자하는 지식채굴과정 (knowledge discovery process)에 대한 관심이 높아지고 있다. 특히 기업 내외부 데이터베이스 뿐만 아니라 데이터웨어하우스 (data warehouse)를 기반으로 하는 OLAP환경에서의 데이터와 인터넷을 통한 웹 (web)에서의 정보 등 정보원의 다양화와 첨단화에 따라 다양한 환경 하에서의 지식채굴과정이 요구되고 있다. 본 연구에서는 인터넷 상의 지식을 효과적으로 채굴하기 위한 지식채굴과정을 제안한다. 제안된 지식채굴과정은 명시지 (explicit knowledge)외에 암묵지 (tacit knowledge)를 지식채굴과정에 반영하기 위해 선행지식베이스 (prior knowledge base)와 선행지식관리시스템 (prior knowledge management system)을 이용한다. 선행지식관리시스템은 퍼지인식도(fuzzy cognitive map)를 이용하여 선행지식베이스를 구축하여 이를 통해 웹에서 찾고자 하는 유용한 정보를 정의하고 추출된 정보를 지식변환시스템 (knowledge transformation system)을 통해 통합적인 추론과정에 사용할 수 있는 형태로 변환한다. 제안된 연구모형의 유용성을 검증하기 위하여 재무자료에 선행지식을 제외한 자료와 선행지식을 포함한 자료를 사례기반추론 (case-based reasoning)을 이용하여 실험한 결과, 제안된 지식채굴과정이 유용한 것으로 나타났다.

  • PDF

홈 네트워크 서비스를 위한 인증 시스템 설계 및 구현 (Design & Implementation of Authentication System for Home Network Service)

  • 설정환;이기영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.917-920
    • /
    • 2007
  • 본 논문에서는 홈 네트워크 서비스를 위한 인증 시스템을 설계하여 실제 센서 노드에 구현하였다. SPINS의 SNEP 프로토콜은 데이터 기밀성과 인증을 제공한다. SNEP을 기반으로 RC5 암호화 알고리즘을 적용하여 인증키 및 데이터의 암 ${\cdot}$ 복호화를 수행하였다. 또한 무선 센서 네트워크에서의 키 관리 기법인 대칭키 사전 분배 방식을 적용하여 인증키의 노출을 방지하였다. 데이터 수신을 담당하는 베이스 스테이션과 데이터 전송을 담당하는 센서 노드들로 실험 환경을 구성하였으며, 각 센서 노드는 수신된 데이터를 암호화된 인증키와 함께 베이스 스테이션으로 전송하게 된다. 실험을 통해 다른 그룹의 센서 노드와 베이스 스테이션 사이의 통신 및 악의적인 목적을 가지고 추가된 센서 노드와의 통신으로 인한 오작동을 막을 수 있음을 확인할 수 있었다.

  • PDF

시공간 데이타베이스에서 다차원 시퀀스 데이타의 선택도추정 (Selectivity Estimation for Multidimensional Sequence Data in Spatio-Temporal Databases)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.84-97
    • /
    • 2007
  • 선택도 추정 기법은 질의 최적화를 위해 현재 상용 데이터 베이스에서 많이 사용되고 있고 히스토그램은 가장 많이 사용되는 선택도 추정 기법중의 하나이다. 최근에 시공간 데이터 베이스 관련 연구들에서 이러한 선택도 추정 기법이 기존의 시간 공간 데이타베이스 선택도 추정 기법을 확장하여 활발하게 연구되었다. 하지만 기존의 시공간 데이타베이스 선택도 추정 연구는 주로 이동 객체와 같은 시계열 데이타만 고려하였다. 또한 기존의 연구는 과거시점부터 현재 시점까지 시간적 범위 질의에 대한 선택도 추정은 불가능하였다. 따라서 본 논문에서는 시공간 데이타베이스에서 과거 시점에서 현재시점까지 시퀀스 데이타의 시간적 범위 질의를 위한 히스토그램을 구축하고 이를 이용한 효과적인 선택도 추정 기법을 제안한다. 제안한 히스토그램을 이용하면 과거부터 현재까지 시퀀스 데이타의 선택도 추정이 가능하고, 범위시간 선택도 추정 기법이 가능하며 효과적인 히스토그램 유지 기법의 적용이 가능하다.

데이터 마이닝을 이용한 의사결정지원 시스템 (Decision Support System Using Data Mining)

  • 조성진;정인정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.45-47
    • /
    • 1999
  • 데이터 베이스에 저장하고 취급하는 자료가 폭발적으로 증가함에 따라서, 데이터 베이스 이용자가 필요로 하는 자료를 검색하고 유용한 정보를 획득하는 일은 더욱 더 어려워지고 있다. 이러한 문제들은 데이터에 내재되어 있는 유용한 패턴이나 변수들 간의 관계를 정교한 분석 모형을 찾아내는 데이터 마이닝이란 정보기술로 해결할 수 있다. 본 논문에서는 여러 가지 데이터 마이닝 기법들을 알아보고 데이터 마이닝에 의해 만들어진 규칙들을 사용하여 의사결정에 도움을 줄 수 있는 분석적인 트리를 구성한다. 제안하는 트리가 어떻게 생성되는지 보이고 생성된 트리를 의사결정지원 시스템에 적용한다. 다양한 관점에서 분석을 요구하는 사용자를 충족시키는 트리를 구성하여 시각적인 효과와 각 계층간의 분석을 할 수 있는 의사결정지원 시스템을 소개한다.

  • PDF

센서 네트워크에서의 의미있는 데이터 합산 방법 (Data Significance-Based Data Aggregation in Wireless Sensor Networks)

  • 서민호;김태형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(D)
    • /
    • pp.322-327
    • /
    • 2010
  • 센서 네트워크는 언제, 어디서든 네트워크에 접속하여 정보를 얻을 수 있는 유비쿼터스 환경 구축에 가장 적합한 기술이다. 센서 네트워크는 센서를 이용하여 데이터를 수집하는 센서노드와 수집된 데이터를 가공하는 베이스노드로 구성이 되고, 무한에 가까운 에너지를 소유하고 있는 베이스노드와 달리 센서노드는 매우 적은 한정된 에너지를 가지고 있어서 에너지의 효율적 관리에 노력을 기울여야 한다. 본 논문에서는 무선 통신의 데이터양을 줄이는 데이터 합산 기법의 기술에서 모든 노드가 통신하는 것이 아닌, aggregation 값에 영향을 미칠만한 의미있는 값을 수집한 노드의 데이터만 수집하여 합산함으로써, 에너지 소모를 최적화하는 방법을 제안하였으며, 기존의 데이터 합산 방법과 시뮬레이터를 이용하여 그 성능을 비교하여 그 효율성을 실증한다.

  • PDF

지도 일반화를 위한 위상적 일관성 유지 (Topological Consistency in Map Generalization)

  • 최신영;이성희;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.158-160
    • /
    • 1998
  • 지도 제작에 있어서, 기존의 구축된 대축척의 원천 데이터로부터 소축척의 목적 데이터를 추출해 냄으로 데이터 구축을 중복되지 않고 효율적으로 할 수 있게 하는 것을 지도 일반화라고 한다. 초기의 선을 단순화하는 알고리즘 개발과 향상에 대한 연구로부터, 최근에는 자동화를 위한 지식 기반 일반화 및 데이터 품질에 대한 많은 관심과 연구가 진행되고 있다. 최근에 지리 정보 시스템의 발전으로 다양한 공간 분석이 필요하고, 그 성능 향상을 위하여 위상 정보를 구축하게 된다. 그러므로, 본 논문에서는 위상 정보를 가진 원천 데이터 베이스에서, 일반화 연산자가 적용됨으로 발생하게 되는 위상 데이터의 손실과 불일치를 해결하기 위하여 일반화 연산자들이 위상 정보에 미치는 영향과 이를 해결하기 위한 규칙들을 제시한다. 그리고, 지도 일반화 과정에서 위상 정보의 일관성을 유지한 목적 데이터 베이스를 구축하는 시스템을 구현하는 것이 본 논문의 목적이다.