• Title, Summary, Keyword: 가중치

Search Result 4,523, Processing Time 0.051 seconds

The Impact of Combining Term Wights on Retrieval Effectiveness (용어가중치 결합이 검색 효율성에 미치는 영향 연구)

  • 최성환;정영미
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문에서는 데이터 결합 영역에서 문서값을 정규화 하는 기법과 결합함수에 따라 용어가중치 결합이 검색성능에 어떤 영향을 미치는가를 분석하였으며, 특히 용어가중치 결합이 실질적으로 효율적인가를 성능 향상률 측면과 검색시스템의 효율성 측면에서 검증하고, 성능이 향상된 용어가중치 결합의 특징을 분석하였다. 실헙결과 대부분의 장어가중치 결합은 문서값 정규화 기법과 실험집단에 관계없이 높은 성능 향상률을 보이지 않았다. 특히 단일가중치고 높은 검색성능을 보였던 상위 가중치 알고리즘들은 다른 가중치 알고리즘과 결합할 경우 두드러진 성능 향상률을 보이지 않았다. 검색시스템의 효율성 측면에서 용어가중치 결합을 평가한 결과 문헌 내 단어빈도를 최대단어 빈도로 정규화한 가중치 알고리즘이 코사인 정규화 기법을 적용한 가중치 알고리즘들과 결합될 때 5개 실험집안에서 최적 단일가중치 보다 2% 이상 높은 성능을 보였다. 이는 서로 다른 특성을 지니는 용어가중치 알고리즘들이 장단점을 보완하여 검색성능을 향상시킨 수 있다는 것을 의미한다. 그러나 용어가중치 결합의 효율성은 컬렉션과 가중치 알고리즘의 특성에 의존적이었으며, 비록 각 용어가중치 결합의 성능이 높게 나타날지라도 최적의 성능을 보인 달일가중치와 비교하면 그 성능 차이가 미미하거나 낮아서 대부분의 용어가중치 결합이 실질적으로 효과적이지 못하였다.

  • PDF

A Study on Analysis of Dynamic Generation of Initial Weights in EBP Learning (EBP 신경망 학습에서의 동적 초기 가중치 선택에 관한 연구)

  • Kim, Tea-Hun;Lee, Yill-Byung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.35-38
    • /
    • 2006
  • 다층 퍼셉트론(MLP) 학습 이론인 오류 역전파 알고리즘은 델타룰과 최급 하강법을 사용하기 때문에 학습시 많은 시간이 소요된다는 단점을 가지고 있다. 때문에 신경망에서의 잘못된 초기 가중치 선택은 오류 역전파 알고리즘을 사용하는 신경망에서의 현격한 학습 성능저하를 발생시키게 된다. 본 논문에서는 학습시 오류 역전파 알고리즘의 수렴시간을 개선하기 위한 신경망의 동적 초기 가중치 선택 알고리즘을 제안한다. 이 알고리즘은 학습전 기존의 선택 가중치와 모든 가중치가 1.0 또는 -1.0 값을 가지는 가중치 집합에서 가중치 변동률을 선측정하여 이들 중 가장 변동률이 큰 경우를 초기 가중치 집합으로 선정하게 된다. 즉, 초기의 가중치 변동률을 차후 성능을 판단하는 지표로 사용하여 잘못된 가중치 선택으로 인한 최악의 학습효율의 가능성을 배제시키고 다층 신경망의 학습특성상 평균 이상의 학습효율을 보장하는 초기 가중치 선택방법이다.

  • PDF

Weight Adjustment Methods Based on Statistical Information for Fuzzy Weighted Mean Classifiers (퍼지 가중치 평균 분류기를 위한 통계적 정보 기반의 가중치 설정 방안)

  • Shin, Sang-Ho;Cho, Jae-Hyun;Woo, Young-Woon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • /
    • pp.25-30
    • /
    • 2009
  • 패턴 인식에서 분류기 모형으로 많이 사용되는 퍼지 가중치 평균 분류기는 가중치를 적절히 설정함으로써 뛰어난 분류 성능을 얻을 수 있다는 장점이 있다. 그러나 일반적으로 가중치는 인식 문제 분야의 특성이나 해당 전문가의 지식이나 주관적 경험을 기반으로 설정되므로 설정된 가중치의 일관성과 객관성을 보장하기가 어려운 문제점을 갖고 있다. 따라서 이 논문에서는 퍼지 가중치 평균 분류기의 가중치를 설정하기 위한 객관적 기준을 제시하기 위하여 특징값들 간의 통계적 정보를 이용한 가중치 설정 기법들을 제안하였다. 제안한 기법들을 이용하여 UCI machine learning repository 사이트에서 제공되는 표준 데이터들 중의 하나인 Iris 데이터 세트를 이용하여 실험하고 그 결과를 비교, 분석하였다.

  • PDF

The eight decision which it follows in XML tag classification (XML 태그 분류에 따른 가중치 결정)

  • Jeong, Hye-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.703-706
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

Proposal of Weight Adjustment Methods Using Statistical Information in Fuzzy Weighted Mean Classifiers (퍼지 가중치 평균 분류기에서 통계 정보를 활용한 가중치 설정 기법의 제안)

  • Woo, Young-Woon;Heo, Gyeong-Yong;Kim, Kwang-Baek
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.7
    • /
    • pp.9-15
    • /
    • 2009
  • The fuzzy weighted mean classifier is one of the most common classification models and could achieve high performance by adjusting the weights. However, the weights were generally decided based on the experience of experts, which made the resulting classifiers to suffer the lack of consistency and objectivity. To resolve this problem, in this paper, a weight deciding method based on the statistics of the data is introduced, which ensures the learned classifiers to be consistent and objective. To investigate the effectiveness of the proposed methods, Iris data set available from UCI machine learning repository is used and promising results are obtained.

  • PDF

Estimation of Weights for Flood Vulnerability Indicators (홍수위험도 평가인자의 가중치 추정)

  • Lee, Gyu-Min;Chung, Eun-Sung;Jun, Kyung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.415-415
    • /
    • 2012
  • 유역의 홍수위험도를 평가하기 위하여 선행 연구로서 DPSIR framework를 적용한 인자를 선정하였다. 이때 인자의 범위를 사회적, 경제적, 환경적 분야로 구분하고 각 분야에 대하여 홍수로 인하여 야기되는 유역의 다양한 영향요소를 포함하여 인자를 선정하였다. 본 연구에서는 이를 대상으로 각 인자의 가중치를 선정하기 위하여 패널식 조사연구기법인 Delphi 방법을 적용하였다. Delphi 기법은 델파이 절차가 반복되는 동안 조사 참여자에게 전회의 조사 결과, 즉 통계적 집단 반응을 피드백하며 참여자는 이를 참고하여 자신의 판단을 수정 보완 할 수 있는 방법이다. 따라서 1차 설문조사를 통하여 각 패널은 홍수위험도 평가 인자에 대해서 주관적인 가중치를 선정하고 이를 분석한 결과를 피드백 받아 참고한 후 2차 설문조사에 응하여 가중치를 재선정하게 된다. 조사에 참여할 패널의 선정은 수자원분야의 전문가를 대상으로 하였다. 또한 각 인자에 대한 가중치를 수집하는 방법을 다양하게 설정하여 기법에 따른 영향을 검토하였다. 수집기법은 상대적 가중치 결정법 중에서 가장 많이 사용되는 순위법과 직접입력법, 절대적인 기준에 대한 가중치를 수집하기 위하여 Fuzzy 가중치 입력법을 사용하였으며 이 때 각 인자가 소속되는 분야와 DPSIR framework 요소에 대해서도 별도로 가중치를 수집하여 최종적인 인자의 가중치를 결정하였다. 본 연구는 추가 연구를 통해 남한강에 적용되며 인자의 자료는 문헌조사, 통계자료 조사 및 수리학적 수치모형 등의 분석을 통해 수집될 예정이다. 이를 통하여 사회, 경제, 문화, 환경적인 측면을 고려한 인자들을 반영한 하천의 구간별 상대적 홍수취약도를 정량적으로 제시할 수 있으며 하천 구간별 치수관리 우선순위를 결정하는데 적극적으로 활용될 수 있다.

  • PDF

Weight Function on the Fuzzy Set membership and its Application to the Defuzzification (퍼지 집합의 소속함수에 대한 가중치 함수와 비퍼지화에서의 적용)

  • 정성원;이광형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.331-333
    • /
    • 2001
  • 본 논문에서는 퍼지집합의 소속함수에 대한 가중치 함수를 제안한다. 제안하는 가중치 함수는 퍼지집합의 소속함수에 곱해지는 형태로서 적용되어지며, 이것은 소속함수에 대한 사용자의 선호도를 의미한다. 제안하는 가중치 함수의 개념은 기본적으로 소속함수를 사용하는 어떤 퍼지 집합의 응용에서도 적용될 수 있을 것으로 보이나, 본 논문에서는 그 중 한가지 경우로 비퍼지화 방법을 적용 대상으로 선택하였다. 제안하는 가중치 함수가 비퍼지화 방법에 있어서 가지는 의미를 보이며, 기존의 비퍼지화 방법들에서 이러한 가중치 함수의 개념이 어떻게 적용되어 왔는지를 보인다. 또한 기존의 비퍼지화 방법들이 개녀멩 적용되지 않은 형태의 가중치 함수를 선택하여, 비퍼지화 방법에 특정 가중치 함수를 적용하였을 때의 특성 변화를 보인다. 이러한 일반적인 형태의 가중치 함수를 퍼지집합의 소속함수에 적용함으로서, 다양한 형태의 선호도를 퍼지집합의 형태에 반영할 수 있을 것으로 보인다.

  • PDF

Weighting Methods and their Evaluations for Compound Nouns in Korean Text Retrieval (한국어 정보검색에서의 복합명사 가중치 부여 방법 및 평가)

  • Kim, Ji-Young;Sung, Hyon-Myaeng
    • Annual Conference on Human and Language Technology
    • /
    • /
    • pp.157-162
    • /
    • 2001
  • 한국어의 경우 띄어쓰기의 자유로움과 명사들이 비교적 자유롭게 결합하여 새로운 복합명사(compound noun)를 형성한다. 따라서, 정보검색에서 복합명사를 적절하게 처리하게 되면 검색 효율을 향상시킬 수 있다. 본 논문에서는 질의에 포함된 단일명사, 복합명사, 그리고 복합명사를 이루는 구성명사의 적절한 가중치 부여 방법에 대하여 기술한다. 일반적인 tf*idf가중치 방법은 문서 내 빈도수(tf)만을 강조하여 문서 내 발생빈도가 낮은 복합명사의 경우 낮은 가중치를 갖는다. 반대로, 역문헌 빈도수(idf)로 인해 복합명사가 단일명사보다 높은 가중치를 갖게 되면 단일명사의 가중치를 지나치게 떨어뜨려 검색 성능을 저하시킨다. 이런 문제를 해결하기 위해서 복합명사의 통계적인 특성을 고려하고, 복합명사를 이루는 구성명사의 적절한 가중치 사용과 tf*idf 변화 범위에 따른 파라메터를 이용하였다. 결과적으로 본 논문에서는 질의 색인어의 종류에 따라 가중치를 달리 부여함으로써 검색 성능을 향상시킬 수 있는 가중치 부여 방법을 제시하고 검증 실험을 통해 유효성을 제시했다는 점에서 그 의의가 있다고 하겠다.

  • PDF

Term Weighting Method for Natural Language Query Sentence (자연언어 질의 문장의 용어 가중치 부여 기법)

  • Kang, Seung-Shik;Lee, Ha-Gyu;Son, So-Hyun;Moon, Byung-Joo;Hong, Gi-Choi
    • Annual Conference on Human and Language Technology
    • /
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

The Weighting Adjustment of Korea Welfare Panel Study

  • Son, Chang-Gyun;Ryu, Je-Bok;Hong, Gi-Hak;Lee, Gi-Seong
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • /
    • pp.11-40
    • /
    • 2006
  • 시간의 흐름에 따라 사회 구성원들에 대한 행태 연구나 사회의 변화가 개인의 행동양식에 미치는 영향 등에 대한 조사에서는 어느 한 시점에서의 구성원들에 대한 횡단면 조사와는 다르게 다년간 지속적으로 조사개체를 추적조사 해야 하는 종단면 조사 또는 패널조사를 수행해야 한다. 패널조사는 횡단면 조사와는 달리 최초 표본이 시간이 지남에 따라 조사 대상 표본으로부터 탈락함으로서 발생하는 표본의 마모와 그에 따른 대표성 상실의 문제이다. 그러므로 이러한 표본의 대표성 상실 문제를 적절히 해결하기 위해 적용 가능한 방법이 가중치 조정 방법이다 횡단면 조사에서는 (1)추출가중치의 조정, (2)무응답 가중치 조정, (3)사후층화 가중치 조정과 같이 3단계의 가중치 조정과정을 수행하지만, 패널 조사의 경우 이와 더불어 원 표본의 대표성을 유지하기 위해 종단면 가중치(longitudinal weight)를 함께 고려해야 한다. 이러한 관점에서 본 연구에서는 다양한 패널형태에 따른 가중치 조정 방법에 대해 고찰하고, 향후 수행될 한국복지패널(Korea Welfare Panel Study: KWPS)의 가중치 산정에 관한 이론적 근거를 마련함과 동시에 현재 국내에서 수행되고 있는 패널조사의 가중치 조정방법과 비교하고자 한다.

  • PDF