• 제목/요약/키워드: Statistics Classification

검색결과 858건 처리시간 0.024초

수정된 적응 최근접 방법을 활용한 판별분류방법에 대한 연구 (On the Use of Modified Adaptive Nearest Neighbors for Classification)

  • 맹진우;방성완;전명식
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1093-1102
    • /
    • 2010
  • 비모수적 판별분류방법인 k-Nearest Neighbors Classification(KNNC) 방법은 널리 사용되고 있지만 고정된 이웃의 개수를 사용하며 또한 집단변수의 정보를 활용하지 않음으로서 자료의 국소적 특징을 반영하지 못하는 단점이 있다. Adaptive Nearest Neighbors Classification(ANNC) 방법과 Modified k-Nearest Neighbors Classification(MKNNC) 방법은 각각 이러한 단점들을 보완하기 위해 제안된 방법이다. 본 연구에서는 ANNC 방법과 MKNNC 방법의 장점을 결합한 Modified Adaptive Nearest Neighbors Classification(MANNC) 방법을 제안하였다. 나아가, 제안된 방법의 활용 가능성을 살펴보고자 실제자료에 대한 분석과 모의실험을 통해 기존의 방법들과 비교하였다.

Classification of Microarray Gene Expression Data by MultiBlock Dimension Reduction

  • Oh, Mi-Ra;Kim, Seo-Young;Kim, Kyung-Sook;Baek, Jang-Sun;Son, Young-Sook
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.567-576
    • /
    • 2006
  • In this paper, we applied the multiblock dimension reduction methods to the classification of tumor based on microarray gene expressions data. This procedure involves clustering selected genes, multiblock dimension reduction and classification using linear discrimination analysis and quadratic discrimination analysis.

옥타브밴드 순서 통계량에 기반한 음악 장르 분류 (A Musical Genre Classification Method Based on the Octave-Band Order Statistics)

  • 서진수
    • 한국음향학회지
    • /
    • 제33권1호
    • /
    • pp.81-86
    • /
    • 2014
  • 본 논문은 음악신호의 옥타브 밴드 상에서 주파수와 시간 방향의 순서 통계량에 기반한 음악분류기에 대한 연구이다. 음악의 화음 및 강약 구조를 표현하기 위해서 파워스펙트럼의 옥타브 밴드 순서 통계량을 이용하였다. 널리 사용되고 있는 두 음악 데이터셋을 이용한 성능 실험을 통해서, 옥타브 밴드 순서 통계량이 기존의 MFCC 와 옥타브밴드 스펙트럼 고저차 특징에 비해서 두 데이터셋에대해 각각 2.61 %와 8.9 % 장르 분류정확도가 개선되었다. 실험결과는 옥타브 밴드 순서 통계량이 음악 장르 분류에 적합함을 보인다.

통계학의 학문적 특성에 따른 KDC 문헌분류의 개선방안 (Suggestions for KDC Improvement According to Academic Characteristics of Statistics)

  • 박재혁;김비연
    • 한국도서관정보학회지
    • /
    • 제44권2호
    • /
    • pp.399-422
    • /
    • 2013
  • 이 연구는 KDC에서의 통계학 주제가 사회과학 통계학과 자연과학 수리통계학에 교착분류되는 문제점을 개선하고 세부영역의 체계적 전개방안을 제시하는데 있다. 이를 위해 통계학의 학문적 특성, 국내 대학 통계학과의 현황 및 학과명의 변천과정, 교과과정을 분석하였으며, DDC, LCC, NDC의 문헌분류법과 한국연구재단의 연구분야분류표를 비교 분석하였다. 그 결과 관련학과와 연구분야분류표의 학문적 배경에 따라 사회과학의 통계학을 자연과학 아래로 이치 및 통합하였다. 기존의 사회통계학 주제는 사회과학 연구방법을 보완하여 통계적 연구방법으로 세분하여 전개하였다. 또한, 자연과학의 '확률, 수리통계학'의 표목을 '통계학'으로 수정하고 세부영역의 주제를 체계화하여 확대 전개하였다.

Bivariate ROC Curve and Optimal Classification Function

  • Hong, C.S.;Jeong, J.A.
    • Communications for Statistical Applications and Methods
    • /
    • 제19권4호
    • /
    • pp.629-638
    • /
    • 2012
  • We propose some methods to obtain optimal thresholds and classification functions by using various cutoff criterion based on the bivariate ROC curve that represents bivariate cumulative distribution functions. The false positive rate and false negative rate are calculated with these classification functions for bivariate normal distributions.

Classification via principal differential analysis

  • Jang, Eunseong;Lim, Yaeji
    • Communications for Statistical Applications and Methods
    • /
    • 제28권2호
    • /
    • pp.135-150
    • /
    • 2021
  • We propose principal differential analysis based classification methods. Computations of squared multiple correlation function (RSQ) and principal differential analysis (PDA) scores are reviewed; in addition, we combine principal differential analysis results with the logistic regression for binary classification. In the numerical study, we compare the principal differential analysis based classification methods with functional principal component analysis based classification. Various scenarios are considered in a simulation study, and principal differential analysis based classification methods classify the functional data well. Gene expression data is considered for real data analysis. We observe that the PDA score based method also performs well.

전기화재 조사 및 통계의 신뢰성 향상을 위한 원인분류방법의 개발 (Development of Cause Classification Method for Improving Reliability of Electrical Fire Statistics)

  • 전정채;전현재;이상익;유재근
    • 한국산학기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.466-471
    • /
    • 2007
  • 전기화재는 전체 화재의 30% 이상을 차지하고 있지만 전기화재 통계의 신뢰성에 대한 검토가 제대로 이루어지지 못하였다. 전기화재는 원인분류 방법 또는 체계의 미흡으로 전기적 요인이 아닌 경우에도 전기화재로 분류되어 높은 점유율을 차지하게 되었고 그로 인한 전기화재 통계의 문제점이 제기되었다. 따라서 기존의 전기화재 원인 분류 방법의 개선을 통해 전기화재 통계의 신뢰성 확보가 필요하다. 본 논문에서는 기존의 전기화재 원인분류에 따른 전기화재 조사 및 통계의 문제점을 분석하였고 새로운 전기화재 원인분류 방법을 제시하였다.

  • PDF

Binary classification on compositional data

  • Joo, Jae Yun;Lee, Seokho
    • Communications for Statistical Applications and Methods
    • /
    • 제28권1호
    • /
    • pp.89-97
    • /
    • 2021
  • Due to boundedness and sum constraint, compositional data are often transformed by logratio transformation and their transformed data are put into traditional binary classification or discriminant analysis. However, it may be problematic to directly apply traditional multivariate approaches to the transformed data because class distributions are not Gaussian and Bayes decision boundary are not polynomial on the transformed space. In this study, we propose to use flexible classification approaches to transformed data for compositional data classification. Empirical studies using synthetic and real examples demonstrate that flexible approaches outperform traditional multivariate classification or discriminant analysis.

초고차원 다범주분류를 위한 변수선별 방법 비교 연구 (A comparative study of feature screening methods for ultrahigh dimensional multiclass classification)

  • 이경은;김경희;신승준
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.793-808
    • /
    • 2017
  • 본 논문에서는 초고차원 자료의 다항분류를 위한 변수선별 방법에 대해 비교 연구를 진행하였다. 다항분류를 위한 변수선별 방법에는 일대일 혹은 일대다 비교를 통해 이항분류를 위한 방법을 확장시켜 적용하는 방법과 다항 반응 변수에 직접 적용할 수 있는 방법이 있다. 다항분류를 위한 변수선별 성능을 확인하기 위하여 여러가지 상황-설명변수의 꼬리가 두꺼운 경우, 신호변수와 잡음변수가 서로 연관된 경우, 결합분포상으로 연관되어 있지만 주변분포 상으로는 연관되어 있지 않은 경우, 다범주 반응변수의 분포가 불균형인 경우-을 가정하고 모의실험을 진행하였고, 실제 자료에도 적용해 보았다. 그 결과, 모형 가정을 필요로 하지 않는 방법들이 안정적인 성능을 보이는 것을 확인하였다.

Object-oriented Classification and QuickBird Multi-spectral Imagery in Forest Density Mapping

  • Jayakumar, S.;Ramachandran, A.;Lee, Jung-Bin;Heo, Joon
    • 대한원격탐사학회지
    • /
    • 제23권3호
    • /
    • pp.153-160
    • /
    • 2007
  • Forest cover density studies using high resolution satellite data and object oriented classification are limited in India. This article focuses on the potential use of QuickBird satellite data and object oriented classification in forest density mapping. In this study, the high-resolution satellite data was classified based on NDVI/pixel based and object oriented classification methods and results were compared. The QuickBird satellite data was found to be suitable in forest density mapping. Object oriented classification was superior than the NDVI/pixel based classification. The Object oriented classification method classified all the density classes of forest (dense, open, degraded and bare soil) with higher producer and user accuracies and with more kappa statistics value compared to pixel based method. The overall classification accuracy and Kappa statistics values of the object oriented classification were 83.33% and 0.77 respectively, which were higher than the pixel based classification (68%, 0.56 respectively). According to the Z statistics, the results of these two classifications were significantly different at 95% confidence level.