• Title, Summary, Keyword: 주성분분석

Search Result 1,751, Processing Time 0.064 seconds

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography Conference
    • /
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

Principal Component Analysis with Coefficient of Variation Matrix (변동계수행렬을 이용한 주성분분석)

  • Kim, Ji-Hyun
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.3
    • /
    • pp.385-392
    • /
    • 2015
  • Principal component analysis (PCA), a dimension-reduction technique, is usually implemented after the variables are standardized when the measurement unit of variables are different. To standardize a variable we divide it by its standard deviation. But there is another way to transform a variable to be independent of its measurement unit. It is to divide it by its mean rather than standard deviation. Implementing PCA on standardized variables is equivalent to implementing PCA with a correlation matrix of original variables. Similarly, implementing PCA on the transformed variables divided by their means is equivalent to implementing PCA with a matrix related to the coefficients of variation of the original variables. We explain why we need to implement PCA on the variables transformed by their means.

특허분석을 활용한 항해 시스템 기술예측

  • Park, Eun-Ju;Jeong, Jung-Sik
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

Principal component regression for spatial data (공간자료 주성분분석)

  • Lim, Yaeji
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.3
    • /
    • pp.311-321
    • /
    • 2017
  • Principal component analysis is a popular statistical method to reduce the dimension of the high dimensional climate data and to extract meaningful climate patterns. Based on the principal component analysis, we can further apply a regression approach for the linear prediction of future climate, termed as principal component regression (PCR). In this paper, we develop a new PCR method based on the regularized principal component analysis for spatial data proposed by Wang and Huang (2016) to account spatial feature of the climate data. We apply the proposed method to temperature prediction in the East Asia region and compare the result with conventional PCR results.

Extract the main factors related to ground subsidence near abandoned underground coal mine using PCA (PCA 기법을 이용한 폐탄광 지역의 지반침하 관련 요인 추출)

  • Choi, Jong-Kuk;Kim, Ki-Dong
    • Proceedings of the KSRS Conference
    • /
    • /
    • pp.301-304
    • /
    • 2007
  • 본 연구에서는 폐탄광 지역에서 발생하는 지반침하에 영향을 주는 주요 요인들을 추출하기 위하여 다변량 통계분석 방법의 하나인 주성분분석(Principle Component Analysis : PCA)기법과 지리정보시스템 (Geographic Information System : GIS)을 이용하였다. 이를 위해 연구지역에서 수행한 지표지질조사, 정밀조사, 실내암석시험 등으로부터 취득된 자료를 데이터베이스로 구축하고, 지반침하 위험지역 분포를 공간적으로 해석할 수 있는 지질, 토지이용, 경사도, 지표로부터 지하 갱도까지의 심도, 갱도의 지표상 위치로부터의 수평거리, 지하수심도, 투수계수, RMR(Rock Mass Rating) 값을 분석대상으로 선정하였다. 각 요인들이 연구지역 전체에 걸쳐 분포하도록 GIS의 공간분석 기법의 하나인 표면분석(Surface Analysis), 버퍼링기법(Buffering) 및 내삽법(Interpolation)을 이용하여 래스터 데이터베이스로 구축하고 이로부터 추출된 자료들을 입력값으로 하는 주성분분석을 수행하였다. 주성분분석 결과 폐탄광 지역의 지반침하에 영향을 주는 주요인을 추출하는 것이 가능하였으며, 연구지역은 지질 및 지반강도 관련 요인이 침하발생의 가장 큰 요인인 것으로 분석되었다.

  • PDF

A Way of Securing the Access By Using PCA (주성분분석(PCA)을 이용한 출입인원관리에 대한 보안성 확보 방안)

  • Kim, Min-Su;Lee, Dong-Hwi
    • Convergence Security Journal
    • /
    • v.12 no.3
    • /
    • pp.3-10
    • /
    • 2012
  • This study aimed at making a way of securing the access by using PCA. We got our result through using Box-Plot and PCA with the access data of the area of security level A~E at K(IPS)center. In order to perform PCA, We confirmed the extracted value of commonality has no problem in performing PCA because VIF is below 2.902. Based on this result, We classified people into Green-list, Blue-list, Red-list, and Black-list in a standard of security level with 1.453, as the eigen value of 1 main element, 1.283, as eigen value of 2 main elementm, 1.142, as the eigen value of 3 main element.

Multi-temporal Remote Sensing Data Analysis using Principal Component Analysis (주성분분석을 이용한 다중시기 원격탐사 자료분석)

  • Jeong, Jong-Chul
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.2 no.3
    • /
    • pp.71-80
    • /
    • 1999
  • The aim of the present study is to define and tentatively to interpret the distribution of polluted water released from Lake Sihwa into the Yellow Sea using Landsat TM. Since the region is an extreme Case 2 water, empirical algorithms for detecting concentration of chlorophyll-a and suspended sediments have limitations. This work focuses on the use of multi-temporal Landsat TM data. We applied PCA to detect evolution of spatial feature of polluted water after release from the lake Sihwa. The PCA results were compared with in situ data, such as chlorophyll-a, suspended sediments, Secchi disk depth(SDD), surface temperature, remote sensing reflectance at six channel of SeaWiFS. Also, the in situ remote sensing reflectance obtained by PRR-600(Profiling Reflectance Radiometer) was compared with PCA results of Landsat TM data sets to find good correlation between first Principal Component and Secchi disk depth($R^2$=0.7631), although other variables did not result in such a good correlation. Therefore, Problems in applying PCA techniques to multi-spectral remotely sensed data were also discussed in this paper.

  • PDF

Numerical taxonomy of Rhus sensu lato (Anacardiaceae) in Korea (한국산 광의의 붉나무속(Rhus L. sensu lato)의 수리분류학적 연구)

  • Tho, Jae-Hwa;Kim, Joo-Hwan
    • Korean Journal of Plant Taxonomy
    • /
    • v.34 no.3
    • /
    • pp.205-220
    • /
    • 2004
  • Numerical analysis based on the 67 morphological characters from 28 populations of 6 species of Korean Rhus sensu lato (Anacardiaceae) was performed for the taxonomic delimitation. Based on the results of PCA with 47 quantitative characters, the sum of contributions for the total variance of three major principal components was 77,9% (PCl 35.2%, PC2 22.5% and PC3 20.2%). The sum of contributions for the total variance of three major principal components were 90,7% (PCl 37.7%, PC2 33.0% and PC3 20.0%) based on the results of PCA with 20 qualitative The characters. Two dimensional plotting from PCA results recognized six distinct species. UPGMA phenogram based on simple matching coefficient method recognized clear taxonomic delimitations among six taxa. On the cluster analysis, qualitative characters were more useful for grouping the species treated. Numerical analysis was very valuable to delimit the Korean taxa of Rhus s.l.

On-line Nonlinear Principal Component Analysis for Nonlinear Feature Extraction (비선형 특징 추출을 위한 온라인 비선형 주성분분석 기법)

  • 김병주;심주용;황창하;김일곤
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.3
    • /
    • pp.361-368
    • /
    • 2004
  • The purpose of this study is to propose a new on-line nonlinear PCA(OL-NPCA) method for a nonlinear feature extraction from the incremental data. Kernel PCA(KPCA) is widely used for nonlinear feature extraction, however, it has been pointed out that KPCA has the following problems. First, applying KPCA to N patterns requires storing and finding the eigenvectors of a N${\times}$N kernel matrix, which is infeasible for a large number of data N. Second problem is that in order to update the eigenvectors with an another data, the whole eigenspace should be recomputed. OL-NPCA overcomes these problems by incremental eigenspace update method with a feature mapping function. According to the experimental results, which comes from applying OL-NPCA to a toy and a large data problem, OL-NPCA shows following advantages. First, OL-NPCA is more efficient in memory requirement than KPCA. Second advantage is that OL-NPCA is comparable in performance to KPCA. Furthermore, performance of OL-NPCA can be easily improved by re-learning the data.