• 제목/요약/키워드: canonical correlation analysis

검색결과 206건 처리시간 0.026초

Semi-Partial Canonical Correlation Biplot

  • Lee, Bo-Hui;Choi, Yong-Seok;Shin, Sang-Min
    • 응용통계연구
    • /
    • 제25권3호
    • /
    • pp.521-529
    • /
    • 2012
  • Simple canonical correlation biplot is a graphical method to investigate two sets of variables and observations in simple canonical correlation analysis. If we consider the set of covariate variables that linearly affects two sets of variables, we can apply the partial canonical correlation biplot in partial canonical correlation analysis that removes the linear effect of the set of covariate variables on two sets of variables. On the other hand, we consider the set of covariate variables that linearly affect one set of variables but not the other. In this case, if we apply the simple or partial canonical correlation biplot, we cannot clearly interpret other two sets of variables. Therefore, in this study, we will apply the semi-partial canonical correlation analysis of Timm (2002) and remove the linear effect of the set of covariate variables on one set of variables but not the other. And we suggest the semi-partial canonical correlation biplot for interpreting the semi-partial canonical correlation analysis. In addition, we will compare shapes and shape the variabilities of the simple, partial and semi-partial canonical correlation biplots using a procrustes analysis.

Higher-order solutions for generalized canonical correlation analysis

  • Kang, Hyuncheol
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.305-313
    • /
    • 2019
  • Generalized canonical correlation analysis (GCCA) extends the canonical correlation analysis (CCA) to the case of more than two sets of variables and there have been many studies on how two-set canonical solutions can be generalized. In this paper, we derive certain stationary equations which can lead the higher-order solutions of several GCCA methods and suggest a type of iterative procedure to obtain the canonical coefficients. In addition, with some numerical examples we present the methods for graphical display, which are useful to interpret the GCCA results obtained.

편정준상관 행렬도 (Partial Canonical Correlation Biplot)

  • 염아림;최용석
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.559-566
    • /
    • 2011
  • 행렬도는 이원표 자료행렬의 행과 열을 탐색하기에 유용한 그래프적 방법이다. 특히, 정준상관 행렬도는 정준상관분석의 결과를 이용하여 두 변수군과 개체간의 관계를 기하적으로 살펴볼 수 있다. 그 반면에 자료의 성격에 따라 세개 이상의 변수군이 존재하는 경우에는 정준상관분석의 개념에서 확장한 일반화 정준상관분석을 이용하여 일반화 정준상관 행렬도를 고려할 수 있다. 그러나 자료의 성격에 따라 두 변수군 외에 이들 두 변수군에 선형적 영향을 미치는 공변량변수로 이루어진 다른 한 변수군이 존재하는 경우에, 일반화 정준상관 행렬도를 적용한다면 공변량변수군의 영향력 때문에 주 관심인 두 변수군에 대하여 잘못 해석할 수 있다. 따라서 본 연구에서는 Rao (1969)의 공변량 변수군의 영향력을 제거한 편정준상관분석을 살펴보고, 이를 기하적으로 해석하기 위한 편정준상관 행렬도를 제안한다.

Canonical Correlation: Permutation Tests and Regression

  • Yoo, Jae-Keun;Kim, Hee-Youn;Um, Hye-Yeon
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.471-478
    • /
    • 2012
  • In this paper, we present a permutation test to select the number of pairs of canonical variates in canonical correlation analysis. The existing chi-squared test is known to be limited to normality in use. We compare the existing test with the proposed permutation test and study their asymptotic behaviors through numerical studies. In addition, we connect canonical correlation analysis to regression and we we show that certain inferences in regression can be done through canonical correlation analysis. A regression analysis of real data through canonical correlation analysis is illustrated.

Nonlinear Canonical Correlation Analysis for Paralysis Disease Data

  • Shin, Yang-Kyu
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권3호
    • /
    • pp.515-521
    • /
    • 2004
  • Categorical data are mostly found in oriental medical research. The nonlinear canonical correlation analysis does not assume an interval level of measurement. In this paper, we apply nonlinear canonical correlation analysis to quantification and explain how similar sets of variables are to one another for paralysis disease data.

  • PDF

덕유산 지의식물 분포에 대한 정준분석법의 적용연구 (An Application of Canonical Analysis on the Distribution of Lichens in Mt. Duckyuoo)

  • Park, Seung Tai
    • The Korean Journal of Ecology
    • /
    • 제9권3호
    • /
    • pp.135-147
    • /
    • 1986
  • The simplification and the searching trends of complex data which assumed relationship between predictor variables and object variables are one of primary objective of ecological research. This study was aimed to apply cononical analysis consisting of canonical correlation analysis and canonical variate analysis related to lichen vegetation and several environmental variables which are elevation, height on grond, exposure side and cover values. Data collected from the Duckyoo National Park in August 1985. Lichen species was ranked by eqivocation information theory with cover values. Canonical correlation analysis was applied to one data set both set both environmental variables and lichem family. In order to make two sets of data matrix the scale of position vector ordination was calculated from the vector scalar product for lichen species. Canonical variate analysis was applied to rearranged data which was made by interval class code for environmental variables. The sharpness values was calculated in frequency of cotingency tables and the dispersion profiles of each species in classes of environmental variables was designed to extract component values based on the decomposition of expected frequencies in contingency table. The results of canonical correlation analysis revealed canonical first correlation value 0.815(89%), and second correlation value 0.083(11%). Significance test showed that the hypothesis of joint mutuallity of canonical correlation is accepted (P>0.05). The relation between canonical score of vegetation variables and that of environmental variable indicated linear tendency.

  • PDF

An Application of Canonical Correlation Analysis Technique to Land Cover Classification of LANDSAT Images

  • Lee, Jong-Hun;Park, Min-Ho;Kim, Yong-Il
    • ETRI Journal
    • /
    • 제21권4호
    • /
    • pp.41-51
    • /
    • 1999
  • This research is an attempt to obtain more accurate land cover information from LANDSAT images. Canonical correlation analysis, which has not been widely used in the image classification community, was applied to the classification of a LANDSAT images. It was found that it is easy to select training areas on the classification using canonical correlation analysis in comparison with the maximum likelihood classifier of $ERDAS^{(R)}$ software. In other words, the selected positions of training areas hardly affect the classification results using canonical correlation analysis. when the same training areas are used, the mapping accuracy of the canonical correlation classification results compared with the ground truth data is not lower than that of the maximum likelihood classifier. The kappa analysis for the canonical correlation classifier and the maximum likelihood classifier showed that the two methods are alike in classification accuracy. However, the canonical correlation classifier has better points than the maximum likelihood classifier in classification characteristics. Therefore, the classification using canonical correlation analysis applied in this research is effective for the extraction of land cover information from LANDSAT images and will be able to be put to practical use.

  • PDF

정준상관분석을 통한 다변량 금융시계열의 변동성 분석 (Multivariate Volatility Analysis via Canonical Correlations for Financial Time Series)

  • 이승연;황선영
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1139-1149
    • /
    • 2014
  • 다변량 금융시계열의 변동성분석을 다변량 기법인 정준상관분석(canonocal correaltion analysis)을 이용해 분석하였다. 변동성의 특성상 계수들이 비음(non-negative)인 정준상관분석, 즉, non-negative and sparse canonical correlation analysis (NSCCA)를 이용해 보았다. 본 논문은 다변량 시계열의 변동성 커브에 대해 연구하고 있으며 제시된 방법론을 이변량 주식자료분석을 통해 예시해 보았다.

일반화 정준상관 행렬도와 프로크러스티즈 분석을 응용한 대한테니스협회 등록 선수의 체격요인, 체력요인 및 기초기술요인에 대한 분석연구 (A Study on the Relationship between Physique, Physical Fitness and Basic Skill Factors of Tennis Players in the Korea Tennis Association Using the Generalized Canonical Correlation Biplot and Procrustes Analysis)

  • 최태훈;최용석
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.917-925
    • /
    • 2010
  • 일반적으로 정준상관 행렬도(canonical correlation biplot)는 정준상관분석에서 두 변수집단에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 이를 활용하여 최태훈과 최용석 (2008)은 2006년도 한국여자골프협회(KLPGA) 선수에 대한 기술요인 변수군과 경기성적요인 변수군간의 관련성을 살펴보았고 최태훈 등 (2009)은 테니스 그랜드 슬램대회 선수특성요인과 경기요인에 대한 분석을 하였다. 더군다나 세 변수군 이상의 정준상관분석을 일반화 정준상관분석(generalized canonical correlation analysis)이라 하며 이와 관련하여 허명회 (1999, 6장)는 수량화 플롯을 제안하고있다. 이를 행렬도의 의미에서 일반화 정준상관 행렬도(generalized canonical correlation biplot)라하자. 본 연구에서는 대한 테니스협회(KTA)에 등록된 남자선수들 중 상위50명의 체격요인, 체력요인 및 기초기술요인에 대한 분석을 일반화 정준상관 행렬도를 적용하여 살펴보고 프로크러스티즈 분석을 통하여 전체선수, 상위랭킹과 하위랭킹 선수간의 행렬도 형상비교를 시도 하였다.

테니스 그랜드슬램대회의 선수특성요인과 경기요인에 대한 분석연구 -정준상관 행렬도와 프로크러스티즈 분석의 응용- (A Study on the Relationship between Player Characteristic Factors and Competitive Factors of Tennis Grand Slams Competition Using Canonical Correlation Biplot and Procrustes Analysis)

  • 최태훈;최용석;신상민
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.855-864
    • /
    • 2009
  • 정준상관 행렬도(canonical correlation biplot)는 정준상관분석(canonical correlation analysis)에서 두 변수 집단에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 최태훈과 최용석 (2008)는 2006년도 KLPGA 선수를 대상으로 정준상관 행렬도를 통해 기술요인변수군과 경기성적요인변수군간의 관련성을 살펴보고 군집분석을 활용하여 각 선수들의 군집을 시도하였다. 프로크러스티즈 분석(Procrustes analysis)은 두 형상(shape)의 유사성을 비교하는 데 사용되는 기법이다. 본 연구에서는 테니스 그랜드슬램대회의 선수특성요인변수군과 경기요인변수군에 대한 분석연구를 정준상관 행렬도를 적용하여 살펴보고 프로크러스티즈 분석을 통하여 행렬도 형상비교를 하였다.