• 제목/요약/키워드: variable selection

검색결과 874건 처리시간 0.03초

전산유체역학을 위한 일반 곡률좌표계에서 운동량 방정식의 종속변수 선정에 관한 연구 (A Study on the Selection of Dependent Variables of Momentum Equations in the General Curvilinear Coordinate System for Computational Fluid Dynamics)

  • 김원갑;최영돈
    • 대한기계학회논문집B
    • /
    • 제23권2호
    • /
    • pp.198-209
    • /
    • 1999
  • This study reports the selection of dependent variables for momentum equations in general curvilinear coordinates. Catesian, covariant and contravariant velocity components were examined for the dependent variable. The focus of present study is confined to staggered grid system Each dependent variable selected for momentum equations are tested for several flow fields. Results show that the selection of Cartesian and covariant velocity components intrinsically can not satisfy mass conservation of control volume unless additional converting processes ore used. Also, Cartesian component can only be used for the flow field in which main-flow direction does not change significantly. Convergence rate for the selection of covariant velocity component decreases quickly as with the increase of non-orthogonality of grid system. But the selection of contravariant velocity component reduces the total mass residual of discretized equations rapidly to the limit of machine accuracy and the solutions are insensitive to the main-flow direction.

일반화가법모형에서 축소방법의 적용연구 (A Study on Applying Shrinkage Method in Generalized Additive Model)

  • 기승도;강기훈
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.207-218
    • /
    • 2010
  • 일반화가법모형은 기존 선형회귀모형의 문제점을 대부분 해결한 통계모형이지만 의미있는 독립변수의 수를 줄이는 방법이 적용되지 않을 경우 과대적합 문제가 발생할 수 있다. 그러므로 일반화가법모형에서 변수 축소방법을 적용하는 연구가 필요하다. 회귀분석에서 변수 축소방법으로 최근에는 Lasso 계열의 접근법이 연구되고 있다. 본 연구에서는 활용성이 높은 통계모형인 일반화가법모형에 Lasso 계열의 모형 중에서 Group Lasso와 Elastic net 모형을 적용하는 방법을 제시하고 이들의 해를 구하는 절차를 제안하였다. 그리고 제안된 방법을 모의실험과 실제자료인 회계년도 2005년 자동차보혐 자료에 적용을 통해 비교하여 보았다. 그 결과 본 논문에서 제안한 Group Lasso와 Elastic net을 이용하여 변수 축소를 통한 일반화가법모형이 기존의 방법보다 더 나은 결과를 제공하는 것으로 분석 되었다.

이분산 상황 하에서 정규혼합모형 기반 군집분석의 변수선택 (Variable Selection in Normal Mixture Model Based Clustering under Heteroscedasticity)

  • 김승구
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1213-1224
    • /
    • 2011
  • 관측치의 개수보다 변량의 개수가 더 많은 다변수 상황에서 정규혼합모형을 이용하여 군집분석을 하기 위해서는 비정보적인 변수들을 제거하는 과정이 필수적으로 요구된다. 이와 같은 변수선택과 군집의 동시 처리를 위한 기존 연구의 대부분은 군집별 등분산 가정 하에서 이루어져 왔으며, 비정보적인 변수를 제거하기 위해 주로 벌점화 우도 기법이 이용되었다. 본 연구에서는 약간 변형된 정규혼합모형을 기반으로 비현실적인 등분산 가정을 탈피하면서 효율적으로 비정보적인 변수를 제거하는 새로운 방법을 제공한다. 이 모형에 대한 타당성을 설명하였고, 모수 추정을 위한 EM 알고리즘을 유도하였다. 그리고 모의실험 및 실자료 실험을 통해 제안된 방법의 유효성을 보였다.

회귀변수 선택절차를 이용한 인터넷통신 네트워크 품질특성과 고객만족도의 관계 실증분석 (Empirical Analysis of Relationship between Internet Communication Network Quality Characteristics and Customer Satisfaction using Regression Variable Selection Procedures)

  • 박성민;박영준
    • 산업공학
    • /
    • 제18권3호
    • /
    • pp.253-267
    • /
    • 2005
  • Customer satisfaction becomes one of the important managerial concerns associated with corporate competency in current competitive environment for Internet communication service companies. Hence, it is demanding to improve a company's customer satisfaction through the total quality management perspective. In practice, engineers as well as the management hope to find major quality characteristics with Internet communication network that is closely related to customer satisfaction, consequently aiming to the raise of their company's customer satisfaction. This paper presents an empirical relationship analysis between network quality characteristics and customer satisfaction on Internet communication. Methodologically, the relationship analysis framework is based on the regression variable selection procedures. In this framework, it is implemented that; 1) iterative model building; and 2) consistent criteria application to statistical tests for selecting significant variables. A case study shows that; 1) the customer satisfaction on the network connection seems to be more closely related to the network quality characteristics compared with the customer satisfaction on the network speed; and 2) the download disconnection rate has relatively evident relationship with the customer satisfaction on the network connection.

벌점함수를 이용한 부분최소제곱 회귀모형에서의 변수선택 (Variable Selection in PLS Regression with Penalty Function)

  • 박종선;문규종
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.633-642
    • /
    • 2008
  • 본 논문에서는 반응변수가 하나 이상이고 설명변수들의 수가 관측치에 비하여 상대적으로 많은 경우에 널리 사용되는 부분최소제곱회귀모형에 벌점함수를 적용하여 모형에 필요한 설명변수들을 선택하는 문제를 고려하였다. 모형에 필요한 설명변수들은 각각의 잠재변수들에 대한 최적해 문제에 벌점함수를 추가한 후 모의담금질을 이용하여 선택하였다. 실제 자료에 대한 적용 결과 모형의 설명력 및 예측력을 크게 떨어뜨리지 않으면서 필요없는 변수들을 효과적으로 제거하는 것으로 나타나 부분최소제곱회귀모형에서 최적인 설명변수들의 부분집합을 선택하는데 적용될 수 있을 것이다.

대학 졸업생의 직업선택과 임금 수준 (An Analysis of Job Selection, Major-Job Match and Wage Level of College Graduates)

  • 박재민
    • 기술혁신학회지
    • /
    • 제14권1호
    • /
    • pp.22-39
    • /
    • 2011
  • 본 논문은 대학 졸업생의 숙련 불일치 문제에 대한 분석의 일환으로 임금으로 대표되는 노동시장성과에 대해 전공-직업 일치의 시각에서 접근한 것이다. 실증 분석에 있어서는 선행연구들에서 자주 제기되었던 표본선택편의 문제를 명시적으로 분석 과정에 반영하였고, 분석의 편의상 이항변수로 취급되었던 전공직업일치 변수도 설문조사가 제공한 다항선택변수로 설정하여 분석하였다. 특히 1982년, 1992년, 2002년 세 코호트에 대한 조사 결과를 활용하여 비교적 장기간에 걸친 노동시장의 구조적 변화도 고려하고자 하였다. 실증분석 결과, 전공일치 직업선택에 따른 표본선택편의와 전공직업일치의 임금효과를 확인할 수 있었다. 또 전공직업일치 정도와 비례해 임금프리미엄도 체증하고, 특히 전공계열별 분석을 통해 사회 계열, 공학 계열, 자연 계열에서 전공과 직업이 일치한 경우 상대적으로 높은 임금을 확인할 수 있었다. 그러나 전공 계열별로 선택편의의 영향에 차이가 있음도 볼 수 있었다. 또 1982년, 1992년, 2002년을 비교하면 1992년에 전공직업일치 경향은 급격히 낮아졌고 1992년과 2002년의 차이는 오히려 크지 않아 이 같은 숙련 불일치 현상이 상당히 오래 전부터 진행되어 온 현상임을 확인할 수 있었다.

  • PDF

A small review and further studies on the LASSO

  • Kwon, Sunghoon;Han, Sangmi;Lee, Sangin
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1077-1088
    • /
    • 2013
  • High-dimensional data analysis arises from almost all scientific areas, evolving with development of computing skills, and has encouraged penalized estimations that play important roles in statistical learning. For the past years, various penalized estimations have been developed, and the least absolute shrinkage and selection operator (LASSO) proposed by Tibshirani (1996) has shown outstanding ability, earning the first place on the development of penalized estimation. In this paper, we first introduce a number of recent advances in high-dimensional data analysis using the LASSO. The topics include various statistical problems such as variable selection and grouped or structured variable selection under sparse high-dimensional linear regression models. Several unsupervised learning methods including inverse covariance matrix estimation are presented. In addition, we address further studies on new applications which may establish a guideline on how to use the LASSO for statistical challenges of high-dimensional data analysis.

결혼유형에 따른 배우자 선택 과정의 차이에 관한 연구 - 취업 여성을 중심으로 - (A Study on Marriage Types and Courtship - focused on working women -)

  • 김진희;김양희
    • 대한가정학회지
    • /
    • 제37권12호
    • /
    • pp.13-28
    • /
    • 1999
  • This study aimed to analyze the process of courtship form having date and marriage toward women who had job before marriage. The objects were 27.36 years old and had 9.59 months marital life at average. This study conducted structured questionnaires using the reflection of spouse selection procedure. By using collected data through questionnaires, it conducted descriptive statistics, cluster analysis and t-test. The type of marriage would be divided into the emotional marriage group and the implemental marriage group The emotional marriage group had longer dating time and more satisfaction of spouse selection than the implemental group. On value variable, the emotional marriage group had more subjective selection standard and more expectation social and emotional benefit than the latter group. On search variable, the emotional marriage group estimated the relation stability and satisfied the relation with spouse more than the implemental marriage group and expected the less possibility to meet new partner.

  • PDF

A Bayesian Variable Selection Method for Binary Response Probit Regression

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제28권2호
    • /
    • pp.167-182
    • /
    • 1999
  • This article is concerned with the selection of subsets of predictor variables to be included in building the binary response probit regression model. It is based on a Bayesian approach, intended to propose and develop a procedure that uses probabilistic considerations for selecting promising subsets. This procedure reformulates the probit regression setup in a hierarchical normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. The appropriate posterior probability of each subset of predictor variables is obtained through the Gibbs sampler, which samples indirectly from the multinomial posterior distribution on the set of possible subset choices. Thus, in this procedure, the most promising subset of predictors can be identified as the one with highest posterior probability. To highlight the merit of this procedure a couple of illustrative numerical examples are given.

  • PDF

Selection of markers in the framework of multivariate receiver operating characteristic curve analysis in binary classification

  • Sameera, G;Vishnu, Vardhan R
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.79-89
    • /
    • 2019
  • Classification models pertaining to receiver operating characteristic (ROC) curve analysis have been extended from univariate to multivariate setup by linearly combining available multiple markers. One such classification model is the multivariate ROC curve analysis. However, not all markers contribute in a real scenario and may mask the contribution of other markers in classifying the individuals/objects. This paper addresses this issue by developing an algorithm that helps in identifying the important markers that are significant and true contributors. The proposed variable selection framework is supported by real datasets and a simulation study, it is shown to provide insight about the individual marker's significance in providing a classifier rule/linear combination with good extent of classification.