• Title, Summary, Keyword: 로지스틱 회귀분석

Search Result 1,226, Processing Time 0.042 seconds

Fine-Grain Weighted Logistic Regression Model (가중치 세분화 기반의 로지스틱 회귀분석 모델)

  • Lee, Chang-Hwan
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.9
    • /
    • pp.77-81
    • /
    • 2016
  • Logistic regression (LR) has been widely used for predicting the relationships among variables in various fields. We propose a new logistic regression model with a fine-grained weighting method, called value weighted logistic regression, by assigning different weights to each feature value. A gradient approach is utilized to obtain the optimal weights of feature values. We conduct experiments on several data sets and the experimental results show that the proposed method shows meaningful improvement in prediction accuracy.

Value Weighted Regularized Logistic Regression Model (속성값 기반의 정규화된 로지스틱 회귀분석 모델)

  • Lee, Chang-Hwan;Jung, Mina
    • Journal of KIISE
    • /
    • v.43 no.11
    • /
    • pp.1270-1274
    • /
    • 2016
  • Logistic regression is widely used for predicting and estimating the relationship among variables. We propose a new logistic regression model, the value weighted logistic regression, which comprises of a fine-grained weighting method, and assigns adapted weights to each feature value. This gradient approach obtains the optimal weights of feature values. Experiments were conducted on several data sets from the UCI machine learning repository, and the results revealed that the proposed method achieves meaningful improvement in the prediction accuracy.

로지스틱 회귀모형을 분석하기 위한 SPSS, SAS, STATA의 비교분석

  • Kim, Sun-Gwi;Jeong, Dong-Bin
    • Proceedings of the Korean Statistical Society Conference
    • /
    • /
    • pp.287-292
    • /
    • 2002
  • 최근 여러 분야에서 로지스틱 회귀에 대한 필요성과 그 응용이 급증하면서 이를 분석하기 위한 통계패키지가 많이 개발되어 사용되고 있다. 이 논문에서는 자료의 유형에 따라 활용할 수 있는 여러 형태의 로지스틱 회귀모형을 간단히 살펴보고, SPSS, SAS, STATA, MINITAB과 같은 통계패키지를 사용하여 로지스틱 회귀모형에 적용할 때 각각 다룰 수 있는 범위와 그 특징에 대해 다룬다.

  • PDF

Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree (로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구)

  • Kim, Soo-Jin;Kim, Bo-Young
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.12
    • /
    • pp.829-839
    • /
    • 2013
  • This study is a descriptive research study with the purpose of predicting and comparing factors of depression affecting residents in a metropolitan city by using logistic regression analysis and decision-making tree analysis. The subjects for the study were 462 residents ($20{\leq}aged{\angle}65$) in a metropolitan city. This study collected data between October 7, 2011 and October 21, 2011 and analyzed them with frequency analysis, percentage, the mean and standard deviation, ${\chi}^2$-test, t-test, logistic regression analysis, roc curve, and a decision-making tree by using SPSS 18.0 program. The common predicting variables of depression in community residents were social dysfunction, perceived physical symptom, and family support. The specialty and sensitivity of logistic regression explained 93.8% and 42.5%. The receiver operating characteristic (roc) curve was used to determine an optimal model. The AUC (area under the curve) was .84. Roc curve was found to be statistically significant (p=<.001). The specialty and sensitivity of decision-making tree analysis were 98.3% and 20.8% respectively. As for the whole classification accuracy, the logistic regression explained 82.0% and the decision making tree analysis explained 80.5%. From the results of this study, it is believed that the sensitivity, the classification accuracy, and the logistics regression analysis as shown in a higher degree may be useful materials to establish a depression prediction model for the community residents.

Steal Success Model for 2007 Korean Professional Baseball Games (2007년 한국프로야구에서 도루성공모형)

  • Hong, Chong-Sun;Choi, Jeong-Min
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.455-468
    • /
    • 2008
  • Based on the huge baseball game records, the steal plays an important role to affect the result of games. For the research about success or failure of the steal in baseball games, logistic regression models are developed based on 2007 Korean professional baseball games. The analyses of logistic regression models are compared of those of the discriminant models. It is found that the performance of the logistic regression analysis is more efficient than that of the discriminant analysis. Also, we consider an alternative logistic regression model based on categorical data which are transformed from uneasy obtainable continuous data.

A Study on the Relative Risk by Elderly Driver's Age using Logistic Regression (로지스틱 회귀분석을 이용한 고령운전자 연령대별 상대위험도 분석에 관한 연구)

  • Yoon, Byoung-Jo;Lee, So-Yeon;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • /
    • pp.205-206
    • /
    • 2017
  • 도로교통공단 교통사고 분석시스템(TAAS)에 따르면 2016년 기준 전체사고의 약 11%가 고령운전자 사고이며, 고령운전자 사고로 인한 사망자수는 759명에 달한다. 본 연구에서는 고령운전자의 신체적 특징을 감안하여 전기(65세~74세), 중기(75세~84세), 후기(85세 이후)로 나누고 로지스틱 회귀분석을 이용하여 고령운전자의 연령대별 사고특성과 사망사고에 영향을 미치는 요인을 파악하고 그 특성을 고려한 안전대책을 제시하고자 하였다. 분석결과 차량단독사고일 때 고령자 전 연령대에서 사고위험도가 높게 나타났으며, 도로이탈로 인한 사고인 경우 다른 사고요인에 비해 위험도가 높게 나타났다. 사고원인별로 살펴보면 안전운전의무 불이행, 중앙선침범으로 인한 사고인 경우가 높았으며, 기상상태별로 볼 때 전기고령자에서 중기, 후기 고령자로 갈수록 흐릴 때의 사고위험도가 높아지는 것으로 나타났다.

  • PDF

A Study on the Cause of Death Accident on Peak and Non-Peak Hours in Highway using Logistic Regression Analysis (로지스틱 회귀분석을 이용한 첨두·비첨두시간대 고속도로 노선별 사망사고 원인 분석에 관한 연구)

  • Yoon, Byoung-Jo;Baek, Jun-Hyouk;Jung, So-Yeon
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • /
    • pp.207-208
    • /
    • 2017
  • 본 연구는 전국 고속도로별 첨두 비첨두 시간에 발생되는 교통사고 중 사망사고의 주요 요인들을 발견하고 분석하여 각 노선별 사고 특성을 제시하고자 한다. 이에 로지스틱 회귀분석을 통해 분석한 결과 남해선의 경우 첨두 시간에 발생되는 사망사고의 요인 중 주시태만이 첨두가 비첨두의 경우보다 높게 나타났고, 논산천안선, 호남선과 중부내륙선의 경우 모두 졸음의 사망사고 위험도가 첨두일 경우 비첨두의 경우보다 높게 나왔으며 논산천안선, 호남선의 경우 비첨두일 때 과속에도 영향을 받는 경향을 나타냈다. 특이하게 경부선의 경우 졸음의 사망사고 위험도가 오히려 비첨두일 경우가 첨두의 경우보다 높게 나타났다. 비첨두일 경우 경인선, 서해안선, 영동선 등의 노선에서도 졸음, 주시태만과 과속의 위험도가 나타났다.

  • PDF

Comparative Analysis on Peak and non-peak hours Traffic Accident using Logistic Regression Analysis (로지스틱 회귀분석을 이용한 첨두·비첨두시간 사고유형 비교분석 연구)

  • Yoon, Byoung-Jo;Ko, Eun-Hyeck;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • /
    • pp.263-264
    • /
    • 2016
  • 본 연구는 첨두 비첨두시간에 발생되는 교통사고의 주요 요인들을 발견하고 비교하여 각 시간대의 사고특성을 제시하고자 한다. 이에 로지스틱 회귀분석을 통해 분석한 결과 흐린 날씨의 경우 첨두시간에 발생되는 사망사고 위험도가 비첨두시간의 경우보다 더 높게 나타났고, 비첨두시간 사망사고 위험도의 경우 안개가 낀 날 증가하고 맑은 날 감소하는 모습이 나타났다. 과속의 경우 비첨두시간이 첨두시간의 경우 보다 크게 나타났고, 횡단 중인 보행자와 발생되는 사고에 대해서는 첨두시간의 사망위험도가 상대적으로 높은 것으로 나타났다. 차량단독 사고의 경우 공작물과 충돌로 인한 사망위험도는 첨두시간이 높은 것으로 나타났고, 도로 이탈로 인한 사망위험도는 비첨두시간이 높은 것으로 나타났다.

  • PDF

The Study on the Severity of Children Traffic Accident using Ordinal Logistic Regression Analysis (순서형 로지스틱 회귀분석을 이용한 어린이 사고심각도 분석 연구)

  • Yoon, Byoung-Jo;Ko, Eun-Hyeck;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • /
    • pp.259-260
    • /
    • 2016
  • 어린이의 경우 다른 연령층에 비해 신체적, 정신적으로 완성되지 못하여 교통사고의 가능성이 높으며, 특히 전국의 어린이 교통사고는 점진적으로 감소 추세이나 인천의 어린이 교통사고는 감소하다가 다시 증가 추세에 들어선 실정이다. 따라서 본 연구의 목적은 어린이 교통사고 심각도에 영향을 미치는 주요 요인들을 발견하고 제시하고자 하였다. 순서형 로지스틱 회귀분석을 활용하여 순서척도인 반응변수에 대한 설명변수의 오즈(Odds)를 확인하고자 하였으며 안전운전불이행, 차대사람(횡단중), 차대차(측면직각충돌)사고가 유의한 결과로 나타났다. 안전운전불이행으로 인한 사망사고와 기타사고의 오즈차이는 1.35배, 측면직각충돌로 인한 사망사고와 기타사고의 오즈차이는 1.76배 증가하는 것으로 나타났고, 횡단중인 경우에는 오히려 사망 위험도의 오즈값이 0.58배로 감소하는 것으로 나타났다.

  • PDF

Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model (로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구)

  • Jin, Soo-Bong;Lee, Jong-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.20 no.4
    • /
    • pp.482-490
    • /
    • 2017
  • This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.