DOI QR코드

DOI QR Code

Predicting Korea Pro-Baseball Rankings by Principal Component Regression Analysis

주성분회귀분석을 이용한 한국프로야구 순위

  • Received : 2012.02.20
  • Accepted : 2012.03.22
  • Published : 2012.05.31

Abstract

In baseball rankings, prediction has been a subject of interest for baseball fans. To predict these rankings, (based on 2011 data from Korea Professional Baseball records) the arithmetic mean method, the weighted average method, principal component analysis, and principal component regression analysis is presented. By standardizing the arithmetic average, the correlation coefficient using the weighted average method, using principal components analysis to predict rankings, the final model was selected as a principal component regression model. By practicing regression analysis with a reduced variable by principal component analysis, we propose a rank predictability model of a pitcher part, a batter part and a pitcher batter part. We can estimate a 2011 rank of pro-baseball by a predicted regression model. By principal component regression analysis, the pitcher part, the other part, the pitcher and the batter part of the ranking prediction model is proposed. The regression model predicts the rankings for 2012.

야구경기에서 순위를 예측하는 것은 야구팬들에게 관심의 대상이 된다. 이러한 순위를 예측하기 위해서 2011년 한국프로야구 기록 자료를 바탕으로 산술평균방법, 가중평균방법, 주성분분석방법, 주성분회귀분석 방법을 제시한다. 표준화를 통한 산술평균, 상관계수를 이용한 가중평균과 주성분 분석을 이용해서 순위를 예측하고, 최종모형으로 주성분회귀분석 모형이 선택되었다. 주성분 분석으로 축약된 변수를 이용해서 회귀분석을 실시하여, 투수부분, 타자부분, 투수와 타자부분의 순위예측 모형을 제안한다. 예측된 회귀모형을 통해서 2012년도 순위 예측이 가능하다.

Keywords

References

  1. 권세혁 (2008). <다변량 데이터 분석과 활용>, 자유아카데미, 서울.
  2. 김응식 (2001). 한국프로야구 선수의 경기력과 연봉과의 관계, <한국스포츠사회확회지>, 14, 15-24.
  3. 김응준, 김종규, 이남주, 이미숙 (2011). 스포츠영재들의 자아존중감 문항적합도, <한국데이터정보과학회지>, 22, 487-494.
  4. 김혁주, 이현정 (2011). 새로운 승률 계산 방식이 2009년과 2010년의 한국프로야구에 미친 영향 및 보완할 점, <응용통계연구>, 24, 169-175.
  5. 민대기 (2011). 2010 미국프로골프협회 자료를 활용한 경로분석을 통한 경기력의 평균타수에 미치는 영향력 비교, <한국데이터정보과학회지>, 22, 65-71.
  6. 박철용, 이미숙 (2011). 스포츠영재성 검사 항목과 코스타스 점수간의 연관성 분석, <한국데이터정보과학회지>, 22, 57-64.
  7. 성웅현(1998). <응용다변량분석>, 탐진출판사, 서울.
  8. 오경주, 안재준, 심경식 (2012). 성분 분석과 로지스틱 회귀분석을 이용한 다국 통화 포트폴리오 전략, <한국데이터정보과학회지>, 23, 151-159.
  9. 이장영, 강효민 (2001). 한국프로야구 투수의 경기수행과 연봉책정의 관계, <한국스포츠사회학회지>, 14, 115-125.
  10. 한국야구위원회 공식 홈페이지. http://www.koreabaseball.com.

Cited by

  1. Analysis of the Korean Baseball League using a Markov Chain Model vol.26, pp.4, 2013, https://doi.org/10.5351/KJAS.2013.26.4.649
  2. Analysis of Chinese Provinces for Introduction of Reverse Mortgage Scheme Using Principal Component Analysis vol.40, pp.2, 2014, https://doi.org/10.7232/JKIIE.2014.40.2.205