DOI QR코드

DOI QR Code

The estimation of winning rate in Korean professional baseball league

한국 프로야구의 승률 추정

  • Kim, Soon-Kwi (Department of Information Statistics, Gangneung-Wonju National University) ;
  • Lee, Young-Hoon (Department of Information Statistics, Gangneung-Wonju National University)
  • 김순귀 (강릉원주대학교 정보통계학과) ;
  • 이영훈 (강릉원주대학교 정보통계학과)
  • Received : 2016.02.22
  • Accepted : 2016.03.31
  • Published : 2016.05.31

Abstract

In this paper, we provide a suitable optimal exponent in the generalized Pythagorean theorem and propose to use the logistic model & the probit model to estimate the winning rate in Korean professional baseball league. Under a criterion of root-mean-square-error (RMSE), the efficiencies of the proposed models have been compared with those of the Pythagorean theorem. We use the team historic win-loss records of Korean professional baseball league from 1982 to the first half of 2015, and the proposed methods show slight outperformances over the generalized Pythagorean method under the criterion of RMSE.

본 연구에서는 한국 프로야구의 승률을 추정하기 위하여 야구 경기의 피타고라스 정리라고 불리우는 방법을 사용하였고, 이 방법을 확장한 일반화 피타고라스 정리도 이용하면서 일반화 피타고라스 정리의 최적 지수 값을 찾아보았다. 그리고 다른 추정 방법들인 로지스틱 모형과 프로빗 모형의 사용을 제안하였다. 평균제곱오차의 제곱근 (RMSE)을 판정기준으로, 피타고라스 정리와 제안된 모형들의 효율성을 서로 비교하였다. 사용한 자료는 1982년부터 2015년 7월까지의 모든 한국 프로야구 기록이며, 제안한 방법은 일반화 피타고라스 정리를 이용한 승률 추정 방법보다 평균제곱오차의 관점에서 다소 나아졌음을 보여준다.

Keywords

References

  1. Cho, Y. S. and Cho, Y. J. (2005). A study on winning percentage using batter's runs and pitcher's runs in Korean professional baseball league. Journal of the Korean Data Analysis Society, 7, 2303-2312.
  2. Hosmer, D. W. and Lemeshow, S. (2000). Applied logistic regression, 2nd ed., Wiley, New York.
  3. Huh, M. H. (2000). Multivariate data analysis, Freedom Academy, Seoul.
  4. James, B. (1982). The Bill James baseball abstract, Ballantine Books, New York.
  5. Kim, K. Y. and Jhun, M. S. (1994). SAS cluster analysis, Freedom Academy, Seoul.
  6. Kim, S. K. (2014). Understanding of logistic regression model, Kyowoosa, Seoul.
  7. Lee, J. T. (2014). Estimation of exponent value for Pythagorean method in Korean pro-baseball. Journal of the Korean Data & Information Science Society, 25, 493-499. https://doi.org/10.7465/jkdi.2014.25.3.493
  8. Lee, J. T. (2015). Measuring the accuracy of the Pythagorean theorem in Korean pro-baseball. Journal of the Korean Data & Information Science Society, 26, 653-659. https://doi.org/10.7465/jkdi.2015.26.3.653
  9. Lee, J. T. and Kim, Y. T. (2006). A study on the estimation of winning percentage in Korean pro-baseball. Journal of the Korean Data Analysis Society, 8, 857-869.

Cited by

  1. 게임 데이터를 이용한 지표 개발과 승패예측모형 설계 vol.28, pp.2, 2016, https://doi.org/10.7465/jkdi.2017.28.2.237
  2. 한국프로야구에서 쌍별 승률추정량의 효율성 vol.28, pp.2, 2016, https://doi.org/10.7465/jkdi.2017.28.2.309
  3. 한국프로야구에서 투수 연봉에 영향을 주는 요인 vol.28, pp.2, 2016, https://doi.org/10.7465/jkdi.2017.28.2.317
  4. 한국프로야구에서 FIP 계수의 추정 vol.28, pp.3, 2016, https://doi.org/10.7465/jkdi.2017.28.3.625
  5. Estimation of Gini-Simpson index for SNP data vol.28, pp.6, 2016, https://doi.org/10.7465/jkdi.2017.28.6.1557