DOI QR코드

DOI QR Code

불완전 자료에 대한 Metropolis-Hastings Expectation Maximization 알고리즘 연구

Metropolis-Hastings Expectation Maximization Algorithm for Incomplete Data

  • 전수영 (고려대학교 정보통계학과) ;
  • 이희찬 (고려대학교 경제통계학과)
  • Cheon, Soo-Young (Department of Informational Statistics, Korea University) ;
  • Lee, Hee-Chan (Department of Economics and Statistics, Korea University)
  • 투고 : 2011.11.18
  • 심사 : 2011.12.02
  • 발행 : 2012.02.29

초록

결측자료(missing data), 절단분포(truncated distribution), 중도절단자료(censored data) 등 불완전한 자료(incomplete data)하의 추론문제(incomplete problems)는 통계학에서 자주 발생되는 현상이다. 이런 문제의 해결방법으로 Expectation Maximization, Monte Carlo Expectation Maximization, Stochastic Expectation Maximization 알고리즘 등을 이용하는 방법이 있지만, 정형화된 분포의 가정이 필요하다는 단점을 가지고 있다. 본 연구에서는 정형화된 분포의 가정이 없는 경우에 사용할 수 있는 Metropolis-Hastings Expectation Maximization(MHEM) 알고리즘을 제안하고자 한다. MHEM 알고리즘의 효율성은 중도절단자료(censored data)를 이용한 모의실험과 KOSPI 200 수익률의 실증자료분석를 통해 알수 있었다.

The inference for incomplete data such as missing data, truncated distribution and censored data is a phenomenon that occurs frequently in statistics. To solve this problem, Expectation Maximization(EM), Monte Carlo Expectation Maximization(MCEM) and Stochastic Expectation Maximization(SEM) algorithm have been used for a long time; however, they generally assume known distributions. In this paper, we propose the Metropolis-Hastings Expectation Maximization(MHEM) algorithm for unknown distributions. The performance of our proposed algorithm has been investigated on simulated and real dataset, KOSPI 200.

키워드

참고문헌

  1. 강만기 (2000). Weibull 분포에서 MEM 알고리즘에 의한 모수 추정, Journal of the Korean Data Analysis Society, 2, 299-305.
  2. 김승구 (2003). 자기공명영상분할에서 바이어스 필드 보정을 위한 재귀적 EM 알고리즘, Journal of the Korean Data Society, 5, 323-336.
  3. 김승구 (2004). 정규혼합모형의 대용량자료 적합을 위한 일반화 Incremental EM 알고리즘에 대한 연구, Journal of the Korean Data Analysis Society, 6, 1031-1041.
  4. 김승구 (2005). 인자분석자 혼합모형을 위한 Incremental EM 알고리즘, Journal of the Korean Data Analysis Society, 7, 1605-1614.
  5. 김행선 (2003). 위험관리수단으로서 VaR(Value at Risk)의 추정 방법의 비교 및 분석, 서강대학교 대학원 석사학위 논문.
  6. Celeux, G. and Diebolt, J. (1985). The SEM algorithm: A probabilistic teacher algorithm derived from the EM algorithm for the mixture problem, Computational Statistics, 2, 73-82.
  7. Dempster, A. P., Laird, N. M. and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM Algorithm, Journal of the Royal Statistical Society B, 39, 1-38.
  8. Hastings, W. (1970). Monte Carlo sampling methods using Markov chains and their application, Biometrika, 57, 97-109. https://doi.org/10.1093/biomet/57.1.97
  9. Ip, E. H. S. (1994). A stochastic EM estimator in the presence of missing data theory and applications, Technical report, Department of Statictics, Stanford University.
  10. Robert, C. P. and Casella, G. (2004). Monte Carlo Statistical Methods, Second edition, Springer.
  11. Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H. and Teller, E. (1953). Equations of state calculations by fast computing machines, Journal of Chemical Physics, 21, 1087-1091. https://doi.org/10.1063/1.1699114
  12. Silverman, B. W. (1986). Density Estimation for Statistics and Data Analysis, Champman and Hall.
  13. Wei, G. C. G. and Tanner, M. A. (1990). A monte carlo implementation of the EM algorithm and the poor man's data augmentation algorithms, Journal of the American Statistical Association, 85, 699-714. https://doi.org/10.2307/2290005

피인용 문헌

  1. A Two Factor Model with Mean Reverting Process for Stochastic Mortality vol.28, pp.3, 2015, https://doi.org/10.5351/KJAS.2015.28.3.393