Hadi와 Simonoff의 다중이상점 식별방법의 개선과 여러 다중이상점 식별방법의 효율성 비교

  • 유종영 (용인대학교 전통계학과) ;
  • 김현철 (군산대학교 계산통계학과)
  • Published : 1996.12.01

Abstract

본 연구에서는 선형회귀분석에서 Hadi와 Simonoff의 다중이상점 식별방법을 수정하여 새로운 알고리즘을 제시하였다. Hadi와 Simonoff의 알고리즘 첫 단계에서 이상점일 가능성이 없는 점들의 집합을 추출할 때 가장효과와 편승효과에 영향을 받을 수 있음으로, 이 첫 단계를 수정하였다. 우리는 잔차가 일정한 분산을 갖는 정규분포에 다르다는 가정하에서 잔차의 신뢰구간을 생각하고, 이 구간안에서 잔차의 MAD가 최소인 새로운 모형을 탐색하고, 이를 이상점일 가능성이 없는 점들의 집합을 추출하는데 일용하는 새로운 알로리즘을 제시하였다. 제시된 방법은 실제자료에서 다른 방법에 비해 효율적으로 이상점을 식별할 수 있었다.

Keywords

References

  1. Regression Diagnostics : Identifying Influential Data and Sources of Collinearity Belsley, D.A.;Kuh, E.;Welsch, R.E.
  2. Outliers in Statistical Data Barnett, V.;Lewis, T.
  3. Biometrics v.31 Detecting Outliers Ⅱ: Supplementing the Direct Analysis of Residuals Gentleman, J. F.;Wilk, M. B.
  4. Journal of American Statistical Association v.89 A Simple Dynamic Graphical Diagnostics Method for Almost Any Model Easton, G.S.
  5. Journal of the Royal Statistical Society, Ser.B v.54 Identifying Multiple Outliers in Multivariate Data Hadi, A.S.
  6. Journal of American Statistical Association v.75 Procedures for the Identification of Multiple Outliers in Linear Models Hadi, A.S.;Simonoff, J.S.
  7. Biometrics v.45 Using Recursive Residuals, Calculated on Adaptively Ordered Observations, to Identify Outliers in Linear Regression Kianifard, F.;Swallow, W.H.
  8. Communications in Statistics, Part A-Theory and Methods v.19 A Monte Carlo Comparison of Five Procedures for Identifying Outliers in Linear Regression, Communications in Statistics Kianifard, F.;Swallow, W.H.
  9. Technometrics v.27 A Multistage Procedure for Detecting Several Outliers in Linear Regression Marasinghe, M.C.
  10. Technometrics v.33 A Generalized Extreme Studentized Residual Multiple Outlier Detection Procedure in Linear Regression Paul, S.R.;Fung, K.Y.
  11. Technometrics v.17 An approximation Test for Detecting Several Outliers in Linear Regression Prescott, P.
  12. Robust Regression and Outlier Detection Rousseeuw, P.J.;Leroy, A.M.