DOI QR코드

DOI QR Code

Outlier detection using Grubb test and Cochran test in clinical data

그럽 및 코크란 검정을 이용한 임상자료의 이상치 판단

  • 손기철 (대구가톨릭대학교 의과대학) ;
  • 신임희 (대구가톨릭대학교 의과대학)
  • Received : 2012.05.10
  • Accepted : 2012.06.07
  • Published : 2012.07.31

Abstract

There are very small values and/or very big values which get out of the normal range for survey data in various fields. The reasons of occurrence for outlier are two. One of them is the error in process of data input and the other is the strange response of the respondent. If the data has outliers, then the summary statistics such as the mean and the variance produce misleading information. Therefore, researcher should be careful in detecting the outlier in data. In particular, it is very important problem for clinical fields because the cost of experiment is very high. This article introduce the Grubb test and Cochran test to detect outliers in the data and we apply this method for clinical data.

많은 분야에서 수집된 자료 중 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰 값인 이상치가 종종 존재한다. 이런 이상치의 발생원인은 자료의 입력과정에서의 오류 또는 응답 과정에서 응답자의 특이한 답변 때문이다. 만약 자료에서 이상치가 존재할 경우 자료의 요약값인 평균과 분산에 많은 영향을 미쳐서 잘못된 정보가 산출된다는 문제점이 있다. 따라서 연구자는 자료에서 이상치가 존재하는지를 주의깊게 살펴보아야 한다. 특히 사람을 대상으로 실시한 임상자료의 경우 자료의 비용측면에서나 결과의 일관성 측면에서 이상치의 판단은 더욱 중요한 문제이다. 따라서 본 논문에서는 이상치를 판단하는 방법인 Grubb 검정과 Cochran 검정을 이용하여 임상자료에서의 이상치를 판단하는 방법을 소개하고자 한다.

Keywords

References

  1. Ahn, B. J. and Seo, H. S. (2011). Outlier detection using dynamic plots. The Korean Journal of Applied Statistics, 24, 979-986. https://doi.org/10.5351/KJAS.2011.24.5.979
  2. Barret, V. and Lewis, T. (1994). Outliers in statistical data, 3rd Edition, John Wiley, England.
  3. Burke, S. (2001). Missing values, outliers, robust statistics and non-parametric methods. Statistics and Data Analysis, LC.GC Europe online Supplement, 19-24.
  4. Gentleman, J. F. and Wilk, M. B. (1975). Detecting outliers II: Supplementing the direct analysis of residuals. Biometrics, 31, 387-410. https://doi.org/10.2307/2529428
  5. Little, R. J. A. and Rubin, D. B. (1987). Statistical analysis with missing data, John Wiley & Sons, United States of America.
  6. Seo, H. S. and Yoon, M. (2011). Outlier detection using support vertor machines. Communications of the Korean Statistical Society, 18, 171-177. https://doi.org/10.5351/CKSS.2011.18.2.171
  7. Song, G. M., Moon, J. E. and Park, C. (2011). Realization of an outlier detection algorithm using R. Journal of the Korean Data & Information Science Society, 22, 449-458.
  8. Ulleberg, T., Robben, J., Nordahl, K. M., Ulleberg, T. and Heiene, R. (2011). Plasma creatinine in dogs: Intra and inter laboratory variation in 10 European veterinary laboratories. Acta Velerinaria Scandinavica, 53, 1-13. https://doi.org/10.1186/1751-0147-53-1
  9. Walfish, S. (2006). A review of statistical outlier methods. Pharmaceutical Technology, 2, 1-5.

Cited by

  1. Outlier detection and treatment in industrial sampling survey vol.27, pp.1, 2016, https://doi.org/10.7465/jkdi.2016.27.1.131