Realization of an outlier detection algorithm using R

R을 이용한 이상점 탐지 알고리즘의 구현

  • Received : 2011.04.08
  • Accepted : 2011.05.09
  • Published : 2011.05.31

Abstract

Illegal waste dumping is one of the major problems that the government agency monitoring water quality has to face. Recently government agency installed COD (chemical oxygen demand) auto-monitering machines in river. In this article we provide an outlier detection algorithm using R based on the time series intervention model that detects some outlier values among those COD time series values generated from an auto-monitering machine. Through this algorithm using R, we can achieve an automatic algorithm that does not need manual intervention in each step, and that can further be used in simulation study.

불법 오물 투기는 정부가 당면한 시급한 문제들 중의 하나이다. 최근 들어 관련기관들은 실시간으로 연속적으로 수질의 상태를 감지 할 수 있는 화학적 산소요구량 자동측정기를 강과 하천 등에 설치하고 있다. 본 논문에서는 시계열 간섭모형을 이용하여 화학적 산소요구량 자동측정기로부터 발생하는 데이터를 분석하여 투기시점이라고 여겨지는 이상점을 탐지하는 알고리즘을 R언어를 이용하여 구현한다. R을 이용한 알고리즘을 통해 단계별 계산에서 수동 작업을 피할 수 있기 때문에 알고리즘의 자동화를 달성할 수 있고, 한 단계 더 나아가 모의실험에서 사용될 수 있을 것이다.

Keywords

References

  1. 문지은, 송규문, 김태윤 (2010). 시계열간섭모형을 이용한 불법 오물 투기 실시간 탐지 알고리즘 구축. <한국데이터정보과학회지>, 21, 883-890
  2. 박유성, 김기환 (2002). , 자유아카데미, 서울.
  3. 박인찬, 권오진, 김태윤 (2009), 시계열 모형을 이용한 주가지수 방향성 예측. <한국데이터정보과학회지>, 20, 991-998.
  4. 박철용, 김현일 (2009). 최적 시계열 모형에 기초한 오존주의보 날짜 예측. <한국데이터정보과학회지>, 20, 293-299.
  5. 이정형, 조신섭 (1997). , 자유아카데미, 서울.
  6. Chang, I., Tiao, G. C. and Chen, C. (2008), Estimation of time series parameters in the presence of outliers. Technometrics, 30, 193-204
  7. Choi, H. S., Song, G. M. and Kim, T. Y. (2007), A study on error detection algorithm of COD measurement machine. Journal of the Korean & Data Information Science Society, 18, 847-857.
  8. Cryer, J. D. and Chan, K. S. (2006). Time series analysis with applications in R, 2nd Edition, Springer, New York.