Cluster analysis with Korean weather data: Application of model-based Bayesian clustering method

한국 기상자료의 군집분석: 베이지안 모델기반 방법의 응용

  • Published : 2009.01.31

Abstract

In this paper, 30 main cities are clustered based on precipitation, temperature, wind speed, photo period, and humidity. We found that the resulting clusters has strong relationships with geographical locations. These results make sense because, although Korea is a small country, Korean weather is known to have strong locality. The largest number of clusters is found when wind speed is used as an interested variable for clustering and the smallest number of clusters is found when photo period is used. The large number of clusters based on wind speed indicates that wind speed is affected easily by local geography.

이 논문에서는 한국 30개 주요도시를 강수량, 온도, 풍속, 일조량, 습도를 기준으로 군집분석을 행하였다. 군집분석 결과는 지형적 특성에 이 들 기상변수가 큰 영향을 받는 다는 것으로 나타났다. 한국은 비록 작은 나라이기는 하지만, 지형성 영향을 많이 받는 것으로 알려져 있기 때문에 우리의 연구결과는 기상에 관한 기존상식과 일치한다고 이야기 할 수 있다. 풍속을 기준으로 군집분석을 하였을때, 가장 많은 수의 군집들이 찾아졌고 일조량을 기준으로 했을 때 가장 작은 수의 군집이 찾아졌다. 풍속을 기준으로 했을 때 많은 군집들이 찾아지는 것은 바람은 국소지형에 아주 많은 영향을 받기 때문이라고 여겨진다.

Keywords

References

  1. 이용희, 최정희, 오재호 (2000). 대기조성변화에 따른 지역기상 변화의 통계적 예측. <한국데이터정보과학회지>,2, 333-344.
  2. Booth, J., Casella, G. and Hobert, J. (2008). Clustering using objective functions and stochastic search. Journal of the Royal Statistical Society B, 70, 119-140. https://doi.org/10.1111/j.1467-9868.2007.00629.x
  3. Crowley, E. M. (1997). Product partition models for normal means. Journal of the American Statistical Association, 92, 192-198. https://doi.org/10.2307/2291463
  4. Joo, Y., Booth, J., Namkoong, Y. and Casella, G. (2008). Model-Based Bayesian Cluster Analysis. Bioinformatics, 24, 874-875. https://doi.org/10.1093/bioinformatics/btn030
  5. Kim, B., Cho, C., Chung, H., Park, J., Shin, S. and Lee, Y. (2002). Impact of the Additional Observation Data on the Weather Analysis. Proceedings of Joint Conference of Korean Data And Information Science Society and Korean Data Analysis Society 2002, 1-4.
  6. Sohn, K. T., Hong, C., Kwon, H. J. and Park, J. K. (2002). Prediction of the number of Tropical Cyclones over Western North Pacific in TC season. Proceedings of Joint Conference of Korean Data And Information Science Society and Korean Data Analysis Society 2002, 5-15.
  7. Ruppert, D., Wand, M. P. and Caroll, R. J. (2003). Semiparametric regression, Cambridge University Press, New York, 2003.