DOI QR코드

DOI QR Code

Data visualization of airquality data using R software

R 소프트웨어를 이용한 대기오염 데이터의 시각화

  • Received : 2015.02.03
  • Accepted : 2015.03.19
  • Published : 2015.03.31

Abstract

This paper presented airquality data through data visualization in several ways and described its characteristics related to statistical methods for analysis. Software R was used for visualization tools. The airquality data was measured in New York city from May to September of year 1973. First, simple, exploratory data analysis was done in terms of both data visualization and analysis to find out univariate characteristics. Then through data transformation and multiple regression analysis, model for describing the airquality level was found. Also, after some data categorization, overall feature of the data was explored using box plot and three-dimensional perspective drawing and scatter plot.

본 논문은 대기오염 자료를 여러 가지 방법의 데이터 시각화를 통해 나타내었고, 데이터 시각화 방법별로 통계적인 방법을 활용한 분석과 연계하여 어떤 특징을 알아 볼 수 있는지를 나타냈다. 데이터 시각화 도구로는 통계 패키지인 R을 사용하였다. 분석에 사용된 데이터는 뉴욕시에서 1973년 5월부터 9월까지 공기의 질을 측정한 자료이다. 먼저 단변량 분석과 단순회귀분석을 실시하여 데이터 시각화를 통해 자료의 기본적인 특성을 파악하고 시각화 방법으로 산점도행렬 등을 통해 특성을 한눈에 볼 수 있게 나타내었다. 다중 회귀 분석을 실시하여 로그변환 등을 이용하여 최적의 모형을 찾고 설명변수들을 범주화하여 상자그림이나 3차원 투시도, 3차원 산점도 등 여러 데이터 시각화 방법을 이용해 대기오염 데이터의 전체적인 특성들을 알아보았다.

Keywords

References

  1. Bae, D., Park, H. and Oh, K. (2013). Big data trends and policy implications. International Telecommunications Policy Review, 25, 37-74.
  2. Chambers, J. M., Cleveland, W. S., Kleiner, B. and Tukey, P. A. (1983). Graphical Methods for Data Analysis, Wadsworth.
  3. Cho, J. (2014). Analysis of employee's characteristic using data visualization. Journal of the Korean Data & Information Science Society, 25, 727-736. https://doi.org/10.7465/jkdi.2014.25.4.727
  4. Choi, K., Ham, Y. and Kim, S. (2013). Big data visualization. KSCI Review, 21, 33-43.
  5. Joo, S., Jung, J. and Ryu, K. (2013). Big data technology trends, visualizations of big and public data. Smart Media Journal, 2, 37-43.
  6. Kim, K. and Lee, K. (2014). A web application for open data visualization using R. Journal of the Korean Association of Geographic Information Studies, 17, 72-81. https://doi.org/10.11108/kagis.2014.17.2.072
  7. Lim, Y., Baek, S. and Yeon, S. (2012). Choice and focus for competitiveness of big data era. Nurimedia Korean Studies Journals, 29, 3-10.
  8. Park, D. (2007). Teaching statistical graphics using R. The Korean Journal of Applied Statistics, 20, 619-634. https://doi.org/10.5351/KJAS.2007.20.3.619
  9. Park, S. (2014). Visualization and interpretation of cancer data using linked micromap plots. Journal of the Korean Data & Information Science Society, 25, 1531-1538. https://doi.org/10.7465/jkdi.2014.25.6.1531
  10. Stephen, F. (2007). Visualizing change : an innovation in time-series analysis. Visual Business Intelligence Newsletter, September 2007.
  11. Zeileis, A., Leisch, F., Hornik, K. and Kleiber, C. (2002). Strucchange: an R package for testing for structural change in linear regression models. Journal of Statistical Software, 7, 1-38.

Cited by

  1. 확률 및 통계와 교원임용시험 vol.28, pp.6, 2015, https://doi.org/10.7465/jkdi.2017.28.6.1539
  2. R을 이용한 대학의 학과 명칭 분석 vol.22, pp.6, 2015, https://doi.org/10.6109/jkiice.2018.22.6.829
  3. 빅데이터 분석도구 R을 이용한 성경 데이터의 빈도와 소셜 네트워크 분석 vol.24, pp.2, 2015, https://doi.org/10.6109/jkiice.2020.24.2.166