DOI QR코드

DOI QR Code

Comparative Analysis for Real-Estate Price Index Prediction Models using Machine Learning Algorithms: LIME's Interpretability Evaluation

기계학습 알고리즘을 활용한 지역 별 아파트 실거래가격지수 예측모델 비교: LIME 해석력 검증

  • Received : 2020.08.20
  • Accepted : 2020.09.16
  • Published : 2020.09.30

Abstract

Purpose Real estate usually takes charge of the highest proportion of physical properties which individual, organizations, and government hold and instability of real estate market affects the economic condition seriously for each economic subject. Consequently, practices for predicting the real estate market have attention for various reasons, such as financial investment, administrative convenience, and wealth management. Additionally, development of machine learning algorithms and computing hardware enhances the expectation for more precise and useful prediction models in real estate market. Design/methodology/approach In response to the demand, this paper aims to provide a framework for forecasting the real estate market with machine learning algorithms. The framework consists of demonstrating the prediction efficiency of each machine learning algorithm, interpreting the interior feature effects of prediction model with a state-of-art algorithm, LIME(Local Interpretable Model-agnostic Explanation), and comparing the results in different cities. Findings This research could not only enhance the academic base for information system and real estate fields, but also resolve information asymmetry on real estate market among economic subjects. This research revealed that macroeconomic indicators, real estate-related indicators, and Google Trends search indexes can predict real-estate prices quite well.

Keywords

References

  1. 김근용, "주택 가격 예측을 위한 모형 설정과 검정", 국토, 제197권, 1998, pp. 54-61.
  2. 남영우, 이정민, "아파트시장 예측을 위한 신경망 분석 적용 가능성에 관한 연구", 한국건설관리학회, 제7권, 제2호, 2006, pp. 162-170.
  3. 박헌주, 박철, "시계열 모형에 의한 토지 시장의 예측 연구", 주택 연구, 제9권, 제1호, 2001, pp. 27-55.
  4. 배성완, 유정석, "딥 러닝을 이용한 부동산가격지수 예측", 부동산 연구, 제27권, 제3호, 2017, pp. 71-86.
  5. 배성완, 유정석, "머신 러닝 방법과 시계열 분석 모형을 이용한 부동산 가격지수 예측", 주택 연구, 제26권, 제1호, 2018, pp. 107-133.
  6. 서종덕, "데이터 마이닝 기법을 이용한 환율예측: GARCH와 결합된 랜덤 포레스트 모형", 산업경제연구, 제29권, 제5호, 2016, pp. 1607-1628.
  7. 선일석, "ARIMA 모형을 이용한 보관 및 창고업의 예측 연구", 기업경영리뷰, 제6권, 제1호, 2015, pp. 77-91.
  8. 손경환, "통화량 변동이 주택가격에 미치는 영향", 국토 연구, 제15권, 1991, pp. 35-43.
  9. 손정식, 김관영, 김용순, "부동산 가격 예측모형에 관한 연구", 주택 연구, 제11권, 제1호, 2003, pp. 49-76.
  10. 송인호, "주택 시장과 거시경제의 관계", 부동산 도시연구, 제8권, 제1호, 2015, pp. 47-65.
  11. 신용상, 구본성, 하준경, 이규복, 송재은, 이윤석, "서브프라임 모기지 사태의 분석과 전망", 2007, KIF금융리포트.
  12. 신이레, 윤상후, "특정 시간대 전력 수요예측 시계열모형", 한국데이터정보과학회지, 제27권, 제2호, 2016, pp. 275-284.
  13. 윤주현, 김혜승, "주택 시장의 경기 동향 및 단기 전망 연구", 안양국토연구원, 2000.
  14. 이낙영, 오경주, "디노이징 필터와 LSTM을 활용한 KOSPI200 선물지수 예측", 한국데이터정보과학회지, 제30권, 제3호, 2019, pp. 645-654.
  15. 임병진, 한성윤, "주식시장 지수와 부동산 시장 지수의 시계열 특성 비교와 관계에 관한 실증적 연구", 산업경제연구, 제22권, 제4호, 2009, pp. 2065-2083.
  16. 임성식, "주택 가격지수 예측모형에 관한 비교 연구", 한국데이터정보과학회지, 제25권, 제1호, 2014, pp. 65-76.
  17. 정원구, 이상엽, "인공신경망을 이용한 공동 주택 가격 지수 예측에 관한 연구-서울지역을 중심으로", 주택 연구, 제15권, 제 3호, 2007, pp. 39-64.
  18. 정훈, 김주원, "A Machine Learning Approach for Mechanical Motor Fault Diagnosis", 산업경영시스템학회지, 제40권, 제1호, 2017, pp. 57-64. https://doi.org/10.11627/jkise.2017.40.1.057
  19. 최가영, 이정희, 유리화, "시계열분석을 통한 자연휴양림 계절별 이용수요 예측: 계절 ARIMA 모형과 지수평활 모형을 중심으로", 관광경영연구, 제21권, 제3호, 2017, pp. 271-289.
  20. 한경수, "부동산 가격영향 요인이 주택매매가격지수에 미치는 영향", 경영교육연구, 제26권, 제2호, 2011, pp. 547-565.
  21. 한국감정원 부동산통계정보, Retrieved from http://www.r-one.co.kr
  22. 한국 통계청, Retrieved from http://www.kosis.kr
  23. Alpaydin, E., "Introduction to machine learning", MIT press, 2009.
  24. Audet, C., Denni, J., Moore, D., Booker, A., and Frank, P., "A surrogate-model-based method for constrained optimization", 8th Symposium on Multidisciplinary Analysis and Optimization, 4891, 2000.
  25. Bourassa, S. C., Cantoni, E., and Hoesli, M., "Spatial dependence, housing submarkets, and house price prediction", The Journal of Real Estate Finance and Economics, 35(2), 2007, 143-160. https://doi.org/10.1007/s11146-007-9036-8
  26. Box, G. E., Jenkins, G. M., Reinsel, G. C., and Ljung, G. M., Time series analysis: Forecasting and control, John Wiley and Sons, 2015.
  27. Breiman, L., "Random forests", Machine Learning, 45(1), 2001, 5-32. https://doi.org/10.1023/A:1010933404324
  28. Choi, H., and Varian, H., "Predicting the present with Google Trends", Economic Record, 88, 2012, 2-9. https://doi.org/10.1111/j.1475-4932.2012.00809.x
  29. Fischer, T., and Krauss, C., "Deep learning with long short-term memory networks for financial market predictions", European Journal of Operational Research, 270(2), 2018, 654-669. https://doi.org/10.1016/j.ejor.2017.11.054
  30. Gers, F. A., Schmidhuber, J., and Cummins, F., "Learning to forget: Continual prediction with LSTM", Neural Computation, 12(10), 2000, 2451-2471. https://doi.org/10.1162/089976600300015015
  31. Graves, A., "Generating sequences with recurrent neural networks", arXiv preprint arXiv:1308.0850, 2013.
  32. Graves, A., and Schmidhuber, J., "Framewise phoneme classification with bidirectional LSTM and other neural network architectures", Neural Networks, 18(5-6), 2005, 602-610. https://doi.org/10.1016/j.neunet.2005.06.042
  33. Hochreiter, S., and Schmidhuber, J., "Long short-term memory", Neural Computation, 9(8), 1997, 1735-1780. https://doi.org/10.1162/neco.1997.9.8.1735
  34. Kelleher, J. D., Mac Namee, B., and D'arcy, A., Fundamentals of machine learning for predictive data analytics: Algorithms, worked examples, and case studies, MIT Press, 2015.
  35. Li, L., and Chu, K.-H., "Prediction of real estate price variation based on economic parameters", 2017 International Conference on Applied System Innovation(ICASI), 2017, 87-91.
  36. Limsombunchai, V., "House price prediction: Hedonic price model vs. artificial neural network", New Zealand Agricultural and Resource Economics Society Conference, 2004, 25-26.
  37. Marsland, S., Machine learning: An algorithmic perspective, Chapman and Hall/CRC, 2014.
  38. Negnevitsky, M., Artificial intelligence: A guide to intelligent systems, Pearson Education, 2005.
  39. Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., and Dubourg, V., "Scikit-learn: Machine learning in Python", Journal of Machine Learning Research, 12(10), 2011, 2825-2830.
  40. Ribeiro, M. T., Singh, S., and Guestrin, C., Model-agnostic interpretability of machine learning, arXiv preprint arXiv:1606.05386, 2016a.
  41. Ribeiro, M. T., Singh, S., and Guestrin, C., "Why should I trust you?: Explaining the predictions of any classifier", 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016b, 1135-1144.
  42. Ribeiro, M. T., Singh, S., and Guestrin, C., "Anchors: High-precision model-agnostic explanations", 32nd AAAI Conference on Artificial Intelligence, 2018.
  43. Sutton, R. S., and Barto, A. G., Reinforcement learning: An introduction, MIT Press, 2018.
  44. Tse, R. Y., "An application of the ARIMA model to real-estate prices in Hong Kong", Journal of Property Finance, 8(2), 1997, 152-163. https://doi.org/10.1108/09588689710167843
  45. Wu, L., and Brynjolfsson, E., "The future of prediction: How Google searches foreshadow housing prices and sales", In Economic analysis of the digital economy, University of Chicago Press, 2015.
  46. Zhou, W.-X., and Sornette, D., "Analysis of the real estate market in Las Vegas: Bubble, seasonal patterns, and prediction of the CSW indices", Physica A: Statistical Mechanics and its Applications, 387(1), 2008, 243-260. https://doi.org/10.1016/j.physa.2007.08.059