DOI QR코드

DOI QR Code

A Study on the Index Estimation of Missing Real Estate Transaction Cases Using Machine Learning

머신러닝을 활용한 결측 부동산 매매 지수의 추정에 대한 연구

  • Kim, Kyung-Min (Department of Environmental Planning, Graduate School of Environmental Studies, Seoul National University / Environmental Planning Institute) ;
  • Kim, Kyuseok (Department of Environmental Planning, Graduate School of Environmental Studies, Seoul National University / Department of Data Convergence Software, Korea Polytechnics) ;
  • Nam, Daisik (Asia Pacific School of Logistics, Inha University)
  • 김경민 (서울대학교 환경대학원 환경계획학과 / 환경계획연구소) ;
  • 김규석 (서울대학교 환경대학원 환경계획학과 / 한국폴리텍대학 데이터융합SW과) ;
  • 남대식 (인하대학교 아태물류학부)
  • Received : 2022.03.07
  • Accepted : 2022.03.24
  • Published : 2022.03.31

Abstract

The real estate price index plays key roles as quantitative data in real estate market analysis. International organizations including OECD publish the real estate price indexes by country, and the Korea Real Estate Board announces metropolitan-level and municipal-level indexes. However, when the index is set on the smaller spatial unit level than metropolitan and municipal-level, problems occur: missing values. As the spatial scope is narrowed down, there are cases where there are few or no transactions depending on the unit period, which lead index calculation difficult or even impossible. This study suggests a supervised learning-based machine learning model to compensate for missing values that may occur due to no transaction in a specific range and period. The models proposed in our research verify the accuracy of predicting the existing values and missing values.

부동산 시장 분석에 있어 기본이 되는 정량적 데이터는 부동산 가격 지수이다. OECD와 같은 국제기구에서는 국가별 부동산 가격 지수를 공표하고, 한국부동산원에서는 광역시 단위와 시군구 단위의 지수를 산출한다. 그런데 공간단위를 시군구보다 정교한 동단위, 아파트 단지 단위로 설정하는 경우, 여러 문제점을 맞이하게 된다. 대표적인 문제는 결측치이다. 공간적 범위를 좁힐수록 단위 기간에 따라 거래가 적거나 아예 존재하지 않는 경우가 존재하기에 이 경우에는 지수의 산출이 불가능한 결측치가 발생할 수 있다. 본 연구에서는 지도학습 기반의 머신러닝 기법을 활용하여 특정 범위와 기간에 거래가 존재하지 않아 발생할 수 있는 결측치를 보완하는 기법을 제안한다. 본 모형을 통해 부동산 매매 지수의 실제값이 존재하는 것들의 예측을 통해 그 정확도를 검증하고 결측치가 발생한 것들의 예측도 해 볼 수 있었다.

Keywords

Acknowledgement

이 논문은 서울대학교 환경계획연구소와 2022년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원(2020-0-01389, 인공지능융합연구센터지원(인하대학교)) 의 지원을 받았습니다.

References

  1. 국토교통부 실거래가 공개시스템, https://rt.molit.go.kr/, 2021년 2월 1일 최종열람.
  2. 박주연.박찬일.유선종, 2014, "아파트 특성이 분양 후 가격 변동에 미치는 요인: 판교 신도시를 대상으로," 부동산연구, 24(4), pp.25-37.
  3. 박천규.이영, 2010, "주택시장 체감지표의 주택시장지표 예측력 분석," 부동산학연구, 16(1), pp.131-146.
  4. 배종찬.정재호, 2021, "거시경제와 부동산정책이 서울 아파트가격에 미치는 영향 연구," LHI Journal, 12(4), pp.41-59.
  5. 배성완.유정석, 2018, "머신 러닝 방법과 시계열 분석 모형을 이용한 부동산 가격지수 예측", 주택연구, 26(1), pp.107-133.
  6. 손정식.김관영.김용순, 2003, "부동산가격 예측 모형에 관한 연구," 주택연구, 11(1), pp.49-76.
  7. 송의현.김경민, 2019, "제2기 수도권신도시 및 주변지역 아파트가격지수 추정," 부동산분석, 5(2), pp.17-41.
  8. 신동하.최광호.김창복, 2017, "RNN과 LSTM을 이용한 주가 예측율 향상을 위한 딥러닝 모델," 한국정보기술학회논문지, 15(10), pp.9-16. https://doi.org/10.14801/jkiit.2017.15.10.9
  9. 이금숙.김경민.송예나, 2010, "복합용도개발과 교통이 아파트가격에 미치는 영향," 한국경제지리학회지, 13(4), pp.515-528. https://doi.org/10.23841/EGSK.2010.13.4.515
  10. 이우민.김경민.김진석, 2019, "주택정책에 따른 서울 자치구별 주택시장 반응에 대한 연구," 한국경제지리학회지, 22(4), pp.555-575. https://doi.org/10.23841/EGSK.2019.22.4.555
  11. 전해정, 2012, "유동성 관련 변수가 주택가격에 미치는 영향 및 정책적 시사점에 관한 연구," 한국경제지리학회지, 15(4), pp.585-600. https://doi.org/10.23841/EGSK.2012.15.4.585
  12. 이태형, 2019, "인공신경망을 활용한 주택가격지수 예측에 관한 연구 : 서울 주택가격지수를 중심으로," 중앙대학교 대학원 박사학위 논문.
  13. 임성식, 2014, "주택가격지수 예측모형에 관한 비교연구," 한국데이터정보과학회지, 25(1), pp.65-76.
  14. 통계청, https://kostat.go.kr/, 2021년 2월 1일 최종열람.
  15. 최문기.이성화, 2021, "거시경제변수 및 부동산 대책이 강남4구 아파트 시장에 미치는 영향," 한국지적학회, 37(3), pp.105-114. https://doi.org/10.22988/KSC.2021.37.3.008
  16. 한국은행 경제통계시스템, https://ecos.bok.or.kr/, 2021년 2월 1일 최종열람.
  17. Chanasit, K., Chuangsuwanich, E., Suchato, A. and Punyabukkana, P., 2021, "A Real Estate Valuaton Model Using Boosted Feature Selection," IEEE Access, 9, pp.86938-86953. https://doi.org/10.1109/ACCESS.2021.3089198
  18. Duan, L., Ma, S. and Aggarwal, C., and Sathe, S., 2020, "Improving spectral clustering with deep embedding, cluster estimation and metric learning," Knowledge and Information Systems, 63(3), pp.675-694.
  19. Grinberg, N. F., Orhobor, O. I. and King, R. D., 2019, "An evaluation of machine-learning for predicting phenotype: studies in yeast, rice, and wheat," Machine Learning, 109(2), pp.251-277. https://doi.org/10.1007/s10994-019-05848-5
  20. Hihn. H. and Braun, D. A., 2020, "Specialization in Hierachical Learning Systems: A Unified Informationtheoretic Approach for Supervised, Unsupervised and Reinforcement Learning," Neural Processing Letters, 52(3), pp.2319-2352. https://doi.org/10.1007/s11063-020-10351-3
  21. Hendershott, P. H. and MacGregor, B. D., 2005, "Investor rationality: evidence from UK property capitalization rates," Real Estate Economics, 33(2), pp.299-322. https://doi.org/10.1111/j.1540-6229.2005.00120.x
  22. Hollies, R., 2007, "International variation in office yields: a panel approach," Journal of Property Investment and Finance, 25(4), pp.370-387. https://doi.org/10.1108/14635780710762517
  23. Huang, Y., 2019, "Predicting Home Value in California, United States via Machine Learning Modeling," Statistics, Optimization & Information Computing, 7(1), pp.66-74. https://doi.org/10.19139/soic.v7i1.435
  24. Khan, A. and Sarfaraz, A., 2019, "RNN-LSTM-GRU based language transformation," Soft Computing, 23(24), pp.13007-13024. https://doi.org/10.1007/s00500-019-04281-z
  25. Kim, K., Kim, G. and Tsolacos, S., 2019, "How does liquidity in the financial market affect the real estate market yields?," Journal of Property Investment & Finance, 37(10), pp.2-19. https://doi.org/10.1108/JPIF-03-2018-0020
  26. Kumar, N. and Kumar, U., 2022, "Artificial intelligence for classification and regression tree based feature selection method for network intrusion detection system in various telecommunication technologies," Computational Intelligence, pp.1-13.
  27. Lauati, A., Lahyani, R., Aldaej, A., Aldumaykhi, A. and Otai, S., 2021, "Price forecasting for real estate using machine learning: A case study on Riyadh city," pp.1-16.
  28. Park, B. and Bae, J. W., 2015, "Using machine learning algorithms for housing pice prediction: The case of Fairfax County, Virginia housing data," Expert Systems with Applications, 42(6), pp.2928-2934. https://doi.org/10.1016/j.eswa.2014.11.040
  29. Tchuente, D. and Nyawa, S., 2021, "Real estate price estimation in French cities using geocoding and machine learning," Annals of Operations Research, 308(1-2), pp.571-608. https://doi.org/10.1007/s10479-021-03932-5
  30. Sivitanides, P., Southard, J., Torto, R. G. and Wheaton, W. C., 2001, "The determinants of appraisal-based capitalization rates," Real Estate Finance, 18(2), pp.27-38.