A study on the behavior of cosmetic customers

화장품구매 자료를 통한 고객 구매행태 분석

  • Cho, Dae-Hyeon (Department of Data Science/Institute of statistical Information, Inje University) ;
  • Kim, Byung-Soo (Department of Data Science/Institute of statistical Information, Inje University) ;
  • Seok, Kyung-Ha (Department of Data Science/Institute of statistical Information, Inje University) ;
  • Lee, Jong-Un (Micans) ;
  • Kim, Jong-Sung (Department of Data Science/Institute of statistical Information, Inje University) ;
  • Kim, Sun-Hwa (Department of Data Science/Institute of statistical Information, Inje University)
  • 조대현 (인제대학교 데이터정보학과) ;
  • 김병수 (인제대학교 데이터정보학과) ;
  • 석경하 (인제대학교 데이터정보학과) ;
  • 이종언 (미켄즈(주)) ;
  • 김종성 (인제대학교 데이터정보학과) ;
  • 김선화 (인제대학교 데이터정보학과)
  • Published : 2009.07.31

Abstract

In micro marketing promotion, it is important to know the behavior of customers. In this study we are interested in the forecasting of repurchase of customers from customers' behavior. By analyzing the cosmetic transaction data we derive some variables which play an important role in the knowledge of the customers' behavior and in the modeling of repurchase. As modeling tools we use the decision tree, logistic regression and neural network model. Finally we decide to use the decision tree as a final model since it yields the smallest RASE (root average squared error) and the greatest correct classification rate.

본 연구의 목적은 효과적인 마케팅전략 수립에 도움이 되는 정보를 제공하는 데 있다. 이를 위하여 화장품구매 자료로부터 고객 구매형태와 재구매 간의 관계를 분석하여 고객충성도 예측모형을 개발하였다. 고객충성도는 재구매 가능성으로 측정하였다. 본 연구에서 사용된 자료는 국내의 한 화장품회사 고객들의 2000년부터 2008년까지 9년간의 구매자료 (432,528명, 2,440,107건)이다. 예측모형의 목표변수는 재구매 유무이고, 설명변수는 구매수량, 구매액, 휴면기간 등의 기본변수와 구매횟수와 거래 일자를 이용한 가공변수들이다. 충성도 예측모형은 데이터마이닝 기법인 로지스틱회귀, 의사결정나무 및 신경망모형을 사용하였다. 예측모형평가의 측도로는 하이드게 점수를 사용하였으며, 최대의 하이드게 점수를 가지는 분계점을 선택하였다. 각예측모형에서 선택된 변수는 유사하며, 모형비교 결과 세 모형의 효율과 평가측도의 차이는 크지 않았다. 정분류율이 다소 높고 해석과 활용이 쉬운 의사결정나무모형을 최종모형으로 선택했다.

Keywords

References

  1. 김순귀, 정동빈, 박영술 (2003). , SPSS 아카데미, 서울.
  2. 당현준 (2003). , 석사학위논문, 이화여자대학교, 서울.
  3. 백신정 (2004). <데이터마이닝을 통한 고객관리데이터의 분석>, 석사학위논문, 고려대학교, 서울.
  4. 이도현 (2000). 데이터마이닝을 이용한 CRM, <정보과학회지>, 18, 4-11.
  5. 전성해, 김승화, 전홍석 (2008). <데이터마이닝과 CRM>, 자유아카데미, 서울.
  6. 최종후, 한상태, 강현철, 김은석 (1998). <데이터마이닝의 의사결정나무분석>, 고려정보산업, 서울.
  7. 허명회, 양경숙 (2007). , SPSS 아카데미, 서울.
  8. Cho, M. H. and Park, E. S. (2008). Analyzing customer management data by data mining: Case study on churn prediction models for insurance company in Korea. Journal of the Korean Data & Information Science Society, 19, 1007-1018.
  9. Heidke, P. (1926). Berechnung des Erfolges und der Gute der Windstar kevorhersagen im Sturmwarnungsdienst. Geografiska Annaler, 8, 301-349. https://doi.org/10.2307/519729
  10. Strauss, J., Ansary, A. E. and Frost, R. (2001). E-Marketing, Prentice Hall.
  11. Ko, B. S. and Lee, S. W. (2006). Customer behavior analysis on mobile advertisement. Journal of the Korean Data & Information Science Society, 17, 1251-1259.
  12. Sohn, K. T. and Lee, E. H. (2006). Guidance on choice of skill score for determination of thresholds in ternary forecast. Journal of the Korean Data Analysis Society, 8, 2553-2565.