I. Introduction
소비자 행동론은 소비자들의 많은 의사결정들이 정서(affect)라는 원초적인 감정적 반응에서 비롯되는 것을 밝혀왔으며 마케터들은 이러한 정서적 반응을 위해 많은 노력해 왔다 [1]. 정서는 감정적인 변화에서 기인하는데 이는 평가(evaluation), 무드(mood), 감정(emotion)과 같은 유형을 지니고 있다 [2]. 한편, 감정과 혼용하여 일반적으로 사용되는 감성(Sensibility) 역시 긍정과 부정의 방향성을 지님으로써 정서적 반응을 일컫는다. 감성은 심리적변화 강도가 낮고 생리적 변화를 관찰하기 힘들다는 점에서 감정과 구분되지만[3], 정서적 변화를 일으킨다는 점에서 소비자 행동이론에서 나눈 정서유형 카테고리에 포함된다고 볼 수 있다. 이러한 정서는 다양한 동기(motivation)에 의해서 발생되는데, 긍정적인 정서와 부정적인 정서의 원요인들은 매우 다양하다[1].
이러한 정서는 소비자의 의사결정에 직・간접적으로 영향을 미치는 요인들에 영향을 미치게 된다는 점에서 소비자 행동 분야에서는 오랜 기간 연구되어왔으며, 이는 대안의 선택, 구매의 결정, 제품의 관여도 등 최종 구매 행위까지 많은 단계를 포함 한다. 그러므로 이러한 정서의 반응인 감성 역시 중요한 연구목적이 되어왔다.
한편, 다양한 선행연구에서 기상 요인들이 사람의 감성에 영향을 미치는 것을 살펴볼 수 있다[4]. 강수, 온도, 일조시간이 인간의 ‘기분에’ 가장 큰 영향을 발생시키며, 높은 습도는 집중력을 저하 시키며, 졸음을 증가시킨다[5]. 온라인 구매 행위(Purchase Behavior) 또한 구매 의도라는 심리적 변화인 선행변수에 의해 야기된다는 점에서 그 결을 같이 한다.
날씨 정보는 이미 다양한 생활 관련 지수와 연계되어있고 관련된 지수들이 발표되어왔다. 이는 날씨가 사람의 행동(behavior)과 관련되어 있다는 반증이기도 하다 [6]. 마케팅 측면에서도 고객 수요 변화가 매출에 직결되는 리테일 분야의 경우 기상정보가 소비자 심리와 행동에 미치는 영향에 큰 관심을 가져왔다 [7].
위와 같이 감성(정서)의 변화에 따른 소비자 심리와 행동의 변화, 기상에 따른 소비자 심리와 행동의 변화의 연구들 그리고 날씨와 감성의 연관성을 증명해온 선행연구들에 따라, 날씨는 감성에 직접적인 영향을 그리고 소비자의 행동이 직/간접적인 영향을 미친다는 것을 알 수 있으며, 이를 실증할 필요성이 대두된다.
본 연구는 이와 같은 다양한 분야의 선행연구에서 기상요소가 감성의 변화를 일으키고 그러한 감성의 변화가 일으킨 정서적 반응이 온라인 구매 행위에 영향을 미칠 수 있음을 기상 빅데이터 분석과 SNS 텍스트마이닝, 그리고 국내 A 온라인 쇼핑몰 사의 구매 빈도를 분석하여 실증하고자 한다.
II. Preliminaries
2.1 Emotion and Sensibility
대다수 사람들은 감성(Sensibility)과 감정(emotion)을 혼용한다. Table 1은 선행연구에서 살펴본 감성과 감정의 차이를 보여준다[8]. 감정은 두뇌의 판단과정을 거쳐 발생되고 심리적 변화강도가 높고 생리적 변화를 동반하지만 감성은 반사적, 직관적, 개인성, 무의식적 발생, 모호성, 변화성을 가지고 있고 심리 변화 강도가 낮다[3]. 즉, 소비자 행동학에서 다루는 정서(affect)의 유형을 따르고 있다. Howarth, E. & Hoffman M.S.의 선행연구에서는 다양한 기상변수들이 인간의 기분과 졸음과 같은 행동에 영향을 미친다는 결과를 나타낸다 [5]. 이는 기상요소들이 교통사고 사망률, 쇼핑몰 매출, 범죄율과 같이 다양한 현상의 선행변수로 사용된 연구 결과들로 그 논리를 견고히 할 수 있다 [8,9,10]. 본 연구가 소비자 행동론에서 정서의 유형으로 고정화된 감정이 아닌 감성을 사용하는 이유 역시 인간이 외부환경인 날씨의 변화에 즉각 반응하고 무의식적으로 발생하는 감성을 연구하고자 함에 있다.
Table 1. Emotion and Sensibility [8]
본 연구에서는 감성의 측정 도구로써 설문이 아닌 사회관계서비스(SNS: Social Network Service)의 텍스트에 대한 감성 분석을 사용한다. 이는 SNS 콘텐츠가 이미지, 텍스트 등으로 콘텐츠 작성시 사용자의 감성을 잘 나타내고 있다는 선행연구에 기인한다[11].
2.2 Purchase Behavior
구매 행동(Purchase Behavior)에 관한 연구는 굉장히 오랜 기간 다양한 방면에서 이루어졌으며, 구매 행동은 구매 의도에 의한 결과임이 다수의 실증 연구를 통해 증명되어왔다 [12]. 본 연구에서 사용하는 구매 행동의 선행변수인 감성, 혹은 정서는 선행연구들에 따르면 구매 행동보다는 구매 의도에 영향을 미친다 [13]. 하지만 본 분석 방법론의 특성상, 텍스트 마이닝에서 도출된 한글 형태소 분석기의 결과인 긍정/부정(Positive/Negative)에 대한 감성 설문을 통해 측정되는 소비자의 의도와 결합하여 분석은 사실상 불가능하며, 이에 따라 본 연구에서는 구매 의도가 아닌 구매 행위 자체를 분석한다. 본 연구에서 사용하는 구매 행위에 대한 정의는 George(2004)의 정의인 ‘소비자가 인터넷을 통해 구매하고자 하는 빈도’를 인용, A사의 소비자 인터넷 구매 빈도 데이터를 활용한다 [14].
III. Research Methodology
3.1 Weather, SNS, and Purchase Data
본 연구에서는 기상청 기상자료개발포털을 통해 2022년7월 ~ 2023년6월 1년 365일의 시간별 종관기상관측(AOS)데이터를 csv파일 형태로 사용한다. 해당 기상 데이터는 국내 95개 기상 관측소에 대한 기상 데이터가 포함되어 있다. 해당 데이터에는 기상 관측소의 행정구역 주소가 존재하며, 관측소 주소가 구주소일 경우 관측소 좌표를 통해 가장 가까운 행정구역으로 변환하였다.
기상정보는 최대/평균풍속(m/s), 일 강수량(mm), 평균증기압(hPa), 합계 일조시간(hr), 평균 상대습도(%), 평균지면 온도 등 총 34개 중 관측소마다 관측장비가 달라 데이터의 일관성과 유사성을 고려하여 8개의 기상정보로 축약했다.
I社 SNS 데이터는 python을 통해 크롤링 하였으며, 2022년 7월~2023년 6월 사이 지리정보를 가지고 있고 국내에서 작성된 콘텐츠만을 선별하였다. 해시태그를 제외한 텍스트가 20글자 이상 있는 콘텐츠만을 필터링하였으며, 광고성 데이터를 삭제하고 형태소 분석기를 통해 stop word가 다수 포함된 의미 없는 콘텐츠를 삭제한 후 분석의 효율성을 위해 약 8만건을 Random 크롤링하였다. 이는 모든 해당 회사의 1년 데이터가 너무 크기 때문이다.
주소를 포함한 해당 텍스트 데이터는 KoNLPy의 Mecab 형태소 분석, Stopwords제거후 TF-IDF 변환을 실시하였으며 [15], 감성분석을 위해 KOSAC(Korean Sentiment Analysis Corpus)를 사용하였다. KOSAC은 8천여개의 Corpus를 가지고 있어 감성과 의견을 구분할 수 있다[16,17]. 결과적으로 SNS Data는 일련번호, 주소, 텍스트, 감성분석 태그(P/N)만을 남겼으며, Neural로 결정된 데이터를 최종적으로 제거하여 17,311건을 사용하였다.
본 연구는 A사의 소비자 데이터를 활용하였다. 개인정보 보호법에 의거하여 소비자를 특정지을 수 있는 데이터는 모두 삭제하였으며, 별도 식별자로 변환된 이름, 사용자의 주소 (시 단위일 경우 ‘구’까지만), 구매일시 데이터로 이루어진 2022년 7월 ~ 23년 6월 1년치 데이터 약 13만건을 사용하였다.
3.2 Research Data & Analysis
상기 3개의 데이터셋을 주소 기준으로 Merge하여 연구데이터를 생성하였다. 연구데이터에 생성된 필드와 정의는 Table 2와 같다.
Table 2. Research Dataset
분석은 2개의 스탭으로 이루어졌다. 첫 번째로 감성을 가장 잘 설명하는 기상 요인들을 만들기 위해 Logistic Regression을 실시하였다. Training은 8개 기상정보(일강수량(mm), 최대풍속(m/s), 평균풍속(m/s), 평균 상대습도(%), 평균 증기압(hPa), 합계 일조시간(hr), 평균 지면온도(섭씨), 일 최심적설(cm)) 중 선행연구에서 밝혀진 3가지 기상요소 (일 강수량, 합계 일조시간, 평균 지면 온도)를 기본값으로 하고, 나머지 5개 기상요소를 추가하면서 다량의 Set를 구성하였다. 상기 3가지 기상요소 +1을 한 4개 기상요소 5set, +2를 한 5개 기상정보 10set 등 총 25개 training set을 통해 25개 모형을 생성하였으며, 각 모형별로 10% 데이터를 5회에 걸쳐 추출, 검증하였다. 이 중 정밀도, 정확도, 재현율, F1 Score, ROC_AUC결과를 보인 모형은 4개 기상요소인 5set 중 3개로 추릴 수 있었다.
두 번째로 감성에 따른 구매 빈도의 차이가 있가에 대한 검증을 위해 감성을 그룹으로 하고 구매 빈도를 측정치로 하는 ANOVA를 실시하여, 긍정/부정 감성에 따른 구매 빈도 차이가 있는지 검증하였다.
IV. Results
4.1 Weather – Sensibility model result
아래 Table 3은 SNS 텍스트 마이닝 결과를 보여주고 있다. 총 34,933개의 콘텐츠에서 뽑아낸 긍정적 말뭉치는 136,238건이며 부정적 말뭉치는 21,999건이다. 평균 긍정 말뭉치 개수에서 부정 말뭉치 개수를 제외한 수치를 넘지 못하는 경우 neural로 판정하고 남은 콘텐츠 개수는 총 17,311건이며 이 중 11,933건이 긍정으로 판정되고 5,378건은 부정으로 판정된다.
Table 3. Corpus Characteristics
긍정 콘텐츠의 건수가 부정에 비해 굉장히 많은데, 이는 I사의 특성상 내용이 흔히 말하는 ‘자랑’인 경우가 많기 때문으로 판단된다. 전체 8만여건의 데이터 중 34,933건만 전체 콘텐츠 개수에 사용된 이유를 ‘불용어’처리가 너무 많기 때문이다. 즉 사전상없는 단어의 사용율이 60%가 넘었다.
Table 4는 정밀도, 정확도 등 지표에서 가장 높은 3개의 모형에 대한 Training 결과를 보여준다. 검증 결과 4개의 기상요소(precipitation, sunshine hours, average ground temperature, average relative humidity)로 구성된 A Set 가장 좋은 분석 결과를 보여줬다.
Table 4. Logistic Regression Model results
(Acc: Accuracy, Prec: Precision, Rec: Recall, F1: F1 score, RA: ROC_AUC
A set: rainfall, sunshine duration, avg temperature, avg humidity
B set: rainfall, sunshine duration, avg temperature, avg wind speed
C set: rainfall, sunshine duration, avg temperature, atmospheric pressure
이는 3년치 기상 데이터와 SNS 분석을 했던 선행연구와도 유사한 결과를 보여주며[4], SNS 사용자들이 작성하는 글의 감성이 해당 지역/시간의 강수량, 일조량, 기온, 상대습도에 영향을 받는다는 것을 의미한다.
4.2 Sensibility – Purchase Frequency ANOVA
분산분석 결과는 전체적으로 본 결과와 지역별로 살펴본 결과가 미미한 차이를 보인다. 보다 정확한 분석은 더 자세한 지역별, 혹은 시간대별 등 다양한 추가 분석을 통해 살펴볼 수 있을 것으로 판단되지만 분석 대상 지역이 전국 ‘구’ 단위임에 자료가 방대하여 몇몇 지역에 대해 별도 분석한 결과를 Table 5에 기술하였다. 전체적인 감성에 다른 구매 빈도는 감성에 따라 구매 빈도가 차이가 있는 것으로 나타났다. 다만, 지역별로 살펴보면 차이가 없는 경우들이 나타나는데, 다양한 이유를 살펴볼 수 있다. 첫째 봉화군과 같이 인구수가 적어 타 지역 대비 데이터 수가 부족하거나, 둘째 구매 빈도가 낮으며 구매 시 기상변화가 심하지 않은 경우와 같다. 상기 두 가지 케이스를 제외하면 본 연구에서 검증하고자 했던 감성에 따른 구매 빈도 차이가 나타나지 않은 지역 케이스는 95개 관측소 기반 주소 중 2건밖에 나타나지 않았다.
Table 5. ANOVA Result
V. Conclusions
본 연구에서는 1년(2022년8월~2023년 7월)간 8가지 기상요소 정보와 SNS의 콘텐츠 텍스트, 그리고 쇼핑몰의 구매 빈도 데이터를 통합하여, 기상정보에 따라 감성 정보가 변화함을 밝히고 이에 대한 트레이닝을 통해 정확도 91% 정밀도 93% 재현율 95%의 모형을 도출하였다.
또한 긍정/부정 감성에 따라 구매 빈도가 변화함을 분산분석을 통해 검증하여, 기상정보에 따라 온라인 쇼핑몰의 구매 빈도가 변경될 수 있음을 검증하였다. 이는 기존 연구들을 지지할 수 있는 실증 결과이기도 하며, 다양한 추가 연구 및 응용 분야를 고려할 수 있다.
첫째, Training을 통해 날씨에 따른 감성을 예측할 수 있는 모형이 도출되었으므로, 쇼핑몰 매출 등 감성에 따라 변화할 수 있는 다양한 변수들에 대한 예측 모형 역시 도출해 볼 수 있다.
둘째, 마케팅에서 의사결정에 중대한 영향을 미치는 정서(affect)와 관련된 다양한 연구에도 활용이 가능하다.
셋째, 한국어는 감성분석 사전이 긍정/부정만 분류가 되지만 자연어 분석이 더 발전하여 7개로 분류가 가능한 영어 감성 분석기와 같이 더욱 다양한 종류의 감성분석이 가능한 분석에서는 더욱 확장성 있는 연구가 가능하다.
이러한 확장성과 연구 결과의 의미에도 불구하고 본 연구는 많은 한계점을 안고 있다.
첫째, Lexicon을 사용해도 분류할 수 없는 감성 표현 Corpus가 너무 많아 정확한 감성 분류를 했다고 판단하기 어렵다. 특히 MZ세대 유저가 많은 SNS 특성상 유행어나 단축어, SNS에서만 사용하는 용어들에 대해서 사전이 충분히 역할을 해주지 못하였다. 이는 본 연구에서 놓친 다양한 감성들이 존재하며 이는 당연히 Training 과정과 Anova 분석에 영향을 미쳤을 것으로 판단된다. 또한, 다수의 감성으로 분류가 가능한 영어 감성분석과 달리 한국어는 긍정/부정 분석이 가능한 사전만이 존재하기에 본 연구의 한계점이 명백히 존재한다.
둘째, 본 연구는 전체적으로 기상-감성-구매 행위를 아우르는 모델을 세우지 못하였다. 이는 감성 데이터가 Boolean 형태를 띄는 관계로 전체 모형을 만드는데 어려움이 있었다. 향후 다른 접근을 통해 전반적인 프로세스에 대한 검증을 할 필요가 있다.
셋째, 구매 의도가 아닌 구매 행위를 분석하였다. 선행연구를 살펴보면 affect는 행위보다는 의도에 영향을 미친다. 비록 많은 선행연구들에서 구매 의도가 구매 행위에 강력한 영향을 미침이 밝혀졌으나, 구매 의도가 아닌 구매빈도 자체로 검증을 하였기에 간접적 영향을 파악하지 못했다는 한계가 존재한다. 사실 구매 의도와 행위 사이에는 다양한 과정 및 요인들이 오랜간 마케팅 연구들에서 밝혀져 왔으며 이에 대한 구체적인 본 연구의 감성요소들간의 관계는 밝혀내지 못했다.
넷째, 특정 기업 데이터만을 사용하여 분석한 결과 특정 제품에 대한 분석만이 이루어졌다. 따라서 모든 기업과 제품에 적용된다는 일반화에는 한계점이 존재한다.
마지막으로 SNS 플랫폼의 한계이다. I사의 플랫폼은 사진이 주가되는 SNS플랫폼이며 보통 긍정적인 사진과 내용을 전달하는데 개인들이 사용한다. 따라서 부정어 보다는 긍정어의 비율이 높다. 이는 날씨가 좋지 않아 부정적인 감성이 들었다고 하더라도 해당 SNS 보다는 다른 채널을 통해 감성을 전달할 가능성이 높다는 것이다.
이러한 한계점들에도 불구하고 본 연구는 기존 통계학적 접근 연구들에서 밝혀진 요인들간의 관계를 Raw Data를 통해 접근해서 분석 시도해봤다는 점에서 학술적 시사점을 가지고 있다고 판단하며, 추가적인 다양한 연구의 제안이 가능하다. 첫째로, 문화적, 지역적 context로 접근한 연구이다. 이는 문화/지역별로 다른 소비패턴과 감성 요소들을 가질 수 있기에 추가적 연구가 가능하다. 둘째로, SNS의 사용 연령층을 고려하여 추가적인 신조어 등을 포함한 사전 개발 연구이다. 특히 젊은 층들이 많이 사용하는 SNS의 경우 일반적인 텍스트에 이모지 등을 통해 감성을 추가하는 경향이 많아 이에 대한 연구는 추가적인 감성 관련 연구 모두에 영향을 미칠 수 있다. 마지막으로 기존 마케팅 구매 의도와 행위 관련 연구에서 밝혀진 다양한 매개변수들과 본 연구에서 사용된 감성간의 관계 역시 추가 연구로 고려해볼 수 있다. 감성은 인간의 다양한 행위에 영향을 미치며 [18], 이에 대한 연구는 다양한 소비자 행학의 모형들에 적용이 가능하며 의미를 가진다고 본다. 하지만 이에 앞서 본 연구 결과에서도 살펴봤듯이 사전의 추가와 같은 선행 프로세스가 필요하다고 생각한다.
ACKNOWLEDGEMENT
This work was supported by the research grant of Pai Chai University in 2023. (2023A0253)
References
- Michael R. Solomon, Consumer Behavior Buying, Having, and Being, Pearson, 2019
- Michael R. Solomon, Katherine White and Darren W. Dahl, Consumer Behaviour: Buying, Having, Being, 6th Canadian ed., Toronto: Pearson, 2014
- K.H. Lee, "Human Sensibility and Its Measurement and Evaluation", Annual Conference, Korea Society of Sensibility Science, pp.37-42, 1997.
- H.J. Yeo, "Seasonal Weather Factors and Sensibility Change Relationship via Textmining', Journal of the Korea Society of Computer and Information, Vol.27, No.8, pp.219-224, 2022 https://doi.org/10.9708/JKSCI.2022.27.08.219
- Howarth, E. & Hoffman, M.S, "A multidimensional approach to the relationship between mood and weather", British Journal of Psychology, Vol.75, No.1, pp.15-23, 1984. https://doi.org/10.1111/j.2044-8295.1984.tb02785.x
- Korea Meteorological Administration, http://web.kma.go.kr/eng/
- Seonghee, Lee and Hyery, Lee, "The Companies that Cry and Laugh..Weather is Money", Kyunghyang Business, 12.Jan, 2018.
- E.Y. Jang and S.J. Lee, "The Effects of Meteorological Factors on Sales of Apparel Products - focused on apparel sales in the department store -", Journal of the Korean Society of Costume, Vol.52, No.2, 2002
- Y.N. Lee and K.W. Kim, "A study on the relationships between the fatal traffic accidents and meteorological factors", Journal of Korea Police Studies, Vol.6, No.3, pp.125-164, 2007.
- Y.H. Lee, and Y.S. Kim, "Weather, the Day of Week, and the Number of Crime: focused on Crime Occurrence in Seoul during the Winter", Korean Criminal Psychology Review, Vol.6, No.1, pp.207-211, 2010.
- S.J. Kim and T.Y, Kim, "How the Emotion of SNS Contents Influence the Users' Affective States : Focused on Facebook Newsfeed Pages", Journal of Cybercommunication, Vol.29, No.1, pp.5-47, 2012.
- Morwitz, V.G., Steckel, J.H., Gupta, A., "When do purchase intentions predict sales?", Int. J. Forecast,Vol.23, no.3, pp.347-364, 2007. https://doi.org/10.1016/j.ijforecast.2007.05.015
- N. Pena-Garcia et al, "Purchase Intention and Purchase Behavior online: A Cross-cultural Approach", Heliyon, 6, e04284, 2020.
- George, J.F., The theory of planned behavior and internet purchasing. Int. Res., 2004
- Salton G. and McGill, M. J. 1983 Introduction to modern information retrieval. McGraw-Hill, ISBN 0-07-054484-0.
- Korean Setiment Analysis Corpus, http://word.snu.ac.kr/kosac/corpus.php
- H.P. Shin, M.H. Kim, Y.M. Jo, H.J. Jang and Andrew Cattle, "Annotation Scheme for Constructing Sentiment Corpus in Korean", 26 th Pacific Asia Conference on Language, Information and Computation, pp.181-190, 2012.
- HJ, Yeo, "Seasonal Weather Factors and Sensibility Change Relationship via Textmining", Journal of The Korea Society of Computer and Information, Vol.27, No.8, pp.219-224, 2022 https://doi.org/10.9708/JKSCI.2022.27.08.219