DOI QR코드

DOI QR Code

A Study on Consumer Sentiment Index Analysis and Prediction Using ARMA Model

ARMA모형을 이용한 소비자 심리지수 분석과 예측에 관한 연구

  • 김동하 (남서울대학교 세무학과)
  • Received : 2022.07.28
  • Accepted : 2022.09.04
  • Published : 2022.09.30

Abstract

The purpose of the Consumer sentiment index survey is to determine the consumer's economic situation and consumption spending plan, and it is used as basic data for diagnosing economic phenomena and forecasting the future economic direction. The purpose of this paper is to analyze and predict the future Consumer sentiment index using the ARMA model based on the past consumer index. Consumer sentiment index is determined according to consumer trends, so it can reflect consumer realities. The consumer sentiment index is greatly influenced by economic indicators such as the base interest rate and consumer price index, as well as various external economic factors. If the consumer sentiment index, which fluctuates greatly due to consumer economic conditions, can be predicted, it will be useful information for households, businesses, and policy authorities. This study predicted the Consumer sentiment index for the next 3 years (36 months in total) by using time series analysis using the ARMA model. As a result of the analysis, it shows a characteristic of repeating an increase or a decrease every month according to the consumer trend. This study provides empirical results of prediction of Consumer sentiment index through statistical techniques, and has a contribution to raising the need for policy authorities to prepare flexible operating policies in line with economic trends.

Keywords

Ⅰ. 서론

1)

소비자심리지수(CCSI) 조사의 목적은 소비자의 경제상황에 대한 판단과 소비지출계획 등을 파악하여 경제 현상을 진단하고 향후 경제 방향을 전망하는 데 기초자료로 활용할 수 있다. 소비자 심리지수는 소비자 동향지수(Consumer Survey Index; CSI) 15개 중에서 6개의 주요한 지수(현재 생활 형편·생활 형편전망·가계수입 전망·소비지출전망·현재 경기판단·향후 경기전망)를 이용해 산출한 심리지표이다. 장기 평균치(2003년 1월~2020년 12월 동안 평균치)를 기준값 100을 바탕으로 지수가 100보다 크면 소비자 심리가 장기평균보다 낙관적이 되고, 100보다 작으면 비관적이라는 의미가 된다. 2022년 6월에는 소비자 심리지수(Composite Consumer Sentiment Index;CCSI)를 구성하는 6개 구성지수 모두 2022년 5월과 비교해 하락한 것이 특징이다. 개별지수별로 차이가 발생하지만 현재 생활 형편(-1 포인트), 생활 형편전망(-1 포인트), 가계 수입전망(-1 포인트), 소비지출 전망(-5 포인트), 현재 경기판단(-2 포인트), 향후 경기 전망(-8 포인트) 모두 하락세를 기록하였다.

취업기회전망 소비자 동향지수(CSI)는 이달(2022년 6월) 89로 나타나 경제회복 기대심리가 위축하며 9포인트 하락세를 나타냈다. 주택가격전망 CSI(107)는 아파트매매가격 오름세가 둔화를 비롯해 금리 상승·가계대출 규제 등으로 4개월 연속 하락세를 기록하였다. 이달(2022년 6월) 금리수준전망 CSI(137)는 지난달보다 1포인트 하락했지만, 기준금리 추가 인상 전망과 인플레이션(물가상승) 우려 등으로 130이 넘는 높은 수준을 기록했다. 물가 인식(지난 1년간 소비자물가상승률에 대한 인식)은 2.7%로 지난달과 동일했으며, 기대 인플레이션율(향후 1년간 소비자물가상승률에 대한 전망)은 2.6%로 지난달(2022년 5월)보다 0.1%포인트 하락했다.

한국은행이 전국 2500가구(응답 2294가구)를 대상으로 소비자 동향지수 설문 조사를 진행한 결과, 향후 1년간 소비자 물가 상승에 영향을 미칠 주요 품목의 응답 비중은 석유류 제품(51.4%), 농축수산물(43.8%), 공공요금(30.6%) 순으로 높았다. 지난달 대비 농축수산물(4.2%포인트), 공업제품(+4.1%포인트) 등의 응답 비중이 증가했다. 그러나 석유류 제품(-18.7%포인트) 비중은 감소한 것으로 나타났다[1].

이러한 소비자 심리지수의 증가추세와 감소 추세를 위해 정부의 대응 방안에 기초가 될 수 있는 소비자 심리지수에 관한 대부분의 연구는 정적인 시점에 초점을 두어 연구됐지만 본 연구는 동적인 시계열 방법으로 미래 소비자 심리지수의 증가 및 감소 추세 추이를 예측하고자 한다.

이러한 연구결과를 위한 본 연구는 시계열 분석 방법인 ARMA(Autoregressive moving average) 모형을 사용하여 월별 소비자 심리지수의 패턴을 파악하고 향후 3년의 소비자 심리지수 추세를 예측한 결과분석이 도출되었다.

Ⅱ. 선행 연구

소비자 심리지수의 유용성에 대한 선행연구로서 송민채와 신경식[2]은 “뉴스기사를 이용한 소비자의 경기심리지수생성”이라는 연구의 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자 심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 평가하였다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다고 판단하였다[2]. 또한 김유라와 강영선[3]은 소비자 심리지수가 기업의 재고자산 관리에 중요한 결정 요인이 될 수 있음을 설명하였다. 따라서 기업의 의사결정자들은 급변하는 시장 상황에서 효율적인 재고 관리 전략을 수립하는데 있어서 소비자 심리지수를 거시경제의 지표로서 활용할 수 있을 것이라고 설명하였다. 김지현과 최윤영[4]도 주택가격에 대한 소비자심리는 소비자물가지수와 같은 경제변수와 마찬가지로 아파트 거래량을 설명하는 중요한 변수임을 확인할 수 있었다. 심리적요인에 대한 선행연구로 김유라와 주재우[5]는 기존 연구에서 다루어지지 않은 소비자의 심리적 요인이 경영자의 의사결정에 영향을 미치는 요인임을 밝혀냈으며, 또한 광고 운영자들에게도 실무적 시사점을 제공하였다는 데에 의의가 있다고 주장하였다. 노민자와 유선종[6]은 심리지수가 주택가격과 관계가 있으며 주택시장을 분석하는데 심리지수들의 특성에 따라 분석목적에 부합되는 심리지수를 고려할 수 있다고 판단하였고. 다만, 적절한 심리지수를 주택시장 분석에 적용하기 위해서는 네이버트랜드지수와 같은 빅데이터를 생성하고 빅데이터 분석방법 등을 개발할 필요가 있다고 하였다. 그리고 주식시장 관련 연구로서 옥기율·김지수[7]는 소비자심리지수 정보가 주식시장에 부정적일 경우 긍정적인 경우에 비해 KOSPI 수익률이 큰 폭으로 하락하는 경향을 가진다고 판단하였다. 소비 가치에 대하여 이수정·문혜영·조미영·함선옥[8]은 “코로나19로 인한 소비가치 변화가 구매행동에 미치는 영향”논문에서 소비 가치 중 기능적 가치와 상황적 가치는 식자재 구매행동에 유의한 영향을 미치는 반면, 사회적 가치와 감정적 가치는 유의한 영향을 미치지 않는다고 하였다 것으로 나타났다. 소비자의 구매와 브랜드 관계에 대하여 배순한ㆍ전중양ㆍ박종순[9]은 “온라인 구전과 브랜드 관계의 질적 요인이 소비자 구매 의도에 미치는 영향 이라는 연구에서 브랜드는 오프라인뿐만 아니라 온라인에서도 소비자의 구매에 중대한 역할을 하고 있다고 판단하였다.

모형에 대한 연구로는 조준호 등[10]이 ‘글로벌 해운시장 현황 분석 및 시계열 모형을 이용한 부산 신항 컨테이너 물동량 예측에 관한 연구’에서는 국제 해운시장의 동향과 국내 해운시장의 위기설에 대한 국내외적 상황을 관찰하고, 부산 신항의 물동량이 회복세를 보일 수 있는 여건들을 탐색하기 위하여 부산 신항의 향후 물동량에 대하여 예측하는데 ARIMA(Autoregressive integrated moving average) 모형을 적용하였다. 이처럼 다양한 분야에서 사전연구가 이루어졌다. 따라서 본 연구는 ARIMA모형의 특수한 형태인 ARMA 시계열 분석 모형을 이용한 동적인 소비자 심리지수 추이를 파악하는 연구는 가치 있는 연구가 될 수 있을 것으로 판단된다.

Ⅲ. 연구모형

본 연구에서는 실증분석을 위하여 R프로그램을 이용하여 시계열 ARIMA 모형을 이용하고자 한다. ARIMA모형은 일정한 시간 간격으로 표시된 자료의 특성(추세 변동, 계절 변동, 순환 변동, 불규칙 변동)을 파악하여 미래를 예측하는 분석 방법이고 단점은 ARIMA모형을 이용하여 예측하는 경우 우연한 사건이 발생하여 오차를 일으킬 수 있다. 즉, 여러 변수를 일일이 고려하지 못하기 때문에 오차를 피할 수 없다. 자료는 2011년 1월부터 2022년 6월까지 한국은행 경제시스템에서 제공하는 소비자 심리지수(기준값 100) 자료를 이용하였다. 따라서 본 연구에서는 기존의 소비자 심리지수를 분석하고 앞으로의 미래예측을 추정하여 분석하고자 한다. 이 자료에 대한 차트는 <그림 1>에 요약되었다. 즉, <그림 1>에서 점차적으로 증가 혹은 감소 추세를 보이고 있다. 그리고 이 그림에 대한 기초통계량은 <표 1>에 나타내었다. 이 표에 요약된 기초통계량 분석으로부터 소비자 심리지수분포는 왜도(Skewness)의 값이 0보다 작은 음수이기 때문에 왼쪽 꼬리가 긴 상태(왜도)를 보이면서 첨도(Kurtosis)의 값은 0보다 크기 때문에 정규분포의 첨도의 특성보다 높은 분포를 형성하는 것을 확인할 수 있다[11].

DGTSA8_2022_v18n3_75_f0001.png 이미지

<그림 1> 소비자 심리지수

<표 1> 기초통계량

DGTSA8_2022_v18n3_75_t0001.png 이미지

3.1 ARMA모형을 이용한 소비자 심리지수 분석 및 예측

현재 시점 기준으로 과거 시계열의 추이가 미래에 시계열에도 유사한 추이가 될 것이라는 예측하에 미래시계열을 분석하는 시계열 분석 과정에 유용한 시계열 모형이 ARIMA 모형이다. 즉, ARMA 모형이 불안정한 비정상 시계열로 판단이 되면 차분(Difference)변환하여 평균을 안정화시키는 ARIMA 모형을 이용한다. ARIMA의 AR 부분은 진화하는 관심 변수가 시차(즉, 이전) 값으로 회귀됨을 나타내고. MA 부분은 회귀 오류가 실제로 과거 여러 시간에 동시에 발생한 오류 항의 선형 조합임을 나타낸다[10]. 따라서 <그림 2>에서 시계열 자료의 안정성을 입증하기 위하여 Dickey-Fuller의 단위 근 검정을 통해 평균이 정상적인 것으로 판단하여 1차 차분 등을 이용하여 정상 시계열로 변환하지 않고 사용할 수 있다즉 p-값(유의 확률값)이 유의수준(0.05) 보다 작기 때문에 시계열 자료가 정상성을 만족한다(또는 추세 정상성을 만족한다)라는 대립가설을 체택한다[12]

DGTSA8_2022_v18n3_75_f0002.png 이미지

<그림 2> Dickey-Fuller 검정

본 연구에서는 시계열 데이터가 일반적으로 비안정성을 따르는 시계열은 로그변환 또는 차분 기법을 이용하는데, 본 연구의 시계열 데이터는 안정성을 띄었기 때문에 분석 시계열 모형에 대한 AIC 통계량이 작은 모형이 효율적 모형으로 간주할 수 있다[10]. 즉 <표 2>에 AIC에 관련 모형선택을 시행하였다. 그 결과 ARMA(2,1) 모형을 선택하였다[11].

<표 2> AIC와 Loglikehood를 이용한 모형 선택

DGTSA8_2022_v18n3_75_t0002.png 이미지

단, AIC: Akaike’s Information Criterion

다음 과정으로는 소비자 심리지수 데이터의 시계열적 특징을 살피고자 <그림 3>과 같이 R프로그램의 decompose function 함수를 적용하여 그래프를 시계열분해 하였다. <그림 3>에서 반복적인 모습으로 계절적인 시계열(비정상적인) 특징을 따르지 않으며 시간의 지남에 따라 추세(trend)는 불규칙 모습으로 나타나고 있다[13].

DGTSA8_2022_v18n3_75_f0003.png 이미지

<그림 3> 시계열 분해

<표 3> MAPE와 RMSE를 이용한 모형 선택

DGTSA8_2022_v18n3_75_t0003.png 이미지

본 연구에서는 여러 가지 정확도에 대한 검정 방법이 있는데 ARIMA의 모형에 대한 예측정확도의 패턴을 진단하기 위하여 이상값(outlier) 발생에 대한 민감도가 둔감하고, 또한 여러 예측도 평가 지표들보다는 효율적인 신뢰도를 가지는 MAPE(mean absolute percentage error)척도를 활용하였다[13]. 또한 RMSE(root mean squared performance)의 추정값까지 확인하여 예측값의 정확도를 파악하였다. MAPE의 통계량은 다음과 같다[14].

\(\begin{aligned}M A P E=\frac{100}{N} \sum_{t=1}^{N}\left|\frac{A_{t}-F_{t}}{A_{t}}\right|\end{aligned}\)       (1)

식(1)에서 At의 값은 실측치(actual value), Ft의 값은 예측값(forecast value), N의 값은 표본의 개수를 의미한다. RMSE는 실제값과 추정값과의 차이를 측정하는 척도이다[13].

\(\begin{aligned}R M S E=\sqrt{\frac{1}{n} \sum_{i=1}^{n}\left(p_{i}-y_{i}\right)^{2}}\end{aligned}\)       (2)

식(2)에서 pt의 값은 예측값을 의미하고 yt의 값은 실제값을 의미한다[16]. 따라서 Table 3의 결과에서 소비자 심리지수 데이터의 ARMA(2,1) 모형은 다른 모형에 비해 예측값의 신뢰성(정확도)을 확보하였다.

또한, 소비자 심리지수 데이터는 정상성(그림 3)을 따르고 시계열로서 단위 근을 가지고 있지 않는 것으로 판단되고(그림 2) 주어진 시계열 데이터의 안정적 시계열로 변환하는 과정이 필요 없다[8]. <그림 4>에서는 ARMA(2,1)에는 모수 추정결과를 나타내었다. 즉 시계열 {yt}는 다음과 같은 모형을 따른다.

yt = 101.5640 + 0.1019yt - 1 + 0.5859t - 2 + 1.0000εt - 1 + εt

단, εt~iid N(0,10.73)

DGTSA8_2022_v18n3_75_f0004.png 이미지

<그림 4> ARMA(2,1)의 모수추정

또한. 선택한 모형에 대한 차수와 모수 추정이 시계열 정상성 가정을 따르는지를 알아보기 위하여 표준화 잔차 및 ACF 잔차의 패턴을 진단하고 더불어 Ljung-Box Q 검정을 이용하여 모형의 적합성을 진단하였다. 여기에서 사용된 Ljung-Box Q 통계량은 다음과 같이 알려져 있다[10].

\(\begin{aligned}Ljung-B o x: N(N+2) \sum_{j=1}^{k} \frac{r_{(k)}^{2}}{(N-k)}\end{aligned}\)       (3)

식(3)에서 r은 자기상관계수이고, N은 표본의 개수, k는 시차를 의미한다. 이 식을 이용한 결과는 <그림 5>에 나타내었다. 이 표에서 p-값(유의 확률값)이 기준이 되는 유의수준(0.05) 보다 작으면 귀무가설을 기각하게 되어 자기 상관성이 존재한다는 의미이다. 따라서 시계열 자료 간에는 일정 기간 랜덤 및 독립적이 아니라는 것을 의미한다.그러나 p-값이 유의수준 5%에서 큰 값을 나타내기 때문에 귀무가설을 채택하여(χ2적합도 검정) 모형이 적합하다는 결론을 내릴 수 있다[14].

DGTSA8_2022_v18n3_75_f0005.png 이미지

<그림 5> ARMA(2,1)의 모형 진단​​​​​​​

그리고 <그림 6>에서 자기 상관 측면에서도 모두 임계치 안에 표시되어 나타나기 때문에 불규칙성을 보장하는 자기 상관이 없는 양호한 시계열 모형으로 판단할 수 있다[15].

DGTSA8_2022_v18n3_75_f0006.png 이미지

<그림 6> 정상성 확인​​​​​​​

선택모형을 통해 해당 연구의 궁극적 목표인 향후 3년 즉, 총 36개월의 소비자 심리지수를 예측했다. 그 결과 <그림 7>과 같은 추정값 패턴을 보였다. 또한 해당 그래프의 추정값은 평균값을 중심으로 예측구간 95%의 예측구간 값도 살펴볼 수 있다.

DGTSA8_2022_v18n3_75_f0007.png 이미지

<그림 7> 소비자 심리지수 36개월 예측 그림​​​​​​​

즉, Jun/2022부터 Nov/2022년까지의 예측값 평균을 기준으로 소비자 심리지수 예측값을 통하여 증가율을 살펴보면 매년 소비자 심리지수가 소폭 증가추세를 보이고 있다(표 3, 그림 8).

<표 3> 5개월 예측

DGTSA8_2022_v18n3_75_t0004.png 이미지

DGTSA8_2022_v18n3_75_f0008.png 이미지

<그림 8> 5개월 예측그림​​​​​​​

Ⅳ. 결론과 한계성

소비자심리지수 조사의 목적은 소비자의 경제 상황에 대한 판단과 소비지출계획 등을 파악하여 경제현상을 진단하고 향후 경제 방향을 전망하는 기초자료로 활용된다. 본 논문은 과거 소비자 지수를 바탕으로 ARMA 모형을 이용해 미래 소비자 심리지수를 분석 및 예측하는데 목적을 두고 있다. 이 논문을 진행하게 된 주요 요인은 매년 지속적으로 변동되는 소비자 심리지수 자료을 통해 그 추세를 회복 파악할 수 있는 요인들을 토론하고자 ARMA 모형을 활용하여 소비자심리지수 동향에 대해 정량적 분석, 예측하였다.

본 연구에서 2011년 1월부터 2022년 6월까지 소비자 심리지수 자료 데이터를 분석한 결과 다음과 같은 결과를 도출하였다.

첫째, 소비자 심리지수 자료값은 본 연구 통계데이터의 시작점인 2019년 1월부터 지속적으로 소폭 감소 및 증가형태를 보여주고 있다. 특히 2020년 초반부에는 신종 코로나(코로나19)의 사회특성에 대한 소비심리가 반영되어 큰 감소형태를 보여왔다. 은행들이 가산금리 인하, 대출한도 증액 등으로 영업을 강화하면서, 위축됐던 소비자 동향 추세가 조금씩 변하는 패턴으로 나타나고 있다.

둘째, 소비자 심리지수 시계열 자료는 계절 효과가 포함되지 않은 정상성 시계열로 나타나 차분을 하지 않고 사용되었다. 특히 5개월 예측값들은 연구 시점 2022년 7월을 기준으로 했을 때 8월에는 약 1.39%포인트 증가패턴이고 9월과 10월에는 각각 1.71%, 2.57%포인트 증가하고 11월에는 2.84% 포인트 증가하는 추세를 보이고 있어 점차 완만한 회복세를 보이는 모습으로 예측되었다.

셋째, 소비자 심리지수 자료값은 은행금리, 기준금리 및 사회현상 변수에 영향이 큰 소비자 심리지수의 동향에 따른 대책 형태에 대한 시계열적 분석을 한 연구는 찾아보기 힘들다.

이론적 시사점은 소비자심리지수는 상승과 하락을 끊임없이 반복하며 기업과 소비자를 비롯한 경제주체들의 경제활동에 영향을 미치기 때문에 현재의 경기상황을 진단하고 미래의 경기흐름을 예측하는 것은 점점 중요해지고 있다. 한국은행 경제시스템이 공표한 소비자동향조사 결과와는 조금 차이가 있을 수 있다. 그 이유는 돌발 사회변수, 즉 신종 코로나(코로나 19)의 휴유증, 우크라이나 사태 장기화, 중국 성장둔화, 주요국 금리 인상 변수들을 반영하지 못한 연구의 한계 때문이라고 판단할 수 있다.

따라서 실무적 시사점은 사회 돌발변수들을 극복해 가면서 소비자 심리지수 추정 분석접근은 국내의 소비자 심리지수 패턴을 이해하는 기초지식을 이해하는데 기본적인 참조가 될 수 있으리라 사료 된다.

References

  1. 이코노미스트 https://economist.co.kr/2021/12/28/policy/issue/20211228060023229.html
  2. 송민채.신경식, "뉴스기사를 이용한 소비자의 경기 심리지수 생성," 지능정보연구, 제23권, 제3호, 2017, pp.1-2. https://doi.org/10.13088/JIIS.2017.23.3.001
  3. 김유라.강영선, "소비자 심리지수와 재고자산 수준간의 관계에 대한 연구," 한국기업경영학회, 제22권, 제4호, 2015, pp.101-120.
  4. 김지현.최윤영, "부동산 소비심리의 아파트거래 영향력 분석," 부동산연구, 제26권, 제1호, 2016, pp.7-17.
  5. 김유라.주재우, "소비자 심리지수를 통한 소비자예측이 광고비에 미치는 영향," 한국산학기술학회논문지, 제13권, 제12호, 2012, pp.5732-5758.
  6. 노민지.유선종, "소비자 심리와 아파트 실거래가격 간 관계분석: 인터넷 검색량 및 국토연구원 주택매매시장 소비심리지수를 중심으로," 국토연구, 제89권, 2016, pp.3-13. https://doi.org/10.15793/KSPR.2016.89..001
  7. 옥기율.김지수, "소비자 심리지수가 KOSPI 수익률에 미치는 비대칭적 영향에 대한 연구," 금융공학연구, 제11권 제1호, 2012, pp.17-37. https://doi.org/10.35527/KFEDOI.2012.11.1.002
  8. 이수정.문혜영.조미영.함선옥, "코로나19로 인한 소비가치 변화가 구매행동에 미치는 영향 ," 디지털산업정보학회 논문지, 제18권 제1호, 2022, pp.139-149.
  9. 배순한.전중양.박종순, "온라인 구전과 브랜드 관계의 질적 요인이 소비자 구매 의도에 미치는 영향," 디지털산업정보학회 논문지, 제7권 제3호, 2011, pp.175-187.
  10. 조준호.변제섭.김희철, "글로벌 해운시장 현황 분석 및 시계열 모형을 이용한 부산 신항 컨테이너물동량 예측에 관한 연구," 한국정보전자통신기술학회논문지, 2017, 제10권, 제4호, pp.295-303. https://doi.org/10.17661/JKIIECT.2017.10.4.295
  11. 김창범, "개입 승법계절 ARIMA와 인공신경망모형을 이용한 해상운송물동량의 예측," 한국항만경제학회지, 제31권, 제1호, 2015, pp.69-84.
  12. 임찬영.김희철, "ARIMA 모형을 활용한 예금은행주택담보대출분석 및 예측 연구," 한국정보전자통신기술학회논문지, 제12권, 제3호, 2019, pp.265-272. https://doi.org/10.17661/JKIIECT.2019.12.3.265
  13. 이용희, "교차실험에서 AIC를 이용한 혼합모형 선택법의 비교," 한국자료분석학회, 제16권, 제1호, pp.155-163.
  14. 고봉현, "제주지역 감귤가격의 시계열적 특성 및 가격변동성에 관한 연구," 제21권, 제1호, 2020, pp.212-217.
  15. 최종산, "계절 시계열모형의 육류 소매가격 추정 및 예측정확도 평가," 한국식품유통학회, 제33권, 제1호, 2001, pp.1-31