Abstract
Stock market prices, economic indices, trends and changes of social phenomena, etc. are categorized as time series data. Research on time series data has been prevalent for a while as it could not only lead to valuable representation of data but also provide future trends as well as changes in direction. We take a conventional model based approach, known as Markov chain modeling for the prediction on stock market prices. To improve prediction accuracy, we apply Markov modeling over carefully selected intervals of training data to fit the trend under consideration to the model. Another method we take is to apply clustering to data and build models of the resultant clusters. We confirmed that clustered models are better off in predicting, however, with the loss of prediction rate.
주식 가격이나 경제 지표, 사회적 현상의 추세나 변화 등은 통상 시간에 따라 변화하기 때문에 시계열 자료로 구분된다. 시계열 자료는 시간 축에 대해 변화하는 자료의 표현 가치뿐 아니라 그 변화 추세나 향후 방향성까지 제시할 수 있다는 점에서 이에 대한 방법론에 대해 많은 연구와 노력이 지속되어 왔다. 본 논문에서는 전통적으로 예측 모형을 구축하여 예측하는 방법을 취하되 그 모형이 복잡하고 정교한 모델을 활용하여 예측 정확도를 높이려는 시도와는 달리 자료 클러스터링 방법과 자료 구간 선정을 통해 예측정확도를 높이려 시도하였다. 기본 모델은 마코프 모델이다. 구간별 유사 구간을 추출하여 모델링하는 구간별 모델링 방법과 클러스터링을 통한 그룹별 모델링을 통해 모델의 예측정확도를 개선하려 시도하였다. 실험을 통해 클러스터링을 거친 그룹별 마코프 모델이 정확도를 개선 시켰으나 예측율은 현저히 떨어지는 결과를 낳았다.