JOURNAL BROWSE
Search
Advanced SearchSearch Tips
Performance Comparison of Clustering Validity Indices with Business Applications
facebook(new window)  Pirnt(new window) E-mail(new window) Excel Download
 Title & Authors
Performance Comparison of Clustering Validity Indices with Business Applications
Lee, Soo-Hyun; Jeong, Youngseon; Kim, Jae-Yun;
  PDF(new window)
 Abstract
Clustering is one of the leading methods to analyze big data and is used in many different fields. This study deals with Clustering Validity Index (CVI) to verify the effectiveness of clustering results. We compare the performance of CVIs with business applications of various field. In this study, the used CVIs for comparing performance are DU, CH, DB, SVDU, SVCH, and SVDB. The first three CVIs are well-known ones in the existing research and the last three CVIs are based on support vector data description. It has been verified with outstanding performance and qualified as the application ability of CVIs based on support vector data description.
 Keywords
Clustering;Clustering Validity Index;Support Vector Data Description;Business Application;
 Language
Korean
 Cited by
 References
1.
강지혜, 김성수, "적응적인 초기치 설정을 이용한 Fast K-means 및 Fuzzy c-means 알고리즘", 정보과학회논문지, 제31권, 제4호(2004), pp. 516-524.

2.
고정원, 최병인, 이정훈, "노이즈에 강한 밀도를 이용한 Fuzzy C-means 클러스터링 알고리즘", 한국퍼지 및 지능시스템학회 추계학술대회, 제16권, 제2호(2006), pp.211-214.

3.
김민호, R.S. Ramakrishna, "비형식의 군집 유효화 지수의 분석과 새로운 지수 개발", 한국컴퓨터종합학술대회, 제32권, 제1(B)호(2005), pp.601-603.

4.
김상락, 강만모, 박상무, "빅데이터가 여는 미래의 세상, 정보과학학회지, 제30권 제6호(2012), pp.18-24

5.
김성우, 김각규, 윤봉규, "국방분야 빅 데이터 분석의 활용가능성에 대한 고찰", 한국경영과학회지, 제39권, 제2호(2014), pp.1-19.

6.
김정숙, "빅 데이터 활용과 관련기술 고찰", 한국콘텐츠학회지, 제10권, 제1호(2012), pp.34-40.

7.
민재형, 송영민, "국내 생명보험회사의 재무건전성 평가:ELECTREII, 단순가중합 모형, 군집분석의 비교", 한국경영과학회지, 제28권, 제4호(2003), pp.39-60.

8.
민재형, 이영찬, "Support Vector Machine을 이용한 부도예측 모형의 개발:격자탐색을 이용한 커널 함수의 최적 모수 값 선정과 기존 부도예측 모형과의 성과 비교", 한국경영과학회지, 제30권, 제1호(2005), pp.55-74.

9.
안현철, 김경재, 한인구, "Support Vector Machine을 이용한 고객구매예측 모형", 한국지능정보시스템학회논문지, 제11권, 제3호(2005), pp.69-81.

10.
오은녕, 이희상, "클러스터링 기법을 이용한 이동통신의 고객 세분화 연구", 한국경영과학회 추계논문집, (2002), pp.421-424.

11.
이수현, "빅 데이터의 군집분석을 위한 군집화 유효성 지수 개발과 응용", 전남대학교 일반대학원, 박사학위논문(2015).

12.
이준호, 박광호, "군집분석을 통한 중소기업 온라인 마케팅 지원 수혜기업의 세분화 전략에 관한 연구", e-비지니스연구, 제13권, 제4호(2012), pp.169-194.

13.
전현치, 신영근, 박상성, 김명훈, 장동식, "신경망기법을 이용한 온라인 서점 이용자들의 고객유형 분석", 환경콘텐츠학회논문지, 제7권, 제9호(2007), pp.127-138.

14.
전치혁, 데이터마이닝 기법과 응용, 서울:한나래, 2012.

15.
정윤경, 백장선, "고차원(유전자 발현) 자료에 대한 군집 타당성분석 기법의 성능 비교", 응용통계연구, 제20권, 제1호(2007), pp.167-181.

16.
조재희, 조성배, 이성임, 신현정, 김성범 공역, 비지니스 인텔리전스를 위한 데이터 마이닝, 서울:이앤비플러스, 2판, 2012.

17.
황인수, "데이터 마이닝에서 그룹 세분화를 위한 2단계 계층적 클러스터링 알고리듬", 경영과학, 제19권, 제1호(2002), pp.189-196.

18.
Arbelaitz, O., I. Gurrutxaga, J. Muguerza, J.M. Perez, and I. Perona, "An extensive comparative study of cluster validity indices," Pattern Recognition, Vol.46, No.1(2013), pp.243-256. crossref(new window)

19.
Bezdek, J.C., "Pattern Recognition with Fuzzy Objective Function Algorithm," Plenum Press, Vol.13(1981), pp.367-373.

20.
Calinski, R.B. and J. Harabasz, "A Dendrite Method for Cluster Analysis," Communications in Statistics, Vol.3, No.1(1974), pp.1-27. crossref(new window)

21.
Davies, D. and D. Bouldin, "A Cluster Separation Measure," IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1, No.2(1979), pp.224-227. crossref(new window)

22.
Dunn, J.C., "Well Separated Clusters and Optimal Fuzzy Partitions," Journal of Cybernetics, Vol.4, No.1(1974), pp.95-104. crossref(new window)

23.
Halkidi, M., Y. Batistakis, M. Vazirgiannis, "On Clustering Validation Techniques," Journal of Intelligent Information Systems, Vol.17, No.2-3(2001), pp.107-145. crossref(new window)

24.
Hruschka, E.R., R.G.B. Campello, A.A. Freitas, and A.P.L. Carvalho, "A Survey of Evolutionary Algorithms for Clustering," IEEE Transactions on Systems, Man, and Cybernetics-Part C : Applications and Reviews, Vol.39, No.2(2009), pp.133-155.

25.
Liu, Y., Z. Li, H. Xiong, X. Gao, J. Wu, and S. Wu, "Understanding and Enhancement of Internal Clustering Validation Measures," IEEE Transactions on Cybernetics, Vol.43, No.3(2013), pp.982-994. crossref(new window)

26.
MacQueen, J.B., "Some Methods for classification and Analysis of Multivariate Observations," Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, (1967), pp.281-297.

27.
Maulik, U. and S. Bandyopadhyay, "Performance Evaluation of Some Clustering Algorithms and Validity Indices," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.24, No.12(2002), pp.1650-1654. crossref(new window)

28.
Saitta, S., B. Raphael, and I.F.C. Smith, "A Comprehensive Validity Index for Clustering," Intelligent Data Analysis, Vol.12, No.6(2008), pp.529-548.

29.
Shim, Y., J. Chung, and I.-C. Choi, "A Comparison Study of Cluster Validity Indices Using a Nonhierarchical Clustering Algorithm," Proceedings of the International Conference on Computational Intelligence for Modeling, Control and Automation, and International Conference Intelligent Agents, Web Technologies and Internet Commerce, (2005), pp.199-204.

30.
Tax, D.M.J. and R.P.W. Duin, "Support Vector Data Description," Machine Learning, Vol.54 (2004), pp.45-66. crossref(new window)

31.
Tay, F.E.H. and L.J. Cao, "Modified support vector machines in financial time series forecasting," Neurocomputing, Vol.48, No.1-4(2006), pp.847-861.

32.
Theodoridis, S. and K. Koutroumbas, Pattern Recognition, Academic Press, 2006.

33.
Tou, J.T. and R.C. Gonzalez, Pattern Recognition Principles, Addison-Wesley, 1974.

34.
Vapnik, V., Estimation of Dependences Based on Empirical Data[in Russian, Nauka, 1979.

35.
Xu, R. and D.II. Wunsch, "Survey of Clustering Algorithms," IEEE Transactions on Neural Networks, Vol.16, No.3(2005), pp.645-678. crossref(new window)