Speaker Identification with Estimating the Number of Cluster Based on Boundary Subtractive Clustering

경계 차감 클러스터링에 기반한 클러스터 개수 추정 화자식별

  • 이윤정 (국방과학연구소) ;
  • 최민정 ((주)인스모바일 기술연구소) ;
  • 서창우 ((주)에스씨디정보통신연구소) ;
  • 한헌수 (숭실대학교 정보통신전자공학부)
  • Published : 2007.07.31

Abstract

In this paper we propose a new clustering algorithm that performs clustering the feature vectors for the speaker identification. Unlike typical clustering approaches, the proposed method performs the clustering without the initial guesses of locations of the cluster centers and a priori information about the number of clusters. Cluster centers are obtained incrementally by adding one cluster center at a time through the boundary subtractive clustering algorithm. The number of clusters is obtained from investigating the mutual relationship between clusters. The experimental results for artificial datum and TIMIT DB show the effectiveness of the proposed algorithm as compared with the conventional methods.

본 논문에서는 화자식별을 위한 특징벡터의 새로운 클러스터링 방법을 제안한다. 제안된 방법은 클러스터 센터에 대한 초기값 설정과 클러스터 개수에 대한 사전 정보 없이 클러스터링이 가능하다. 각 클러스터 센터는 경계 차감 클러스터링 알고리즘으로 한 번에 한 개의 클러스터 센터가 추가됨으로써 순차적으로 구해지며, 클러스터 개수는 클러스터간의 상호관계를 조사하여 결정된다. 인공 생성 데이터 및 TIMIT 음성을 이용하여 실험한 결과로부터 제안된 방법이 기존의 방법보다 우수함을 확인하였다.

Keywords

References

  1. Lozano, J.A, Pena, J.M., and Larranaga, P., 'An empirical comparison of four initialization methods for the k-means algorithm,' Pattern Recognition Letters, 20 1027-1040, 1999 https://doi.org/10.1016/S0167-8655(99)00069-0
  2. Gath and Geva, A.B., 'Unsupervised optimal fuzzy clustering,' IEEE Trans. Pattern and Machine Intelligence, 11 (7) 773-778, 1989 https://doi.org/10.1109/34.192473
  3. Ryager, R., Filev, D.P., 'Approximate clustering via the mountain method,' IEEE Trans on Systems, Man, and Cybernetics, 24, 1279-1284, 1994 https://doi.org/10.1109/21.299710
  4. Zadeh, L.A, 'Similarity Relations and fuzzy Orderings,' Information Science 3, 177-200, 1971 https://doi.org/10.1016/S0020-0255(71)80005-1
  5. Likas, A, Vlassis, N. and Verbeek, J.J., 'The global k-means clustering algorithm,' Pattern recognition 36, 451-461, 2003 https://doi.org/10.1016/S0031-3203(02)00060-2
  6. Chiu, S.L., 'Fuzzy model identification based on cluster estimation,' J. of Intelligent and Fuzzy sys., 2 (3), 267-278, 1994
  7. Kothari, R., Pittas, D., 'On finding the number of clusters,' Pattern Recognition Letters 20, 405-416, 1999 https://doi.org/10.1016/S0167-8655(99)00008-2
  8. Yang, Z. R. and Zwaliuski, M., 'Mutual information theory for adaptive mixture model,' IEEE Trans. Pattern and Machine Intelligence, 23 (4) 396-403, 2001 https://doi.org/10.1109/34.917574
  9. Lee, Y., Lee, J. and Lee, K.Y, 'The Estimating Optimal Number of Gaussian Mixtures Based on Incremental k-means for Speaker Identification,' International Journal of Information Technology, 12 (7) 2006
  10. 이윤정, 서창우, 한헌수, 이기용, 'GMM을 위한 점진적 K-means 알고리즘에 의해 초기값을 갖는 EM알고리즘과 화지식별에의 적용,' 한국음향학회지, 24 (3) 117-126, 2005