DOI QR코드

DOI QR Code

The Design and Implement of Microarry Data Classification Model for Tumor Classification

종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현

  • 박수영 (조선대학교 컴퓨터통계학과) ;
  • 정채영 (조선대학교 컴퓨터통계학과)
  • Published : 2007.10.31

Abstract

Nowadays, a lot of related data obtained from these research could be given a new present meaning to accomplish the original purpose of the whole research as a human project. The method of tumor classification based on microarray could contribute to being accurate tumor classification by finding differently expressing gene pattern statistically according to a tumor type. Therefore, the process to select a closely related informative gene with a particular tumor classification to classify tumor using present microarray technology with effect is essential. In this thesis, we used cDNA microarrays of 3840 genes obtained from neuronal differentiation experiment of cortical stem cells on white mouse with cancer, constructed accurate tumor classification model by extracting informative gene list through normalization separately and then did performance estimation by analyzing and comparing each of the experiment results. Result classifying Multi-Perceptron classifier for selected genes using Pearson correlation coefficient represented the accuracy of 95.6%.

오늘날 인간 프로젝트와 같은 종합적 인 연구의 궁극적 목적을 달성하기 위해서는 이 들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 마이크로어레이를 기반으로 하는 종양 분류 방법은 종양 종류에 따라 다르게 발현되는 유전자 양상을 통계적으로 발견함으로써 정확한 종양 분류에 기여 할 수 있다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 정보력 있는 유전자 목록을 별도로 추출하여 보다 정확한 종양 분류 모델을 구축하고 각각의 실험 결과들을 비교 분석함으로써 성능평가를 하였다. 피어슨 적률 상관 계수를 이용하여 선택된 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 98.6%의 정확도를 보였다.

Keywords

References

  1. M. Brown, W. Grundy, D. Lin, N. Christianini, C. Sugnet, M. Ares Jr., and D. Haussler, 'Support vector machine classification of microarray gene expression data', UCSC-CRL 99-09, Department of Computer Science, University California Santa Cruz, Santa Cruz, CA, June, 1999
  2. S. Dudoit, J. Fridlyand, and T. P. Speed, 'Comparison of discrimination methods for the classification of tumors using gene expression data', Journal of the American Statistical Association, vol. 97, pp. 77-87, 2002 https://doi.org/10.1198/016214502753479248
  3. Dov Stekel, Mieroarray Bioinformatics, Cambridge Uiversity Press, 2003
  4. Golub, T.R., Slonim, D.K, Tamayo, P., Huard, D., Gaasenbeek, M., Mesirov, J.P., Collrt, H, Loh, ML., Downing, J.R, Caligiuri, M.A., Bloomfield, D.D., and Lander, E.S., 'Molecular classification of cancer: class discovery and class prediction by gene expression monitoring', Science, vol. 286, no. 5439, pp. 531-537, 1999 https://doi.org/10.1126/science.286.5439.531
  5. Evertsz, E., Starink, P., Gupta, R, and Watson, D., 'Technology and application of gene expression microarraysaa', Schena, M.(ed.), Microarray Biochip Technology, Eaton Publishing, MA, pp. 149-166, 2000