DOI QR코드

DOI QR Code

The System Of Microarray Data Classification Using Significant Gene Combination Method based on Neural Network.

신경망 기반의 유전자조합을 이용한 마이크로어레이 데이터 분류 시스템

  • 박수영 (조선대학교 컴퓨터통계학과) ;
  • 정채영 (조선대학교 컴퓨터통계학과)
  • Published : 2008.07.30

Abstract

As development in technology of bioinformatics recently mates it possible to operate micro-level experiments, we can observe the expression pattern of total genome through on chip and analyze the interactions of thousands of genes at the same time. In this thesis, we used CDNA microarrays of 3840 genes obtained from neuronal differentiation experiment of cortical stem cells on white mouse with cancer. It analyzed and compared performance of each of the experiment result using existing DT, NB, SVM and multi-perceptron neural network classifier combined the similar scale combination method after constructing class classification model by extracting significant gene list with a similar scale combination method proposed in this paper through normalization. Result classifying in Multi-Perceptron neural network classifier for selected 200 genes using combination of PC(Pearson correlation coefficient) and ED(Euclidean distance coefficient) represented the accuracy of 98.84%, which show that it improve classification performance than case to experiment using other classifier.

최근 생명 정보학 기술의 발달로 마이크로 단위의 실험조작이 가능해짐에 따라 하나의 chip상에서 전체 genome의 expression pattern을 관찰할 수 있게 되었고, 동시에 수 만개의 유전자들 간치 상호작용도 연구 가능하게 되었다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 본 논문에서 제안한 유사성 척도 조합 방법으로 정보력 있는 유전자들을 추출한 후, 유사성 척도 조합 방법과 결합한 멀티퍼셉트론 신경망 분류기와 기존의 DT, NB, SVM 분류기를 이용하여 클래스 분류 시스템을 구축하고, 성능을 비교분석하였다. 피어슨 적률 상관 계수와 유클리디안 거리 계수 조합을 이용하여 선택된 200 유전사들을 멀티퍼셉트론 신경망 분류기로 분류한 결과 98.84%의 정확도를 보여 다른 분류기를 이용하여 실험을 수행한 경우보다 향상된 분류 성능을 보였다.

Keywords

References

  1. M. Brown, W. Grundy, D. Lin, N. Christianini, C. Sugnet, M. Ares Jr., and D. Haussler, "Support vector machine classification of microarray gene expression data", UCSC-CRL 99-09, Department of Computer Science, University California Santa Cruz, Santa Cruz, CA, June, 1999
  2. S. Dudoit, J. Fridlyand, and T. P. Speed, "Comparison of discrimination methods for the classification of tumors using gene expression data", Journal of the American Statistical Association, vol. 97, pp. 77-87, 2002 https://doi.org/10.1198/016214502753479248
  3. Dov Stekel, Microarray Bioinformatics, Cambridge University Press, 2003
  4. Golub, T.R., Slonim, D.K, Tamayo, P., Huard, D., Gaasenbeek, M., Mesirov, J.P., Collrt, H., Loh, M.L.Downing, J.R, Caligiuri, M.A., Bloomfield, D.D., and Lander, E.S., "Molecular classification of cancer: class discovery and class prediction by gene expression monitoring", Science, vol. 286, no. 5439, pp. 531-537, 1999 https://doi.org/10.1126/science.286.5439.531
  5. Evertsz, E., Starink, P., Gupta, R., and Watson, D., "Technology and application of gene expression microarraysaa", Schena, M.(ed.), Microarray Biochip Technology, Eaton Publishing, MA, pp. 149-166, 2000
  6. Martin T. Hagan, Howard B. Demuth, and Mark Beale, "Neural network design", PWS Publishing Company, 1996