Development and Performance Evaluation of Parallel Sequence Analysis System on PC-Cluster

PC-Cluster 기반 병렬형 유전자 서열 검색 시스템의 개발 및 성능 평가

  • Shin Yong-Won (Dept. of Health Management, Catholic University of Pusan) ;
  • Park Jeong-Seon (Dept. of Medical Device and Informatics, Korea Health Industry Development Institute)
  • 신용원 (부산가톨릭대학교 병원경영학과) ;
  • 박정선 (한국보건산업진흥원 의료기기ㆍ정보단)
  • Published : 2004.12.01

Abstract

In recent, researchers in the field of Bioinformatics need to analyze thousands of genome sequences efficiently according to introduce of new analysis methods and technologies such as genome expression microchip. This rapid growth in the field of bio-engineering needs computing resources to analyze rapidly for genome sequences, but it does not introduce the computing resources due to an enormous investment expense. The core factor of this study is integrated environment based PC-Cluster system & high speed access rate up to 155Mbps, continuous collection system for bio-information at home and abroad. The results of the study are establishment & stabilization of information and communication infrastructure, establishment & stabilization of high performance computer network up to 155Mbps, development of PC-Cluster system with 32 nodes, a parallel BLAST on Cluster system, which can provides scalable speedup in terms of response time, and development of collection & search system for bio-information.

최근 들어 유전자 서열의 생산량 증가에 비례하여 유전자 발현 마이크로 칩과 같은 새로운 분석방법과 기술들이 도입되면서 연구자들이 매일 수천개의 서열을 효율적으로 분석해야 할 필요성이 증대되고 있다. 이러한 생명공학분야의 급속한 발전은 대용량 유전자 서열에 대한 빠른 분석이 가능한 컴퓨팅 자원을 요구하고 있으나 IT 인프라에 대한 막대한 투자비용으로 인해 관련 연구기관에서 쉽게 이들 컴퓨팅 자원을 도입하지 못하고 있는 실정이다. 본 연구에서는 저가의 PC서버를 고속의 네트워크로 연결한 PC 클러스터를 활용하여 시스템의 안정성과 신뢰성을 보장함과 동시에 범용성을 지닌 병렬형 유전자 서열 검색 시스템을 구축하였다. 이러한 효율적인 시스템 구축을 통해 생물정보 데이터베이스 및 서열 검색 시스템을 제공하고, 대용량 서열 데이터베이스의 검색 시간을 단축하였다.

Keywords

References

  1. http://www.top500.org
  2. http://www.ncbi.nlm.nih.gov/BLAST/
  3. http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html
  4. R.C. Braun, K.T.Pedretti, T.L.Casavant, T.E.5cheetz, C.L.Bitkett, C.A. Roberts, 'Parallelization of local BLAST service on workstations clusters', FGCS, Vol.17, pp. 745-754, 2001
  5. Hong Soog Kim, 'Hyper-BLAST:A Parallelized BLAST on Cluster Systems', School of Engineering Information and Communication University, pp. 15-16, 2003
  6. David R.Mathog, 'Parallel BLAST on split databases', Bioinformatics, Vol.19, No.14, pp.1865-1866, 2003 https://doi.org/10.1093/bioinformatics/btg250
  7. Anne Julich, 'Implementations BLAST for Parallel Computers', CABIOS, Vol.11, No.1, pp.3-6, 1995
  8. A.E.Darling, Lucas Carey, Wu-chun Feng, 'The Design, Implementation and Evaluation of mpiBLAST', ClusterWorld 2003 conference, 2003
  9. http://www.epowergate.co.kr/biz/clu_ezcon.html
  10. http://www.altair.com/software/pbspro.htm
  11. http://www.biohealthinfo.org/