DOI QR코드

DOI QR Code

그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현

Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System

  • 김동욱 (한국생명공학연구원 유전체자원센터) ;
  • 최한석 (목포대학교 멀티미디어학과)
  • 투고 : 2010.04.07
  • 심사 : 2010.04.26
  • 발행 : 2010.07.28

초록

본 논문에서는 현재 생물정보학 연구에서 가장 많이 사용하고 있는 BLAST의 문제점을 분석하고 이에 따른 해결책을 제시하기 위하여 그리드 컴퓨팅을 이용한 G-BLAST(Grid Computing을 이용한 Basic Local Alignment Search Tool)를 제안한다. 본 연구에서 제안하고 있는 G-BLAST을 이용한 시스템은 이기종 분산 환경에서 수행이 가능한 서열분석 통합 소프트웨어 패키지이며 기존 서열분석 서비스의 취약점인 검색 성능을 개선하여 BLAST 검색 기능을 강화 하였다. 또한, BLAST 결과를 사용자가 관리 및 분석이 용이하도록 데이터베이스 및 유전체 서열분석 서비스 시스템을 구현하였다. 본 논문에서는 G-BLAST시스템의 성능확인을 위하여 병렬컴퓨팅 성능테스트 기법을 도입하여 구현된 시스템을 기존 BLAST와 속도 및 효율부분에서 비교하여 성능개선을 확인하였으며 서열결과 분석에 필요한 자료를 사용자관점에서 제공해주고 있다.

This paper proposes a G-BLAST(BLAST using Grid Computing) system, an integrated software package for BLAST searches operated in heterogeneous distributed environment. G-BLAST employed 'database splicing' method to improve the performance of BLAST searches using exists computing resources. G-BLAST is a basic local alignment search tool of DNA Sequence using grid computing in heterogeneous distributed environment. The G-BLAST improved the existing BLAST search performance in gene sequence analysis. Also G-BLAST implemented the pipeline and data management method for users to easily manage and analyze the BLAST search results. The proposed G-BLAST system has been confirmed the speed and efficiency of BLAST search performance in heterogeneous distributed computing.

키워드

참고문헌

  1. S. F. Altschul, W. Gish, W. Miller, E. W. Myers, and D. J. Lipman, "Basic Local Alignment Search Tool", Journal of Molecular Biology, Vol.215, No.3, pp.403-410, 1990. https://doi.org/10.1016/S0022-2836(05)80360-2
  2. Cincia gibus and Per Jambeck, Developing bioinformatics computer skills, O'Reilly Media, 2002.
  3. http://www.ncbi.nlm.nih.gov
  4. Anne Julich, "Implementations BLAST for Parallel Computers," CABIOS, Vol.11, No.14, pp.3-6, 1995.
  5. A.E.Darling, Lucas Carey and Wu-chun Feng, "The Design, Implementation and Evaluation of mpiBLAST," ClusterWorld 2003 conference, 2003.
  6. Vincent Breton, Eddy Caron, Frederic Desprez and Gael Le Mahec, "BLAST Application with Data-Aware Desktop Grid Middleware," 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid, 2009. https://doi.org/10.1109/CCGRID.2009.91
  7. Enis Afgan and Purushotham Bangalore, "Dynamic BLAST – a Grid Enabled BLAST," IJCSNS International Journal of Computer Science and Network Security, Vol.9, No.4, 2009.
  8. David R. Mathog, "Parallel BLAST on split databases," BIOINFORMATICS APPLICATIONS NOTE, Vol.19, No.14, pp.1865-1866, 2003. https://doi.org/10.1093/bioinformatics/btg250
  9. A.E.Darling, Lucas Carey and Wu-chun Feng, "The Design, Implementation and Evaluation of mpiBLAST," ClusterWorld 2003 conference, 2003.
  10. 김태경, 조완섭, “고성능 BLAST 구현을 위한 E-Cluster 기반 데이터 분할 및 질의 라우팅 기법“, 한국컴퓨터정보학회논문지, 제14권, 제2호, pp.139-147, 2009.
  11. http://www.mysql.org
  12. T. H. Lee, Y. K. Kim, and Baek Hie Nahm, "GBParsy: A GenBank flatfile parser library with high speed," BMC Bioinformatics, Vol.9, No.321, pp.1-6, 2008. https://doi.org/10.1186/1471-2105-9-1
  13. 공재근, 좌용권, 박정선, 유선주, 이문상, "효율적인 생물정보 서열검색을 위한 PC-클러스터 시스템의 구현", 한국정보과학회 제31회 춘계학술발표회, 2004.