A novel approach for analysis of LC/MS data - Peak Clustering and Fitting

LC/MS 데이터 분석의 새로운 접근 방법 - 피크 군집화와 조정

  • Han, Joon-Hee (Department of Computer Science and Engineering, POSTECH) ;
  • Lee, Byung-Hwa (Department of Computer Science and Engineering, POSTECH)
  • Published : 2004.11.04

Abstract

LC/MS를 이용하여 펩타이드 혹은 단백질 같은 물질을 분석하는 실험이 급격히 늘어남에 따라 LC/MS 데이터를 자동으로 처리하는 기술에 대한 요구가 커지고 있다. 이러한 LC/MS 데이터의 자동 분석 기술에 대한 연구는 현재 활발히 진행되어 왔고, 이를 직접 구현한 여러 상용 소프트웨어들이 개발되어 있는 상태이다. LC/MS 데이터는 noise 제거, background 데이터 제거, deconvolution 알고리즘을 적용한 분자량(molecular weight) 할당 등의 작업을 거쳐 분석하게 된다. 이러한 과정을 거쳐 얻어진 분자량에 대한 데이터가 올바른 값인지 검증하는 작업이 필요하다. 본 논문에서는 이러한 검증 작업과 관련하여 Peak Clustering and Fitting(이하 PC&F)에 대한 알고리즘을 제안한다. PC&F은 peak 데이터들이 지니고 있는 속성에 대한 Mahalanobis distance를 이용하여 peak 데이터를 각 retention time에 따라 clustering 분석을 하는 작업이다. 본 논문에서 제안하는 PC&F 알고리즘을 Microsoft Visual C++ 6.0 MFC 환경에서 직접 개발한 소프트웨어(PeakClusterFitLCMS)로 실험하였다. 실험결과 PC&F 작업을 통해 동일한 구성물질로부터 발생한 peak 데이터를 모아서 보다 신뢰할 수 있는 분자량을 구할 수 있었고, 구성물질에 의해 발생되지 않은 noise peak 데이터를 찾아 제거시킬 수 있음을 확인할 수 있었다.

Keywords