Two Class Approximation of TLB (Tomato Late Blight) Activity Data

토마토 역병균 항균 활성 데이터의 이분번 근사모델링

  • Hahn, Hoh-Gyu (Life Science Division, Korea Institute of Science and Technology) ;
  • M.D., Ashek Ali (Life Science Division, Korea Institute of Science and Technology) ;
  • Cho, Seung-Joo (Life Science Division, Korea Institute of Science and Technology)
  • Published : 2005.06.30

Abstract

Quantitative Structure Activity Relationship (QSAR) assumes the relatedness between physical property and biological activity. However, activity data measured at single concentration such as percent activity have not been used extensively for modeling purpose. This probably comes from the fact that these values are qualitative instead of quantitative. To utilize percent activity data for molecular modeling, we classified the whole data into two classes. One class represents the active while the other signifies the inactive. The percent activity data of ${\beta}$-Ketoacetoanilides measured for TLB (Tomato Late Blight) were investigated. CoMFA (Comparative Molecular Field Analysis) was used as a discriminant function. Using CoMFA provides 3D (three dimensional) information, which is crucial for chemical insight. It can also serve as a predictive model. The resultant model classified the given data correctly (98%). When LOO (leave-one-out) crossvalidation procedure was applied, the classification accuracy was 69%. Therefore two class approximation of percent activity data with CoMFA can be utilized to understand the relationship between chemical structure and biological activity and design subsequent chemical analogs.

정량적 구조 활성관계 모델링은 물리적인 성질과 생물학적 활성이 관계 있다는 것을 전제로 한다. 그러나, 퍼센트 활성과 같은 데이터들은 모델링에 많이 활용되지 않았다. 이것의 중요한 이유중의 하나는 이러한 값들이 정량적이 아니고 정성적인 데에 있다. 본 연구에서는 분자모델링에 퍼센트활성 데이터를 활용하기 위하여 데이터 값들을 2개의 계층으로 분류하고 CoMFA(비교분자장)를 판별함수로 활용하였다. 즉, 베타-케토아세트아닐라이드 유도체들의 토마토 역병균에 대한 항균력 시험의 퍼센트 활성 데이터를, 한 계층은 활성이 있는 것, 다른 계층은 활성이 없는 것으로 나누었다. 특히, CoMFA를 활용함으로써 화학적인 이해에 중요한 3차원적인 정보를 얻을 수 있었다. 이 모델은 주어진 데이타를 98%의 정확도로 설명하였으며, LOO 검증을 해본 결과 예측력은 약 69% 정도였다 이 결과는 활성 데이터를 근사적으로 2개의 계급으로 나누고 CoMFA를 활용하는 방식이 구조활성관계를 이해하고 화합물 유도체를 합성하는데 활용될 수 있음을 보여준다.

References

  1. Leach, A. R. (2001) The Use of Molecular Modeling and chemoinformatics to Discover and Design New Molecules. pp.640-726, Molecular Modeling Addison Longman Limited
  2. Cramer, R. D., D. E. Petterson and J. D. Bunce (1988) Comparative Molecular Field Analysis (CoMPA). J. Effect of Shape on Binding of Steroids to Carrier Proteins J. Am. Chem. Soc. 110:5959-5967
  3. Fienberg, S. E. (1985) Inference for Contingency Table pp 70-114 The Analysis of Cross-Classified Categorical Data MIT press
  4. Hahn, H. -G., K. D. Nam, S. Bae, B. S. Yang, S. -W. Lee and K. Y. Cho (2004) Synthesis of combinatorial library of b-ketoacetoanilide chlorides and their antifungal activity against main plant pathogens Korean J. of Pesticide Sci. 8(1):8-15