Codon usage analysis of rice glutelin genes

쌀 저장 단백질 글루텔린 유전자 암호 분석

  • Published : 1993.12.31

Abstract

To characterize glutelins, the most abundant storage protein in rice, 13 complete coding sequences of glutelin genes from the database were analyzed. According to the phylogenic analysis, these genes could be classified into 5 groups, Group I to V. The degrees of homology were calculated to be in the range of 90 to 60%, but the patterns of hydrophobicity were similar in all the groups. Also, each group was found to have similar amino acid composition with variations in lysine content from 2.5 to 3.6% due to the point mutation of arginine to lysine. The isoelectric points of mature proteins and their basic chains of all the groups showed the value of about 9.0 and 10.0, respectively, while the isoelectric points of acidic chains in these groups showed the distinct value of 6.6, 6.7, 7.2, 8.4 and 7.9. The plot of the fraction of G+C at synonimous site in codons (GC3s) against effective codon numbers suggest no major difference in translational efficiency in the expression of glutelin multigenes.

글루텔린은 쌀 종자단백질의 80% 수준에 이르는 산 또는 알칼리에 용해되는 가장 중요한 저장 단백질로, 분자량은 54 kDa 내외이며 22 kDa의 산성사슬과 32kd의 염기성사슬로 구성되어 있다. 지금까지 보고된 13개의 글루텔린 유전자의 염기서열로부터 유추된 단백질 서열의 다중분석에 의하여 계통발생적으로 1군에서 5군까지 5개군으로 나눌 수 있다. 각 군 상호유전자간의 염기서열과 아미노산서열의 유사성은 60%에서 90%에 이르어 이들 각 군은 매우 유사한 아미노산 조성을 보여주고 있다. 그러나 lysine 함량에 있어서는 2.5%에서 3.6%로 약간의 변화를 보여주고 있는데, 이는 argnine이 point mutation에 의하여 lysine으로 변화된 결과임을 알 수 있었다. 각 군에서의 성숙단백질과 염기성 사슬의 등전점은 각각 9.0, 10.0 내외로 매우 유사한 반면, 산성사슬은 각각 6.6, 6.7, 7.2, 8.4, 7.9의 독특한 값을 가지고 있다. 아울러 유전자 암호에서 세번째 염기가 G와 C로 끝나는 암호의 비율(fraction of G+C at synonimous site in codons: GC3s)과 유효 암호수(effective codon number, Nc), 우선 암호수(Preferred codon number)의 분석과 상관그래프는 글루텔린 유전자들의 전이효율의 차이는 거의 없어 유사한 수준으로 발현될 가능성을 제시하고 있다.

Keywords