杜梨叶绿体基因组密码子偏好性分析

更新时间:2023-06-19 10:11:42 阅读: 评论:0

第43卷第6期2020年11月
河北农业大学学报
JOURNAL OF HEBEI AGRICULTURAL UNIVERSITY
Vol.43 No.6
Nov.2020杜梨叶绿体基因组密码子偏好性分析
辛雅萱,董章宏,瞿绍宏,刘 成,叶 鹏,辛培尧
( 西南林业大学 西南山地森林资源保育与利用教育部重点实验室/ 西南地区生物多样性
保育国家林业和草原局重点实验室,云南 昆明 650224)
摘要:为了明确杜梨叶绿体基因组密码子的使用偏性,以杜梨叶绿体基因组中的37条蛋白质编码序列为研究对
象,利用Codon W 1.4.2和在线软件CUSP等对其密码子进行了中性绘图分析、ENC-plot和PR2-plot分析。结
果表明:(1)杜梨叶绿体基因组密码子不同位置GC碱基含量为:GC1(48.45%)>GC2(40.76%)>GC3(28.66%),
说明密码子末位碱基偏好以A/U结尾;(2)有效密码子数(ENC)取值范围是33.13~52.73,表明密码子偏
性较弱;(3)相对同义密码子(RSCU)分析表明,其值>1的密码子有30个,其中以A、U结尾的有29个;
(4)GC3和GC12无显著相关,相关系数和回归系数分别为-0.1434和0.2072; ENC-plot中大部分基因分布
于曲线周围和下方,ENC比值分布在-0.05~0.05区间的有14个,说明密码子偏性主要受选择的影响;PR2-
plot分析中,T的使用频率高于A,G的使用频率高于C,说明密码子偏性受多重因素影响;(5)最终筛选出
UUU、UAA、AUU等18个密码子为最优密码子,多以A或U结尾。综上所述,杜梨叶绿体基因组密码子的
使用主要受选择影响,研究结果可为杜梨乃至梨属植物叶绿体基因组学的研究提供理论依据。
关 键 词:杜梨;叶绿体基因组;密码子偏好性;最优密码子
中图分类号:S661.1开放科学(资源服务)标识码(OSID):
文献标志码:A
Analysis on codon usage bias of chloroplast genome in Pyrus betulifolia Bge.
XIN Yaxuan, DONG Zhanghong, QU Shaohong, LIU Cheng, YE Peng, XIN Peiyao
(1. Key Laboratory of Forest Resources Conrvation and Utilization in the Southwest Mountains of Ministry of
Education / Key Laboratory of National Forestry and Grassland Administration on Biodiversity Conrvation in
Southwest China, Southwest Forestry University, Kunming 650224, China)
Abstract: In order to realize the usage bias of codons in Pyrus betulifolia chloroplast genome, 37 CD
S of P.
betulifolia chloroplast genome were ud as the rearch object, and the codons were analyzed by neutral plotting,
ENC-plot and PR2-plot using Codon W 1.4.2 and online software CUSP. The results showed that: (1) the GC content
at different locations of the codons in the chloroplast genome of P. betulifolia were GC1 (48.45%)>GC2 (40.76%)
>GC3 (28.66%), indicating that the codon terminal ba preferred to end with A/U. (2) The value range of the
部门英文
effective codon number (ENC) was 33.13-52.73, indicating weak codon bias. (3) Relative synonymous codon (RSCU)
analysis showed that there were 30 codons with the RSCU value>1, and 29 codons ending with A and U. (4) There
was no significant correlation between GC3 and GC12, and the correlation coefficient and regression coefficient was
收稿日期:2020-04-01
基金项目:国家重点研发计划子课题项目(2017YFD060120204);云南省科技厅科技计划项目(2018BB005).
第一作者:辛雅萱(1996-),女,甘肃临洮人,硕士研究生,主要从事林木遗传育种及繁育研究.E-mail:****************通信作者:辛培尧(1975-),男,云南昆明人,博士,教授,主要从事林木遗传育种与良种繁育研究.E-mail:***************本刊网址:http: // hauxb. hebau. edu. cn: 8080 /CN/ volumn / home. shtml
文章编号:1000-1573(2020)06-0051-09DOI:10.13320/jki.jauh.2020.0112
52第43卷
河北农业大学学报
会计专业考研
-0.1434 and 0.2072, respectively. Most of the genes in ENC-plot were distributed around and below t
he curve, and 14 ENC ratios were distributed between -0.05 and 0.05, indicating that codon bias was mainly affected by lection. In PR2-plot analysis, the usage frequency of T was higher than that of A, and G was higher than C,so the preference of P. betulifolia chloroplast genome codon was affected by multiple factors. (5) Finally, 18 codons such as UUU, UAA and AUU were lected as the optimal codons, most of which ended with A or U. In conclusion, the u of codons in chloroplast genomics of P. betulifolia is mainly influenced by lection. The theoretical basis is provided by this study for the rearch of chloroplast genomics of P. betulifolia and even Pyrus genus plants.
Keywords:Pyrus betulifolia Bge.; chloroplast genome; codon bias; optimal codons
密码子(Codon)又称遗传密码,在生物体遗传信息传递的过程中作为联结核酸和蛋白质的纽带,扮演着重要的角色,其偏好性作为基因和基因组的一个静态特征,是生物在长期演化过程中适应和选择的结果[1]。其中,同义密码子虽然编码相同的氨基酸,但其使用频率并不相同。大量研究表明,在蛋白质编码过程中,某一物种或某一基因往往倾向于使用一种或几种特定的密码子,该现象称为密码子的使用偏性(Codon usage bias)[2]。这种现象的产生可能与基因的表达水平[3]、基因的碱基组成[4]、翻译起始效应[5]和基因的长度[6]等因素有关。密码子使用模式会影响基因的功能与表达,且基因的表达量越大,其密码子偏好性就越强[7]。
叶绿体是地球上绿色植物体中把光能转化为化学能的重要细胞器。叶绿体基因组是一个裸露的环状双螺旋分子,有一套完整的复制、转录和翻译系统。叶绿体基因组分子量小、多拷贝,结构和基因种类一般较为保守,这些有利于对叶绿体基因组进行分析,现已被广泛用于分子进化、系统发育和遗传表达等领域[8]。近年来,对叶绿体基因组密码子使用模式的研究,已在竹亚科(Bambusoideae)[9]、铁核桃(Juglans sigillata Dode)[10]、巨桉(Eucalyptus grandis)[11]等多种植物中开展。
杜梨(Pyrus betulifolia Bge.)为蔷薇科(Rosaceae)梨属(Pyrus)落叶乔木,别名棠梨、土梨、海棠梨等,在我国南北方各地均有种植。杜梨不仅是一种美味水果,而且其果实、枝、叶、根均可入药,用于治疗咳嗽、腹泻等[12]。目前,对杜梨的研究主要集中在其果实多糖的提取[13]、叶黄酮类化合物提取[12]以及对盐、碱胁迫的响应等方面[14],其叶绿体基因组的相关研究,仅见Dong等[15]对其叶绿体基因的基本结构进行了简要分析,而叶绿体密码子使用偏好性方面的研究还未见报到。通过分析杜梨叶绿体基因组密码子使用偏好性,确定其叶绿体基因组最优密码子,为杜梨乃至梨属植物叶绿体基因组学的研究提供理论依据。
1 材料与方法
1.1 材料
从瑞丽植物园,采集新鲜杜梨幼叶,将样品保存在干冰中,送至浙江优诺金生物工程有限公司进行叶绿体基因组的测序,其结果已提交至中国科学院西双版纳热带植物园综合保护中心樟科植物叶绿体基因组数据库(登录号:LAU10003),通过Geneious 8.1.3、BioEdit Sequence Alignment Editor、ORF bi.v/ orffinder/)等软件对杜梨叶绿体基因组进行分析,为了降低误差,研究时从88条CDS(coding DNA quence)中剔除序列长度小于300 bp、内部含有终止密码子的序列和重复基因,最终选取了37条以ATG为起始密码子,TAA、TGA、TAG为终止密码子的基因序列用作后续分析。
1.2 方法
1.2.1 密码子相关参数计算 运用Codon W 1.4.2软件分析符合条件的37条CDS,获得各CDS的有效密码子数(ENC,Effective number of codon)、同义密码子相对使用度(RSCU,relative synonymous codon usage);应用EMBOSS explorer中的CUSP 软件分析获得不同基因中各个密码子第1位、第2位、第3位碱基的GC含量(分别用GC1、GC2、GC3表示),以及该基因中GC碱基的含量(GC all),并利用SPSS软件对所得参数进行相关性分析。
1.2.2 中性绘图分析 中性绘图分析是用来初步判断密码子使用偏好性影响因素的方法之一[16]。若GC12和GC3显著相关,且回归系数接近于1,则说明密码子3个位置上的碱基组成相似,则密码子偏好性主要受突变影响;反之,说明密码子第1、2位与第3位碱基组成差异较大,基因组GC含量高度
dogfooding53第6期
保守,其偏好性受选择影响较大[17]。首先,根据已获得的GC1、GC2含量计算出GC12(GC1和GC2的平均值)的数值,再以GC12为纵坐标,GC3为横坐标作散点图,图中的1个点即代表1个基因的位置;通过分析第1、第2位碱基和第3位碱基组成的相关性,推测出其密码子偏好性的主要影响因素。
1.2.3 ENC-plot绘图分析 ENC-plot绘图分析是以GC3为横坐标,以ENC为纵坐标来构建二者之间的二维散点图,并在图中添加ENC的标准曲线,标准曲线公式为:ENC=2+GC3+29/[GC32+(1-GC3)2],它反映了密码子使用偏性和基因碱基组成之间的关系[18]。ENC的取值范围在20~61之间,越靠近20偏性越强,若每个密码子都被均匀使用,则值为61。此值是描述密码子使用偏离随机选择的程度,能反映密码子家族中同义密码子非均衡使用的偏好程度。一般以ENC值为35来区分密码子偏性强弱,当ENC值>35时表明其在编码氨基酸时密码子使用偏性较弱[19]。
1.2.4 PR2-plot分析 PR2分析(Parity rule 2)也叫偏倚分析,用于分析各密码子第3位碱基A、T 和G、C之间突变是否平衡,尤其是针对由4个同义密码子编码的氨基酸。以A3/(A3+T3)为纵坐标,G3/(G3+C3)为横坐标进行偏倚分析,图的中心点表示A=T且G=C(此时其密码子偏好性完全受突变的影响),其余的点由中心点向该点发出的矢量表示该基因的偏性方向和程度[20]。
中国职称英语考试网
1.2.5 最优密码子分析 鉴定杜梨叶绿体基因组中的最优密码子,需要结合其高频率和高表达密码子。选取RSCU值>1的为高频密码子;以37条CDS的ENC值为偏好性标准,由低到高对其进行排序,分别选出两端10%的基因(前后各4个基因),建立高低表达库[21],将ΔRSCU≥0.08(ΔRSCU=RSCU高表达-RSCU低表达)的密码子作为高表达密码子。最后将同时满足二者的密码子定义为杜梨叶绿体基因组的最优密码子[22]。
2 结果与分析
2.1 杜梨密码子碱基组成
利用Codon W 1.4.2和在线程序CUSP软件分析杜梨叶绿体基因组中符合条件的37条CDS序列,结果如表1所示。
辛雅萱,等:杜梨叶绿体基因组密码子偏好性分析
表1 杜梨叶绿体基因组密码子不同位置的GC含量及ENC值
Table 1GC content and ENC value of different positions of codon in chloroplast genome of P.betulifolia
四级作文题基因Genes GC1GC2GC3GC all ENC基因Genes GC1GC2GC3GC all ENC accD39.2335.3728.6634.4245.53psbB54.8146.3730.2643.8146.19 atpA54.5340.3525.9840.2946.91psbC53.6845.5930.1543.1446.22 atpB57.4042.8026.3742.1945.26psbD51.9843.2233.0542.7546.23 atpE50.7540.3029.1040.0550.28rbcL57.9843.4928.1543.2146.75 atpI49.1936.6927.8237.9048.24rpl1455.2838.2128.4640.6548.07 cemA37.8328.7030.8732.4648.51rpl1650.8354.1724.1743.0633.13 ndhC47.1133.8825.6235.5450.69rpl2037.2940.6824.5834.1845.02 ndhD41.0938.0428.4835.8746.95rpoB50.3338.0728.1638.8548.51 ndhE39.2234.3132.3535.2951.83rpoC244.9737.2228.6036.9350.39 ndhG43.5032.2028.8134.8449.80rps1151.8056.1224.4644.1249.35 ndhH51.0236.0428.6838.5850.15rps1443.5648.5132.6741.5839.26 ndhJ50.3138.3628.9339.2051.08rps244.3042.1928.6938.4050.28 ndhK47.9243.0625.6938.8949.53rps348.8632.8824.2035.3149.36 petA54.5236.1432.0940.9149.42rps451.9837.1328.2239.1149.98 petB49.0842.9432.5241.5146.49rps752.5644.8723.7240.3844.11 petD51.4338.5725.0038.3337.42rps841.5338.9820.3433.6240.71 psaA52.7343.4132.0942.7451.31
ycf241.6234.2036.5737.4652.73 psaB48.8442.9930.2040.6848.05ycf442.1641.0829.1937.4850.74 psbA49.7243.2231.3641.4341.36平均Average48.4540.7628.6638.8747.41注:GC all表示密码子各位置的平均数。
54第43卷
抄送格式河北农业大学学报
其中,有核糖体基因10个(rpl14、rpl16、rpl20、rps11、rps14、rps2、rps3、rps4、rps7、rps8),光合作用基因9个(petA、petB、petD、psaA、psaB、psbA、psbB、psbC、psbD)、7个基因(ndhC、ndhD、ndhE、ndhG、ndhH、ndhJ、ndhK)为烟碱脱氢酶基因、ATP基因4个(atpA、atpB、atpE、atpI)以及其他基因7个。所有CDS密码子的平均GC含量为38.87%,其中,第1位GC平均含量为48.45%,第2位GC平均含量为40.76%,第3位平均GC含量为28.66%,可见,GC含量在密码子的3个位置上并不是均匀分布的,且绝大多数CDS密码子第1位、第2位的GC含量明显高于第3位,可见杜梨叶绿体基因组密码子末位碱基偏好以A/ T(U)结尾。表1还显示,37个基因的ENC取值范围是33.13~52.73,平均为47.41,可以认为,杜梨叶绿体基因组密码子的偏性较弱。
杜梨叶绿体基因组密码子不同位置GC含量、ENC值和密码子数(N)之间的相关性分析如表2所示,GC all与GC1和GC2呈极显著相关,GC1和GC2呈显著相关,但GC3与GC1和GC2都未呈显著相关,
说明密码子第1、2位碱基组成相似,和第3位碱基存在较大差异。进一步比较发现,ENC与GC2极显著相关、与GC3显著相关,与GC1无相关性,说明密码子不同位置上的碱基组成会影响有效密码子数。密码子数N除了与GC3极显著相关外,与其他参数均无显著相关。
分析表明,RSCU>1的密码子有30个。其中,16个以U结尾;13个以A结尾;以G结尾的只有1个。说明杜梨叶绿体基因组密码子偏好以A或U 结尾(表3)。
表2 密码子数各位置GC含量、数量与ENC值的相关性分析
Table 2 Correlation analysis of GC content, quantity and ENC value of different position codon numbers
GC1GC2GC3GC all有效密码子
ENC GC20.407*
GC3-0.079-0.162
GC all0.803**0.776**0.198
ENC-0.088-0.475**0.357*-0.211
密码子数N-0.058-0.174 0.440**0.0130.298注:*表示相关性达到显著水平(P<0.05);**表示相关性达到极显著水平(P<0.01)。
表3 杜梨各氨基酸的RSCU分析
Table 3 RSCU analysis of each amino acid in P.betulifoli a
氨基酸Amino acid 密码子
在线英语翻译Codon
数目
Number
相对同义密码子
RSCU
氨基酸
Amino acid
密码子
Codon
数目
Number
相对同义密码子
RSCU
Phe UUU5031.27Tyr UAU4041.60 UUC2920.73UAC1010.40 Leu UUA4681.93TER UAA191.54 UUG3221.33UAG100.81
CUU3031.25His CAU2831.51
CUC850.35CAC910.49
CUA1910.79Gln CAA4111.53
CUG880.36CAG1280.47 Ile AUU5941.50Asn AAU4901.53 AUC2300.58AAC1500.47
AUA3670.92Lys AAA4761.49 Met AUG3371.00AAG1650.51 Val GUU3131.52Asp GAU4951.61 GUC820.40GAC1200.39
55
第6期
氨基酸Amino acid
密码子Codon 数目Number 相对同义密码子
RSCU
氨基酸Amino acid
密码子Codon 数目Number 相对同义密码子
RSCU
breadGUA 3181.54Glu
GAA 5471.45GUG
1130.55GAG
2060.55Ser
UCU 2971.70Cys UGU 1001.44UCC 1690.97UGC
390.56UCA 1841.06TER UGA 80.65UCG
1060.61Trp UGG 2661.00Pro
CCU 2341.50Arg
CGU 2141.49CCC 1150.74CGC 660.46CCA 1771.14CGA 1871.30CCG
970.62CGG
620.43Thr
ACU 3001.67Ser AGU 2201.26ACC 1320.73AGC
700.40ACA 2171.21Arg AGA 2411.68ACG
700.39AGG
910.63Ala
GCU 4141.90Gly GGU 3831.42GCC 1190.55GGC 1240.46GCA 2481.14GGA 4141.53GCG
92
0.42
GGG
161
0.60
2.2 中性绘图分析
分析表明,在杜梨叶绿体基因组密码子中,GC 12的取值范围在0.333~0.540之间,GC 3的取值范围在0.203~0.366之间, GC 12和GC 3的相关系数-0.143 4,回归系数(即趋势线斜率)为0.207 2,说明密码子第1、2位碱基和第3位碱基组成存在差异,其基因组中GC 含量高度保守,密码子的偏好性受选择影响较大(图1)。
0.60.50.40.30.20.100.1
0.3
0.2
0.4
G C 12
GC 3
y = -0.2072x +0.5025R 2 = 0.0206
图1 中性绘图分析Fig.1 Neutrality plot analysis
2.3 ENC-plot 分析新视野大学英语读写教程1答案
ENC-plot 分析如图2所示,大部分基因位于标准曲线下方,说明其密码子偏好性的影响因素中,
选择占主导地位。进一步计算ENC 比值,分析基因的ENC 频数分布(表4
)。
E N C
GC 3
kds图2 ENC-plot 绘图分析Fig.2 ENC -plot analysis
结果表明,分布在-0.05~0.05区间的基因有14个,这14个基因与预期ENC 值较接近,而分布在这个区间以外的基因有23个,这23个基因与预期ENC 较远,也就是离标准曲线较远。说明了杜梨叶绿体基因组密码子的偏好性更多地受选择的影响。
辛雅萱,等:杜梨叶绿体基因组密码子偏好性分析
续表:

本文发布于:2023-06-19 10:11:42,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/150383.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:口解
标签:密码子   基因   基因组   分析
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图