密码子偏好性分析~codonW,EMBOSS:CUSP(图文教程)

更新时间:2023-05-04 20:04:27 阅读: 评论:0

密码⼦偏好性分析~codonW,EMBOS90年代下岗潮 S:CUSP(图⽂教
程)
前⾔
真核⽣物基因组存在64个密码⼦,这64个密码⼦编码20种不同的氨基酸和3个终⽌密码⼦,除蛋氨酸(Met)和⾊氨酸(Trp)外的所有氨基酸均由⼀个以上密码⼦编码。编码同⼀氨基酸的不同密码⼦互为同义密码⼦,不同的同义密码⼦被使⽤的频率并不⼀样,被频繁使⽤的密码⼦是“偏好密码⼦”,⽽其他密码⼦则是“⾮偏好密码⼦”,这种现象被称为“密码⼦偏好性”。 ⼀般认为,密码⼦偏好性的成因是不同密码⼦怎样幽默聊天 对应的tRNA在细胞⾥的丰度不⼀样。 ⼀般⽽⾔,tRNA丰度越⾼,其对应的密码⼦的使⽤频率也会越⾼。
⼀、相关参数介绍
1、CUB:密码⼦使⽤电饭煲可以煮粥吗 偏好性(codon usage bias),不同的同义密码⼦被使⽤的频率并不⼀样,被频繁使⽤的密码⼦是“偏好密码⼦”,⽽其他密码⼦则是“⾮偏好密码⼦”,这种现象被称为“密码⼦偏好性”。
2、RSCU:相对同义密码⼦使⽤度 (rela节约纸张 tive synonymous codon usage),RSCU定义是以某⼀个同义密码⼦的使⽤次数为分⼦,以该密码⼦预期出现的次数为分母。其中,预测出现的次数为该密码⼦所编码的氨基酸的所有密码⼦平均使⽤的次数。
如果密码⼦使⽤没有偏好,则该密码⼦的RSCU值等于1。当某⼀密码⼦的RSCU值⼤于1,则表明其的使⽤频率相对较⾼。由于它计算⽅便,⽽且很直观的反映出密码⼦使⽤的偏好性,因此在⼤多数的密码⼦相关分析中,都使⽤了它作为衡量偏好性的标准
3、ENC:有效密码⼦(effective numstring ber of codon),反映的是密码⼦偏离随机选择的程度,是反映同义密码⼦⾮均衡使⽤偏好程度的重要指标,通常⾼表达基因其密码⼦偏好程度较⼤,因此ENC取值较⼩; 低表达基因含有较多种类的稀有密码⼦偏好性较弱,ENC取值也较⼤。ENC取值范围为20(每个氨基酸只有1个有效密码⼦)~61(所有的密码⼦都均衡使⽤),可以通过⽐较ENC值来确定内源基因表达量的相对⾼低。
4、CBI:密码⼦偏性指数(codon bias index),反应了⼀个基因中⾼表达优越密码⼦的组分情况。对⽬的宿主⾃⾝的基因人体美 , 该指数和 ENC 值有很好的相关性,但在实际⼯作中浣溪沙赏析 可以更明确地反映外源基因在⽬的宿主中可能的表达情况, 故⽽得到⼴泛应⽤。
5、CAI:密码⼦适应指数(codon adaptation index),对于某⼀个基因,CAI是指编码该蛋⽩的所有密码⼦相对于这条基因都使⽤最优密码⼦的情况下的适应系数,CAI值介于0~1之间,该值越⼤表⽰适应性越强,CAI值⼴泛应⽤于基因表达⽔平的评估中。
6、Fop:最优密码⼦使⽤频率(frequency of optical codons),最优密码⼦是指在某物种⾼表达基因中
使⽤频率最⾼的密码⼦,也有⼈将⼀个氨基酸的最优密码⼦定义为具有最⼤数量的带有其反密码⼦ tRNA 基因的密码⼦。该指标是指最优密码⼦和其同义密码⼦的⽐值,和CAI的计算⼀样,需要已知⾼表达基因的最优密码⼦。FOP的取值范围为0到1之间,1表⽰只有最优密码⼦被使⽤,0则表⽰没有最优密码⼦被使⽤到。
7、GC、GC3:GC3指的是基因中所有密码⼦的第3位的GC含量,即除了蛋氨酸、⾊氨酸和终⽌密码⼦外,G和C出什么口红牌子最好 现在密码⼦第三个位置的频率。
8、GC3-GC12分析:也称之为Neutrality-plot分析,密码⼦第3位的改变通常不会引起编码氨基酸的改变,第3位上的碱基突变受到的选择压⼒⽐较⼩,因此研究第3位碱基的碱基组成对研究密码⼦偏好性有重要意义。统计密码⼦3个位置的GC含量,⽤GC1、GC2、GC3分别表⽰第1,2,3位的GC含量,GC12表⽰GC1和GC2的平均值。
通过分析密码⼦的第1,2位和第3位碱基组成的相关性,研究密码⼦的偏好性影响因素。当GC12与GC3之间显著相关,说明3个位置上的碱基组成⽆差异,密码⼦的使⽤受突变的影响。当GC12与GC3相关性不显著,说明第 1,2位和第3位碱基组成不同,基因组GC含量⾼度保守,密码⼦的使⽤更多地受选择影响。
9、ENC-plot 分析:⽤GC3和ENC分别作X轴和Y轴进⾏ENC-plot分析,可以检测碱基组成对密码⼦偏
好性的影响。基因沿标准曲线分布或落在标准曲线附近表⽰该基因密码⼦偏好性仅受突变影响,基因落在标准曲线下⽅较远的位置表⽰该基因密码⼦偏好性受到选择的影响。
10、PR2-bias-plot 分析:密码⼦偏好性完全不受碱基位置影响,碱基A/T及G/C应均衡分布,即A=T\G=C。PR2-bias plot 分析计算每个基因A3/(A3+T3)跟读学英语 和G3/(G3+C3),PR2偏倚图中⼼点表⽰A=T且C=G,其余的点由中⼼点向该点发出的⽮量表⽰了该基因的偏倚程度和⽅向。
⼆、codonW的使⽤
打开codonW压缩包,把⾃⼰要分析的序列放⼊该⽂件夹下,打开codonW应⽤程序
打开后如图,菜单中我们主要⽤到的就是(1)load quence file 导⼊⽂件;(4)codon usage indices 选择密码⼦使⽤参数;(R)Run C-codons运⾏程序;(Q)Quit 停⽌
⾸先输⼊ 4,敲回车键,出现如下界⾯。不同的数字代表不同的参数计算,如果想要计算所有的参数,就输⼊12 lect all
回车后出现如下界⾯,输⼊X回到初始菜单界⾯
在初始界⾯中,输⼊1,开始上传⽂件
回车后出现如下界⾯,将⾃⼰要上传的⽂件拖进去,回车即可
回车后会出现默认输出⽂件的位置和名字,⼀般是和输⼊⽂件⼀样
继续回车后回到初始菜单,输⼊R,运⾏代码

本文发布于:2023-05-04 20:04:27,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/526449.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:密码   基因   表达   出现
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图