小RNA分析-浙大教材

更新时间:2023-05-15 11:14:39 阅读: 评论:0

第七章小RNA分析
内源性非蛋白质编码小RNA (small non-protein-coding RNA, 12-24nt)广泛存在于高等和低等生物体内,通过对靶标mRNA直接切除或抑制其翻译在转录后水平对基因表达起调节作用。已知的小RNA主要分为两大类:一类是微小RNA (miRNA, microRNA),一类是小干扰RNA (siRNA, small interfering RNA)。在植物和动物体内,miRNA与siRNA的产生机制和作用形式均有所不同,这里主要介绍植物体内的小RNA。miRNA是由具有发夹结构的初级转录本(pri-miRNA)经过一系列加工过程,包括核酸内切酶DCL1加工后生成,而小干扰RNA则是通过核酸内切酶DCL2, DCL3和DCL4对具有较好互补结构的长双链RNA前体进行加工形成的(Vazquez 2006)。目前发现的小干扰RNA种类很多,根据前体序列类型和形成机制可分为:ta-siRNAs (trans acting siRNAs),nat-siRNAs (natural antin transcript-derived siRNAs), hc-siRNA (heterochromatic siRNA), ra-siRNAs(repeat-associated siRNAs),长茎环结构的miRNA-like位点(miRNA-like long hairpin)和nat-miRNA ( natural antin miRNA)。植物中发现的小RNA已有相当的数量,在水稻中至今已鉴定出451个miRNA (miRBa, microrna.sanger.ac.uk/quences/, Relea 14.0)、一个ta-siRNA家族(TAS3)和一个mirtron (Zhu et al. 2008)。
由于小RNA表达的时空特异性,导致传统的实验方法研究小RNA效率很低,成本较高,因此借助计算方法研究小RNA是一个很好的补充,大大加速了该领域的研究进程。对保守miRNA家族的查找,miRNA基
因簇的发现,基于miRNA序列特征预测特异(novel)miRNA,通过高通量测序技术(454和SOLEXIA)产生的小RNA数据(往往超过几百或上千万条序列)处理,以及小RNA靶位点的预测及其进化分析,这些分析均离不开生物信息学的帮助。随着研究的深入,大量的计算方法,相关软件和小RNA数据库不断产生,本章将对相关内容进行介绍。
夏天饮品第一节miRNA的主要特征及计算识别
一. miRNA的主要特征
在植物体内,miRNA基因首先通过Pol Ⅱ酶转录产生一个具茎环结构的miRNA 初级转录本(pri-miRNA) (Lee et al., 2004),然后在DCL1酶(Dicer-like enzyme)的作用下切除茎结构的尾巴或loop结构由miRNA前体(pre-miRNA)得到
miRNA:miRNA*双链复合体(Tang et al., 2003; Kurihara and Watanabe, 2004)。miRNA:miRNA*复合体的两个3'端均有两个碱基的错位,其碱基结合允许一定的错配数,但通常不超过4个,并且没有较大的空位或loop结构。最后双链由解旋酶切开,miRNA*降解,成熟miRNA序列结合到靶基因位点进行调节,根据与靶位点结合的紧密程度决定了对目标mRNA切割或是抑制其表达(Bernstein et al., 2001; Papp et al., 2003; Bartel, 2004, 图1)。
图1 miRNAs和siRNAs的产生途径(Bartel, 2004)
(A) The biogenesis of a plant miRNA (steps 1–6; e text for details) and its hetero-silencing of loci unrelated to that from which it originated (step 7). The pre-miRNA intermediates (bracketed), thought to be very short-lived, have not been isolated in plants. The miRNA (red) is incorporated into the RISC (step 6), whereas the miRNA* (blue) is degraded (hatched gment). A monophosphate (P) marks the 5_ terminus of each fragment.
(B) The biogenesis of a metazoan miRNA (steps 1–6; e text for details) and its hetero-silencing of loci unrelated to that from which it originated (step 7).
(C) The biogenesis of animal siRNAs (steps 1–6; e text for details) and their auto-silencing of the same (or similar) loci from which they originated (step 7).
miRNA 基因长度从几十到几百碱基不等 (Zhang et al., 2006a,b),但成熟miRNA 序列长度一般为20-24个碱基 (Ambros, 2001),水稻中以21nt 和24nt 两种长度miRNA 含量最丰富,这跟其选择的DCL 酶有关。miRNA 成簇排列的现象在动物中比较常见,在植物中目前已发现几个miRNA 家族像水稻中的miR169,miR395,也在基因组上成簇排列 (Jones-Rhoades and Bartel, 2004; Zhang et al., 2006a)。成簇排列的miRNA 类似多顺反子结构,基因表达模式和时期均有同步性 (Bartel, 2004; Altuvia et al., 2005; Baskerville and Bartel, 2005)。
基于miRNA 前体的二级结构,一些研究发现miRNA 前体有较低的最小折叠自由能 (MFE, minimal folding free energy),由于MFE 跟序列长度相关,Zhang 等(2006b )提出了最小折叠自由能指标 (MFEI, minimal folding free energy index)的概念,将序列长度考虑进来,从而为不同长度miRNA 前体的MEF 比较提供了一个标准,并给出0.85作为miRNA 区别于其他类型RNA 的MFEI 值,不失为一个预测miRNA 的较理想指标。
爆肥肠
(L: the length of pre-miRNA)
目前miRBa 14.0 (/)版本中miRNA 的记录已经超过1万条。其中很多miRNA 家族均可以在至少2个物种中找到,其中miR159, miR171家族在目前miRBa 收录的全部物种中均存在 (Tab. 1)。这种miRNA 的保守性对于在新物种中预测保守的miRNA 非常有用。尽管miRNA 前体在不同物种,或不同成员间的变异非常大,但成熟miRNA 序列还是相当保守的,同一miRNA 家族不同物种的homologs 间往往只有1, 2个碱基的差异。这种便利促使了大量的查找不同物种间保守miRNA 的研究 (Llave et al., 2002; Reinhart et al., 2002; Bonnet et al., 2004a; Jones-Rhoades and Bartel, 2004; Sunkar and Zhu, 2004; Wang et al., 2004a; Adai et al., 2005; Sunkar et al., 2005; Zhang et al., 2005)。除了保守miRNA 外,不同物种中还存在很多物种特异的miRNA (species-specific miRNA),这类进化上比较―年轻‖的miRNA 无疑在特定物种的形成和发育过程中扮演着重要的作用。
100/MEFI ()%
MEF L G C ⨯=
+
表1. 植物保守miRNA家族(根据miRBa 14.0和物种多少排序)
miRNA family No. of species杭州就业
梦见哭丧
miRNA
family
百色市No. of species
miRNA
family
No. of species
miR-159 17 miR-394    6 miR-1510    2
miR-171 17 miR-157    4 miR-1514    2
miR-156 16 miR-2118    4 miR-161    2
miR-166 16 miR-824    4 miR-2111    2
miR-167 16 miR-1507    3 miR-2275    2
miR-396 15 miR-2119    3 miR-413    2
miR-160 14 miR-403    3 miR-414    2
日本时代miR-399 14 miR-437    3 miR-415    2
miR-169 13 miR-444    3 miR-416    2
miR-172 13 miR-477    3 miR-417    2
miR-319 13 miR-529    3 miR-418    2工作纪律的主要内容
miR-408 12 miR-530    3 miR-419    2
miR-164 11 miR-535    3 miR-420    2
miR-168 11 miR-827    3 miR-426    2
miR-162 10 miR-1122    2 miR-472    2
miR-390 10 miR-1127    2 miR-479    2
miR-393 9 miR-1135    2 miR-783    2
miR-395 9 miR-1139    2 miR-821    2
miR-398 9 miR-1432    2 miR-828    2
miR-397 8 miR-1435    2 miR-845    2
miR-482 7 miR-1509    2
miRNA通过与靶基因形成互补RNA双链来行使调节功能,这种互补性在进化过程中是保守的(Rhoades et al., 2002; Jones-Rhoades and Bartel, 2004; Robins et al., 2005a)。互补性的强弱或者说互补碱基的多寡决定了miRNA调节的不同机制。跟靶基因有较好互补的miRNA主要通过对目标mRNA
的直接切割调节mRNA的表达,相反,如果miRNA与其靶位点的错配较多,则主要通过转录后抑制的方式干扰mRNA的翻译(Papp et al., 2003; Bartel, 2004, 图2)。植物miRNA的靶基因一大类都是转录因子(transcriptional factor),揭示了miRNA调节通路的复杂性。
图2 小RNA调控机制(Bartel, 2004)
(A) Mesnger RNA cleavage specified by a miRNA or siRNA. Black arrowhead indicates site of cleavage.
(B) Translational repression specified by miRNAs or siRNAs.
(C) Transcriptional silencing, thought to be specified by heterochromatic siRNAs.
二. miRNA的计算识别
通过计算方法识别miRNA基因主要基于以上提到的miRNA序列及结构上的特征,以及不同物种间的保
守性。可以分为以下几类方法:
1. 同源比对
爱学习的句子同源比对的方法主要是通过已知保守miRNA的在不同物种间的序列相似性进行同源序列搜索预测miRNA的方法。以已知miRNA序列为索引,公共DNA序列数据库中的数据作为搜索库,对于全基因组已测序或正在测序的模式生物,如rice,maize等,可利用其全基因组或大规模测序数据;对于基因组序列并未获得的物种来说,小规模的GSS (genome survey quences)序列和EST (expresd quence tags)序列也是很好的数据资源。尤其是EST序列,因为其本身就是表达水平的序列,故而预测的结果更加准确可信。搜索程序可以选择BLAST,如果是利用成熟miRNA 序列进行搜索,因为序列较短,E值一般要高于1E-2,最小字符长度改为7 (默认13, -W 7),但利用BLAST比对仍然会因程序本身的原因造成敏感性的降低,笔者在实际数据处理过程中曾发现对于~20nt的miRNA,2个不连续且距离较近的错配会导致错配序列3'端完全略掉联配过程,从而漏掉一个可能的结果,尽管这种情况是极少的。另外,基于轮廓的搜索软件ERPIN (tagc.univ-mrs.fr/erpin/)也可以用来搜索数据库中的miRNA同源基因位点。通过提交一组特定RNA的联配序列及二级结构信息,ERPIN可以搜索特定模式的RNA序列,从而获得更加准确特异的结果。同源比对方法还要注意以下几点:1) 数据处理过程中一般先通过BLASTX搜索蛋白质数据库,以排除掉编码蛋白序列,提高检索效率;2) 往往仅找到已知miRNA 的同源序列还远远不够,一般需要对候选miRNA位点周围的序列进行二级结构预测,以确定
该段序列是否可能形成stem-loop结构,并需要验证miRNA的位置,及miRNA与miRNA*的互补情况;3) 在确定了可能的miRNA前体序列后,需要计算该段序列的MEF及MEFI值,一般情况下miRNA前体的MEF很小,而MEFI > 0.85,如果所有以上标准均符合,那么该位点即为候选的miRNA基因。
基于同源搜索方法开发了很多软件,包括Wang等(2005b)开发的miRAlign
软件(bioinfo.au./miralign/) (图3), 可以用来预测人miRNA基
因的基于概率共同学习模型开发的ProMiR (cbit.snu.ac.kr/~ProMiR2/) (Nam et al.,
2005),以及原理相似,用于植物miRNA预测的microHARVESTER
(www-ab.informatik.uni-tuebingen.de/brisbane/tb/index.php?view=microharveste r) (图4) (Dezulian et al., 2006)。
图  3. miRAlign界面(bioinfo.au./miralign/)

本文发布于:2023-05-15 11:14:39,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/899267.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   结构   基因   搜索   物种
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图