转录组测序

更新时间:2023-07-24 08:16:08 阅读: 评论:0

转录组测序
今天我们来学习一些关于转录组测序的知识,从转录组的一些基本概念开始。
第一章
Intron:内含子,间隔存在于真核生物细胞DNA中的序列,转录时存在于前体mRNA中,通过剪接过程被去除,最终不存在成熟的mRNA中。
Exon:外显子,真核生物DNA中的序列,与Intron对应,序列在剪接过程中不被去除,最终存在于成熟的mRNA分子中。2013年四级考试答案
startedUTR:Untranslated regions,非翻译区,信使RNA分子两端的非编码片段。5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽直至AUG起始密码子,3'-UTR从编码区末端的终止密码子直至PolyA尾的前端。
CDS:code DNA quence,基因编码区域,mRNA序列中编码蛋白质的序列,以起始密码子开始以终止密码子结束的片段。
转录本(Transcript):基因通过转录形成的一种或多种可供编码蛋白质的成熟的mRNA。
可变剪切:从同一个mRNA前体出发,通过不同剪接方式、选择不同的剪接位点,产生不同的mRNA剪接异构体的过程,可以产生多个转录本。
融合基因:来自不同基因的外显子组合形成新的mRNA,最终产生与外显子来源基因表达产物不同的蛋白质。
四六级查分start codon,起始密码子;stop codon,终止密码子
wavin flag转录组(Transcriptome):特定生物体在某种状态下所有基因转录产物的总和。
链特异性文库:鉴定真核生物的反义转录本或原核生物的ncRNA。合成第二链cDNA时用dUTP代表dTTP,使得第二链cDNA上布满含dUTP的位点,然后用特异性识别尿嘧啶的酶消化第二链,得到只包含第一链cDNA信息的文库。
转录组:转录组被测序的物种已经有一个参考基因组。在分析数据时,不需要拼接转录本,只需要将转录组测序数据与参考基因组进行比较,就可以确定每个基因的表达水平。
四级听力一个多少分
无转录组:转录组被测序的物种没有参考基因组,因此需要拼接转录组数据以获得样品中的转录本信息,然后对这些拼接的转录本进行功能注释,然后将转录组数据与拼接的转录本进行比较并计算其表达水平。
Unigene:在无参转录组中,经过拼接的到的转录本并不一定完全是正确的,同时还会得到许多相似度很高、但长度不等的转录本,Unigene即为这些相似转录本的集合,根据设置的相似度阈值,将拼接组装的到的转录本进行聚类,得到的每一个聚类即为一个Unigene,属于同一Unigene的转录本被认为是同一个基因,从中挑选出长度最长的转录组作为该Unigene的代表进行后续的功能注释和表达水平计算。
互作转录组 (Dual RNA-Seq):同时检测两个相互作用物种的转录组,之后利用生物信息学分析,获得物种特异性的基因表达和物种间的基因互相作用。构建文库时,选择互作部位提取两个物种的总RNA进行建库和随后的RNA-Seq,然后将测序得到的Reads分别与两个物种的参考基因组进行匹配,从而识别各物种特异的转录本信息。
microRNA (miRNA):一种具有茎环结构的非编码RNA,长度一般为20~24个核苷酸,其功能主要是通过识别靶基因UTR区域的序列,与靶基因的mRNA结合诱导其降解,调节靶
基因的表达水平
大嘴巴幼儿英语Long non-coding RNA (lncRNA):长度超过200nt且不具有蛋白质编码能力的RNA,其是真核生物体内比例最大的非编码RNA,与转录因子相互作用调控靶基因的转录。
环状RNA (circRNAs):是生物体内存在的一类不具有5'端帽子和3'端poly(A)尾、能通过共价键形成闭合环形结构的RNA分子,其闭环结构可以防止其被RNa降解。对不起英语
ceRNA (peting endogenous RNAs):指具有miRNA结合位点,能够竞争性结合miRNA,从而抑制miRNA对靶基因调控的RNA。
第二章
RNA-q也称为全转录组鸟枪测序,应用高通量测序技术对样品中的mRNA、small RNA和non-coding RNA进行测序的技术,其中针对mRNA的RNA-Seq测序即为转录组测序。关于RNA-q的基本相关信息,我们在前面的文章中已经有过描述,这里我们再做一些补充学习
1.转录组测序体系设置:
时间系列:同一样本不同发育阶段,不同药物处理时长间的比较
刺激系列:特定刺激与对照样本间的比较;
特异系列:同一生物不同器官或组织的比较
突变系列:野生型与突变型样本间的比较;
互作系列:病原侵染宿主互作过程中样本的比较;
进化系列:不同进化或分化物种之间的比较;
遗传系列:亲代与子代样本间的比较;
性状系列:在相同形状和表现型上有明显差异的样本之间的比较。
2. 转录组测序文库建立:primary
常规文库的建立请参考上一篇文章(浅谈RNA-q),这里我们具体介绍一下链特异性文库如何建立?
中译英在线翻译器链特异性文库:顾名思义,保留了单链特异性的文库,即保留mRNA的方向信息。其建库原理与普通转录组类似,不同之处在于合成第二链cDNA时,用dUTP代替dTTP,此时第二链cDNA上布满了含dUTP的位点。在接头连接后用一种特定的酶,其可在尿嘧啶位置产生一个单核苷酸缺口,从而消化掉第二链cDNA,只保留第一链cDNA,随后进行PCR扩增纯化,得到只含第一链cDNA信息的文库。
frostmourne
3. 转录组测序深度:
细菌,数据量为1-2Gb;真菌,数据量为2-4Gb;真核动植物,数据量5-10Gb
4. 转录组数据评估:
碱基含量分布统计:转录组测序时,基于碱基互补配对原则,理论上得到的数据G/C和A/T含量相等,整个过程中基本稳定不变呈水平线,刚上机时前几个位置的信号有波动(反转录合成cDNA需要6bp的随机引物)
A=T,G=C;模糊碱基N越少,说明未知碱基越少,测序样本受AT偏好影响越小
碱基错误率分布图:在评价转录组测序整体质量时,可以统计单个碱基位点的错误率,然后绘制碱基错误率分布图。
横坐标代表测序得到的reads从5’端到3’端依次碱基的序列,纵坐标代表所有测序得到的reads在该位点处碱基的平均错误率
5. 参考基因组mapping:通常使用Bowtie2工具,通过B-W转换按一定规律压缩基因组并建立索引,再通过查找和回溯定位reads。测序reads中超过70%均可在基因组中找到相应定位,若mapping比例较低,可能是由于基因组本身不适合或前期实验污染。

本文发布于:2023-07-24 08:16:08,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/187097.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:转录   测序   基因
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图