生信名词解释

更新时间:2023-06-25 03:00:50 阅读: 评论:0

Small RNA:生物体内一类高度保守的重要的功能分子,其大小在18-30nt,包括microRNA、siRNA、snRNA、snoRNA和piRNA(piwi-interacting RNA)等,它的主要功能是诱导基因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程。以miRNA为例介绍它们的功能:miRNA与RNA诱导沉默复合体(RNA induced silencing complex, RISC)结合,并将此复合体与其互补的mRNA序列结合,根据靶序列与miRNA的互补程度,从而导致靶序列降解或干扰靶序列蛋白质的翻译过程。不想骗自己英文
会计入门基础知识SD 区域:Segment duplication,串联重复是由序列相近的一些 DNA 片段串联组成。串联重复在人类基因多样性的灵长类基因中发挥重要作用。
Genotype and phenotype:基因型与表型,基因型是指某一生物个体全部基因组合的总称;表型,又称性状,是基因型和环境共同作用的结果。
基因组Genome,单倍体细胞核、细胞器(线粒体、叶绿体)或病毒粒子所含的全部DNA分子或RNA分子。
全基因组de novo测序:又称从头测序,它不依赖于任何现有的序列资料,而直接对某个
物种的基因组进行测序,然后利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组序列图谱。
beta是什么意思全基因组重测序:对已有参考序列(Reference Sequence)物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的遗传差异性分析。全基因组重测序能够发现大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,Inrtion/Deletion)、结构变异(Structure Variation,SV)等变异类型,以准确快速的方法将单个参考基因组信息上升为群体遗传特征。
身份证查四六级
转录组:Transcriptome,是指特定生长阶段某组织或细胞内所有转录产物的集合;狭义上指所有mRNA的集合。
转录组测序:对某组织在某一功能状态下所能转录出来的所有RNA进行测序,获得特定状态下的该物种的几乎所有转录本序列信息。通常转录组测序是指对mRNA进行测序获得相关序列的过程。其根据所研究物种是否有参考基因组序列分为转录组de novo测序(无参考基因组序列)和转录组重测序(有参考基因组序列)。
外显子组测序:是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、InDel 等具有较大的优势。
目标区域测序:应用相关试剂盒对基因组上感兴趣的目标区域进行捕获富集后进行大规模测序,一般需要根据目标区域专门定制捕获芯片。
宏基因组Metagenome,指特定生活环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。目前主要指环境样品中的细菌和真菌的基因组总和。
宏基因组16S rRNA测序:可以对特定环境下的细菌和古细菌群体的微生物种类和丰度进行有效的鉴定。对不同地点、不同条件下的多个样本16S rRNA的PCR产物平行测序,可以比较不同样本间的微生物组成及成分差异,进而阐明物种丰度、种群结果等生态学信息。
表观遗传学:Epigenetics,是指在基因组DNA序列没有改变的情况下,基因的表达调控和性状发生了可遗传的变化。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation)
,基因组印记(genomic impriting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。
全基因组甲基化测序DNA 甲基化是指在 DNA 甲基化转移酶的作用下,在基因组 CpG 二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团。DNA 甲基化已经成为表观遗传学和表观基因组学的重要研究内容。甲基化是基因表达的主要调控方式之一,研究染色体DNA甲基化情况是了解基因调控的重要手段。对已经有参考基因组的物种的基因组DNA用标准亚硫酸氢盐(Bisulfite)处理后,未甲基化的胞嘧啶C会脱氨基形成尿嘧啶U,经PCR扩增,U替换为胸腺嘧啶T,而发生甲基化的胞嘧啶C保持不变。将处理组与参考基因组序列进行比对,可发现甲基化位点并对甲基化情况进行定量分析的方法叫做全基因组甲基化测序。
modify什么意思
ChIp-Seq:Chromatin Immunoprecipitation quencing,即染色质免疫共沉淀-测序技术,即通过染色质免疫共沉淀技术特异性地富集目的蛋白结合的DNA片段。对富集得到的DNA片段进行纯化与文库构建,然后进行高通量测序,从而得到全基因组范围内可以与目的蛋白相互作用的DNA片段的方法叫做ChIP-Seq。
因变量
数字表达谱aliceDigital Gene Expression Profile,利用新一代高通量测序技术和高性能计算
分析技术,能够全面、经济、快速地检测某一物种特定组织在特定状态下的基因表达情况,即运用特定的酶对mRNA距polyA tail 21-25nt的位置进行酶切,所获得的带polyA尾的序列(Tag)通过高通量测序,该tag被测得的次数即是对应基因的表达值。数字基因表达谱已被广泛应用于基础科学研究、医学研究和药物研发等领域。特点是经济,但获得的数据量有限。若想获得转录本的更多信息的话,一般都采用转录组测序的方法来测序。
SBS:quencing by synthesis,边合成边测序反应,是指在DNA聚合酶的作用下延伸碱基所进行的测序。
Run:指高通量测序平台单次上机测序反应。
Lane:也叫channel,单泳道,每条泳道包含2列(column),每列分布有多个小区(tile)。不同的测序平台Flow Cell中所含的Lane不一样,如HiSeq 2000是2个flow cell,每个flow cell中含有8个lane;HiSeq 2500是包含2个mini flow cell(快速运行模式)和2个high output flow cell,两个模式不能同时运行,其中每个mini flow cell包含2个lane,每个high output flow cell中包含8lane;Miq系统的flow cell仅含有1个lane。
Tile:小区,每条Lane中有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点。
Cluster:簇,在Illumina测序平台中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度达到CCD可以分辨的荧光点。美语口语学习>opacity
Index:标签,在Illumina平台的多重测序(Multiplexed Sequencing)过程中会使用Index来区分样品,并在常规测序完成后,针对Index部分额外进行7个循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品。
Barcode:与Index同义,多指在Roche GS FLX 454测序平台的16S PCR产物的测序过程中接头序列所包含的的用来区分不同样本的序列。
PF%:PF%是指符合测序质量标准的簇的百分比,与测序的通量相关联。
Fasta:一种序列存储格式。一个序列文件若以FASTA格式存储,则每一条序列的第一行以“>”开头,而跟随“>”的是序列的ID号(即唯一的标识符)及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,
最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“>”和序列的ID号开始,以此类推。
Fastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件格式。第一行以“@”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面可以是该序列的描述信息,也可省略;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。
Read:高通量测序平台产生的序列标签就称为 reads。
基因组组装:进行基因组或转录组de novo测序时,物种基因组经构建不同的文库测序所得的片段需经过生物信息学手段对其进行整理拼接,并通过一定的标准(如N50)对后续组装结果进行质量评估等,最终获得高准确度的基因组序列的过程。
基因组测序深度:测序得到的总碱基数与待测基因组大小的比值。如测一个物种的全基因组的重测序,基因组大小约为5G,测序获得100G的数据量,则测序深度为20×。
基因组覆盖率:指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列
等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖率是98%,那么还有2%的序列区域是没有通过测序获得的。
Contig:在de novo测序中拼接软件基于 reads 之间的 overlap 区拼接获得的中间没有gap的序列称为Contig(重叠群)。
Scaffold:基因组 de novo 测序,通过 reads 拼接获得 Contigs 后,往往还需要构建 454 Paired-end 库或Illumina Mate-pair 库,以获得一定大小片段(如 3Kb、8Kb、10Kb、20Kb)两端的序 列。基于这些序列,可以确定一些 Contig 之间的顺序关系,这些先后顺序已知的 Contigs 组成 Scaffold。
Contig N50:Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3……Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50。
英语四六级成绩查询时间Contig N50可以作为基因组拼接的结果好坏的一个判断标准。
Scaffold N50:Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3……Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。

本文发布于:2023-06-25 03:00:50,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/156697.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:测序   序列   基因组   进行   获得   基因   转录   物种
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图