Enmbl简介及其参考基因组

更新时间:2023-06-30 20:58:32 阅读: 评论:0

Enmbl简介及其参考基因组
Enmbl 的特点:1、物种种类齐全。2、提供物种基因组序列。3、有⽐对⼯具:BLAST, BLAT, BioMart和变异效应预测器(VEP)。
Enmbl提供搜索功能,种类包括Gene, Transcript, Variant, Phenotype, Structural variation, Somatic mutation, Protein families, Gene tree, GenomicAlignment, Translation, Protein domains, Clones and regions, Marker.
image.png
提供物种数据的⼤类:
Protein-coding and non-coding genes, splice variants, cDNA and protein quences, non-coding RNAs.
其中
FASTA files for genes, cDNAs, ncRNA, proteins网络安全监测
住宅区的英文
GTF or GFF3 files for genes, cDNAs, ncRNA, proteins
其中cDNA是互补DNA,是由mRNA反转录来的DNA,不包括ncRNA.双链DNA缩写是dsDNA,ncRNA表⽰⾮编码RNA.
CDS是编码序列(Coding quence)的缩写。DNA转录成mRNA,mRNA经剪接等加⼯后翻译出蛋⽩质,所谓CDS就是与蛋⽩质序列⼀ ⼀对应的DNA序列
傅雷家书每章概括
以alt结尾的参考基因组⽂件,这个⽂件的alt代表:Alternate loci,不同的单倍体型,⾥⾯有不同的HLA序列,基因在⼀条染⾊体上的组合称单元型(haplotype ,⼜称单倍型)
怀孕的英语接下来以chromosome+数字结尾的代表每个染⾊体的序列信息
红包做灯笼image.png
那么,我们⼀般做⽐对选⽤的是primary_asmbly结尾的⽂件,该⽂件内部有完整的基因组信息(包括每条染⾊体的序列信息)
⽽以toplevel结尾的⽂件,其内部包括了很多该物种的亚型,或者说包括了⼤量的变异信息,其余很多部分都是冗余的,不建议做⽐对时使⽤,否则建索引就很慢
漏财手的化解方法接下来带有前缀rm的⽂件表⽰在基因组中重复区域标记成N,rm即repeat mask;在做⽐对时不建议使⽤,⽽带有前缀sm的⽂件表⽰在基因组中重复区域都⽤⼩写表⽰,sm即soft mask;有些软件在⽐对时可以进⾏⼤⼩写转换,有些则不会
image.pnghatsukoi>白玉石榴

本文发布于:2023-06-30 20:58:32,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1062098.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因组   包括   序列   物种   信息
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图