NCBI中各符号代实用表的意思x

更新时间:2023-05-31 19:18:59 阅读: 评论:0

NCBI中各符号代实⽤表的意思.docx
GenBank 中字符的意思
Nucleotide数据库分为三个⼦数据库:
·EST 表:达序列标记数据库
·GSS 基:因组测序序列数据库
·C oreNucleotide : 包含所有未被以上两个⼦数据库收录的核苷酸序列
讲述的意思●MeSH: 查询缩写基因的全称
3、 RefSeq(Reference Sequence)序列接受号:
(1) mRNA 记录( NM_* ) :
<:NM_000492
(2)基因组的DNA 重叠群( NT_* ) :
<:NT_000347
(3)完整的基因组或染⾊体(NC_*) :
<:NC_000907
(4)基因组的局部区域(NG_*) :
<:NG_000019
(5)从⼈类基因组注释、加⼯得到的序列模型(XM, XP, or XR_* ):
<:XM_000483
● GenBank 记录中特性表中的主要关键词:
关键词解释关键词解释
misc_feature⽣物学特性⽆法⽤特性promoter转录起始区
表关键词描述的序列
misc_difference序列特性⽆法⽤特性表CAAT_signal真核启动⼦上游的 CAAT 关键词描述的序列盒 ,与 RNA 结合相关conflict 同⼀序列在不同的研究TATA_signal真核启动⼦的TATA盒中在位点或区域上有差
unsure序列不能确定的区域-35_signal原核启动⼦中的 -35 框
old_quence该序列对以前的版本做-10_signal原核启动⼦的Pribow 盒过修订
variation包含稳定突变的序列GC_signal真核启动⼦的GC盒modified_ba修饰过的核苷酸RBS核糖体结合位点
gene已识别为基因或已命名polyA_signal RNA 转录本的剪切识别的序列区域位点
misc_signal⽆法⽤信号特性关键词enhancer增强⼦
描述的信号序列
关键词解释关键词attenuator与转录终⽌有关的序列CDS
terminator转录终⽌序列sig_peptide rep_origin双链 DNA 复制起始区transit_peptide
misc_RNA⽆法⽤ RNA 关键词描述的mat_peptide
转录物或 RNA 产物解释
蛋⽩质编码序列编码信号肽的序列转运蛋⽩编码序列编码成熟肽的序列
prim_transcript初始转录本intron内含⼦
precursor_RNA前体 RNA polyA_site RNA 转录本的多聚腺苷
酸化位点
mRNA信使 RNA rRNA核糖体 RNA
5’ clip前体转录本中被剪切掉的tRNA转运 RNA
5’端序列
3’ clip前体转录本中被剪切掉的scRNA⼩细胞质 RNA
熊怎么写
3’端序列
5’ UTR5’⾮翻译区snRNA⼩核 RNA
3’ UTR3’⾮翻译区snoRNA加⼯和修饰rRNA 的⼩exon外显⼦核 RNA
关键词解释关键词解释immunoglobulin_related repeat_unit单个的重复元件
C_region免疫相关蛋⽩上的不变区LTR长末端重复序列
D_gment免疫球蛋⽩重链的可变Satellite卫星重复序列
区,
T 细胞受体β链
J_ gment免疫球蛋⽩重链、轻链以misc_binding⽆法描述的核酸序列
及 T 细胞α、β、γ的结结合位点
合链
身向榆关那畔行
N_ region插⼊重排免疫球蛋⽩⽚段primer_bind复制、转录的引物结
间的核苷酸合位点
S_ region免疫球蛋⽩重链的开关区protein_bind蛋⽩质结合区
V_ region编码免疫球蛋⽩的可变区STS测序标签位点
三年期存款利率N 末端的序列
V_ gment编码免疫球蛋⽩的可变区misc_recomb⽆法⽤重组特性关键
的序列词描述的重组事件repeat_region基因组中所包含的重复序iDNA通过重组所消除的列DNA
misc_structure⽆法⽤结构关键词描述的stem_loop发夹结构
核酸序列⾼级结构或构型
D_loop线粒体中 DNA 中的取
代环
◆GenBank 记录中特性表中的限定词:
限定词含义限定词含义
/allele=给定基因的等位基/codon_start=相对于序列第⼀个碱因基,编码序列密码⼦的
偏移量
/bound_moiety=嵌合范围/country=DNA 样本的来源国
/cell_type=获得序列的细胞类/db_xref=其他数据库信息的交型叉索引号
/citation=已被引⽤的参考⽂/direction=DNA 复制⽅向
献数
/clone_lib=获得序列的克隆⽂/environmental_sample=序列直接从环境材料库中获得⽽没有指明来
源物种
限定词含义限定词含义
/
exception=指明 DNA 序列未按通常的/PCR_conditi-ons=描述 PCR的反应条件⽣物学规律翻译,如RNA 编辑
/frequency=在种群中发⽣变异的频率/pop_variant=获得序列的群体变异种
名称
/germline如果序列是 DNA 并来源于/product=序列编码产物的名称免疫球蛋⽩家族,则表⽰该
序列来源于未重排DNA
/inrtion_q=序列来源于某种插⼊元件/anticodon=tRNA 反义密码⼦的位置
及它所编码的氨基酸
/isolate=序列来源的⽣物个体/cell_line=获得序列的细胞系
/lab_host=为扩增序列来源物种所⽤/chromosome=获得序列的染⾊体石钟山记翻译
的实验室宿主
/macronuclear指明 DNA 来源于染⾊体分/clone=获得序列的克隆⼦
化的⼤核期
/note=评论及附加信息/codon=指出与参考密码⼦不同
的密码⼦
/organelle=获得序列的细胞器/EC_number=序列产物的酶学编号
/sub_strain=获得序列的来源微⽣物亚/transl_table=描述在翻译中与通⽤密种码表不同的密码表
/tissue_type=获得序列组织类型/udin=表明该特性在其他检索
中也被使⽤
/translation=按通⽤或指定的密码⼦表/virion病毒颗粒
翻译的氨基酸序列
限定词含义限定词含义
/cons_splice=区分内含⼦剪切位点和/map=相关特性在基因图谱上的
“ 5-GT‘.AG-3' ”剪切位点位置
/cultivar=所获序列植物的栽培变种/mod_ba=被修饰碱基的简写
/dev_stage=序列来源于某种⽣物的特/number=从 5’→ 3’注明遗传元件的定发育阶段顺序
/evidence=序列特性来源于实验还是/organism=提供测序⽤遗传物质的物
推理种的科学名称
/focus指出在记录中的来源特性/phenotype=序列特性所导致的表型
在其他物种中还有不同的
来源特性
/function=序列所代表的功能/plasmid=获得序列的质粒名称
/haplotype=序列来源于某种物种的单/protein_id=蛋⽩质的检索号
倍体
/
isolation_sou-rce=描述序列来源物种的⽣/proviral整合在基因组中的前病毒
理、环境和地理信息
/label=序列特性的俗名/rearranged如果序列是 DNA 并来源于
免疫球蛋⽩家族,则表⽰该
序列来源于重排 DNA
限定词含义限定词含义
/rpt_family=重复序列/transposon=转座⼦
/rpt_unit=指明重复区域的重复元件/variety=获得序列的⽣物变
构成种
/rotype=同⼀物种的不同⾎清学特/pudo假基因
/
x=获得序列的物种性别/replace=表明特性间的间隔
序列已被替换
/specimen_vou-cher=指明来源物种保存于什么/rpt_type=重复序列的组织⽅
地⽅式
/strain=获得序列的菌珠/quenced_m-ol=获得序列的分⼦类
/sub_species=获得序列的来源物种的亚/rovar=同⼀原核⽣物的⾎
种清学特征
/tissue_lib=获得序列组织库/specific_host=获得序列的天然宿
/transgenic指明物种的来源特性是否/standard-name=特性的通⽤名称
是转基因受体
/transl_except=标明序列中未按指定密码/sub_clone=获得序列的亚克隆
⼦表翻译的氨基酸的位置
◆BLAST
1.blastn (nucleotide blast) 是核酸序列到核酸库中的⼀种查询。库中存在的每条已知序列都将同所查序列作⼀对⼀地核酸序列⽐对。
2.blastp (protein blast) 是蛋⽩序列到蛋⽩库中的⼀种查询。库中存在的每条已知序列
将逐⼀地同每条所查序列作⼀对⼀的序列⽐对。
3.blastx 是核酸序列到蛋⽩库中的⼀种查询。先将核酸序列翻译成蛋⽩序列(⼀条核
酸序列会被翻译成可能的六条蛋⽩),再对每⼀条作⼀对⼀的蛋⽩序列⽐对。
4. tblastn 是蛋⽩序列到核酸库中的⼀种查询。与blastx 相反,它是将库中的核酸序列
翻译成蛋⽩序列,再同所查序列作蛋⽩与蛋⽩的⽐对。
留美坐家5.tblastx 是核酸序列到核酸库中的⼀种查询。此种查询将库中的核酸序列和所查的核
酸序列都翻译成蛋⽩(每条核酸序列会产⽣ 6 条可能的蛋⽩序列),这样每次⽐对会产⽣ 36 种⽐对阵列。Accession Molecule Method Note
AC_123456Genomic Mixed Alternate complete genomic
molecule. This prefix is ud
for records that are provided to
reflect an alternate asmbly
or annotation. Primarily ud
for viral, prokaryotic records. AP_123456Protein Mixed Protein products; alternate
protein record. This prefix is
ud for records that are
provided to reflect an
alternate asmbly or
annotation. The AP_ prefix was
originally designated for
bacterial proteins but this糖拌番茄
usage was changed.
NC_123456Genomic Mixed Complete genomic molecules
including genomes,
chromosomes, organelles,
plasmids.
NG_123456Genomic Mixed Incomplete genomic region;
青果
supplied to support the NCBI
genome annotation pipeline.
Reprents either
non-transcribed pudogenes,
or larger regions reprenting
a gene cluster that is difficult
to annotate via automatic
methods.

本文发布于:2023-05-31 19:18:59,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/957862.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   获得   特性   核酸   关键词   转录   来源
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图