大学教材pdf下载网站科普长链⾮编码RNA(Longnon-codingRNAs)命名原则
it英语doubted长链⾮编码RNA(lncRNA)是⼀类转录本长度超过200nt的RNA分⼦,它们并不编码蛋⽩,⽽是以RNA的形式在多种层⾯上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达⽔平。lncRNA起初被认为是基因组转录的“噪⾳”,是RNA聚合酶II转录的副产物,不具有⽣物学功能。然⽽,近年来的研究表明,lncRNA参与了X染⾊体沉默,基因组印记以及染⾊质修饰,转录激活,转录⼲扰,核内运输等多种重要的调控过程,lncRNA的这些调控作⽤也开始引起⼈们⼴泛的关注。根据lncRNA在基因组上的位置,可将其分为5种类型:1. n, 2. antin, 3. bidirectional, 4. intronic, 5.intergenic。
对于⼈类基因命名标准的制定⽽⾔,⾬果基因命名委员会(HGNC)是唯⼀官⽅授权的机构。HGNC的数据库中有38000个基因名称,其中⼤部分是编码蛋⽩基因;但HGNC也命名了8500多个⼈类⾮编码基因及假⾮编码基因,通过与各层次专家们的合作,他们命名了⼤多数的⼩⾮编码RNA。
lncRNA命名指导标准
⼀条lncRNA要命名得合理准确,有⼀些原则需要去遵循,有许多的因素需要去注意。详细的命名原则及考虑因素如下:国际贸易专业
lncRNA的名字应具有唯⼀性
“名字唯⼀性”这条原则很重要,不能违反。它能让我们在研究分析某个基因时不会产⽣问题(不会发⽣这种事情:⼀条基因⼏个名字,存在重名的基因等)。另⼀⽅⾯,上述问题也不利于HGNC对命名规则的管理及维护。如果⼀个作者发布⼀个lncRNA名字,⽽它已经在别的地⽅使⽤过,HGNC将会指定⼀个新的名字供选择。例如,⼀个新的lncRNA,它的功能是维持上⽪细胞在⾮分化状态,本来打算命名为ANCR,但是这个名字已经被使⽤于“快乐⽊偶综合症染⾊体区,Angelman syndrome chromosome region”,所以与作者达成⼀致,⽤DANCR来命名这个lncRNA“ differentiation antagonizing non-protein coding RNA”.
lncRNA的名字应是描述基因的缩写
每条lncRNA的标识都应是⼀个描述该基因的“缩写”或者“⾸字母简写”。
例如BANCR就是由‘BRAF-activated non-protein coding RNA’短语的⾸字母排列⽽成。这样让⼈们容易理解名字的含义。
lncRNA的名字应仅由拉丁字母和阿拉伯数字组成
每条lncRNA的标识中不应出现标点符号,但可以⽤字母或者数字来代替标点符号。
连字符仅在特殊场合使⽤。例如:反义编码蛋⽩基因可在标识中加连字符(BACE1-AS就是BACE1 a
ntin RNA的名字)。
篮板球rebound
lncRNA的名字中的字母应为⼤写
为了与其它种类物种的基因区别开来(如啮齿动物基因的标识只要求⾸字母⼤写,其余⼩写),⼈类基因标识中的字母都应为⼤写。
例如“热⽓”(HOTAIR)基因,在⼈类中叫HOTAIR,⽽在⽼⿏中写成Hotair。
lncRNA的名字中不应涉及具体的物种类型
例如:如果基因名字中有H/h(代表⼈类),由于牵涉到同源基因的问题,就会造成⼀些疑惑和误导。
lncRNA的标识应避免采⽤⼀些常⽤的词汇
基因的名字中出现的常⽤词汇会带来⼀些混乱,给分析研究带来很多问题,因此,在命名中应避免出现常见词汇。
例如:“AIRN”基因最初公布时叫‘AIR’,从公共数据库中搜索可得到22万条不相关的信息,⽽搜索“AIRN”则只有10条信息。可见“AIRN”的搜索效率有效得多。同样的例⼦很多。
lncRNA的标识应尽可能的反映其功能
毛遂自荐翻译例如:'XIST'基因是'X (inactive)-specific transcript'的缩写,该基因的作⽤是参与沉默⼀对X染⾊体的转录。
命名的时候尽量反映基因通常的功能,⽽不体现其突变表型。基因的命名应简洁明了,不应包含太多信息。
•基因的标识中不应具有攻击或轻蔑的⾊彩。
•基因的标识中不应具有个⼈及地⽅⾊彩。
•基因的标识中不应含有神化,虚构或历史⼈物的名字。
•基因的标识中不应含有“臆想”和没什么意义的信息。
功能性转录假基因应包含它们假基因的名字
⽬前,⼀些数量较少的转录假基因被发现具有功能性,例如PTENP1基因就与“PTEN-targeting”miRNA结合⼀起参与调节PTEN的表达⽔平。
具有功能的转录假基因在命名时应保留它们的假基因名称,并且不应改变其基于功能的名称。为了⽅便搜索,这个功能应加在标识的最后。PTENP1的命名就是这⽅⾯的例⼦。PTENP1 是‘phosphata and tensin homolog pudogene 1 (functional)’.
lncRNA命名的五种⽅式介绍:
1. 根据lncRNA与疾病的关系,⽐如:
CCAT1:Colon cancerassociated transcript-1;
MIAT :myocardial infarction associated transcript,也叫RNCR2 (retinal non-coding RNA 2);
UCA1:Urothelial carcinoma associated 1 ,
HULC:Highly Upregulated in Liver Cancer。
中日在线翻译器
2. 根据lncRNA与周围基因的位置,⽐如:
BACE1-AS:BACE1 antin RNA;
HIF1A-AS2:LncRNA hypoxia inducible factor 1alpha antin RNA-2
lincRNA HOTAIR:lincRNA HOX transcript antin RNA;
HOTTIP:lncRNA HOXA transcript at the distal tip (HOTTIP)
⽽lncRNA asf的命名就直接是调控靶基因Fas的字母反过来。
3. 根据lncRNA与基因上下游的调控关系,⽐如:
BANCR:BRAF-regulated lncRNA 1,
ATB : lncRNA-activated by TGF-β,
PANDA:P21-associated noncoding RNA DNA damage-activated。
4. 根据lncRNA参与的⽣物学功能,⽐如:
LincRNA-ROR:Long Intergenic Non-Protein Coding RNA, Regulator Of Reprogramming,Xist: X-inactive-specific transcript,
GAS5:growth arrest-specific 5。
5. 根据在细胞内的定位,⽐如:
Neat1: LncRNA nuclear-enriched abundant transcript 1。
如何命名未知功能的基因应遵循如下要求
jht未知功能的lncRNA应依据基因组上下⽂来命名,下图中给出如何系统化的命名的规则。
未知功能的lncRNA命名规则actv
如果有⼀个很接近的蛋⽩编码基因,lncRNA的名字应该以这个编码基因名字开始,然后制定以后后缀,这个后缀可以下⽅式分类:
反义(antin,AS),BACE1-AS;
内含⼦(intronic,IT),例如,SPRY4-IT1;
重叠(overlapping,OT),例如,OSX2-OT;
长链基因间lncRNA(Long intergenic lncRNAs,lincRNAs),以LINC为前缀,数字为后缀,例如LINC00485.
本质上以上命名原则是以GNECODE的注释⽬录为基准,反义RNA,正义内含⼦,正义重叠和长链基因间⾮编码RNA(lincRNA).⼀些新的分类⽅法也应该考虑,特别对这些lnRNA,它们与编码基因是头碰头(head to head),因此推断它们拥有双向启动⼦,HGNC推荐命名这些lncRNA为反义上游(Antin upstream,AU),例如,GENE2-AU1。⼤家也应该注意到HGNC并不赞成以剪接变异体来命名,所以两个剪接变异体命名是以其中⼀个 lncRNA基因来命名,例如,GENE2-AS1;如果⼀个lncRNA基因编码的转录本跨多于⼀个蛋⽩编码基因,⽤lncRNA的5’末端的第⼀个蛋⽩编码基因来命
名,例如GENE-AS2
上述命名的基本架构适⽤于⼤多数lncRNA,但对于基因密集区域的lncRNA可能就不适⽤了,这种情况下,你应该与HGNC沟通来解决。
HGNC致⼒于让⼈类基因组中lncRNA的命名有效、规范。
想了解更多相关内容请访问vaginacontest