3D型认识lncRNA
转⾃肽度时界
1.认识⼀下长⾮编码RNA
定义
⾮编码RNA (non-coding RNA,ncRNA)指不翻译成多肽的RNA。按照长度不同,短于200nt的归为⼩⾮编码RNA (small ncRNAs,sncRNAs),长于200nt的归为长⾮编码RNA (long ncRNAs,lncRNAs)。
分类
根据染⾊体上与编码基因的相对位置将lncRNA分为反义型(antin lncRNAs)、内含⼦型(intronic lncRNAs)、反向型(divergent lncRNAs)、基因间型(intergenic lncRNAs)、启动⼦上游型(promoter upstream lncRNAs)、启动⼦型(promoter-associated lncRNAs)、转录起始位点型(transc ription start site-associated lncRNAs) [1, 2] (图1)。
图1. 根据染⾊体上与编码基因的相对位置对ncRNA进⾏分类。
lncRNAs作⽤范围⼴泛,机制⾮常复杂,这⾥从基因调控的⾓度重点讲⼀讲。为了⽅便⼤家的理解,咱们来看看lncRNA的特点。简单讲,lncRNA的本质是RNA,是由核苷酸组成的长链,有以下⼏个优势:(1) 可以轻松的与同源DNA序列(转录lncRNA的基因以及序列相似的基因)结合;(2) 可以轻松的与同源RNA序列结合;(3) 其丝带般的特点可以折叠成复杂的⼆级结构,轻松与多种蛋⽩质结合。也就是说,lncRNA情商极⾼,与上层领导(DNA)关系暧昧,与同事(RNA)关系很铁,与下属(蛋⽩质)关系紧密。这样⼋⾯玲珑的lncRNA那肯定是相当吃得开啊。
2.lncRNA参与转录前调控
顾名思义,转录前调控就是对转录事件发⽣之前的准备阶段进⾏调控,主要指染⾊质开放或关闭状态的调控——想要使原来不转录的基因开启转录,就需要染⾊质从关闭状态转换为开放状态;想要使原来转录的基因不再转录,就需要染⾊质从开放状态转换为关闭状态。染⾊质的状态由表观修饰因⼦决定:富含H3K4me3、H3K36me3及组蛋⽩⼄酰化等激活型组蛋⽩修饰的为开放状态;富含H3K9me3、H3K27me3、H4K20me3及DNA甲基化等抑制型组蛋⽩修饰的为关闭状态。表观修饰是由表观因⼦催化建⽴或擦除的,表观因⼦的本质是蛋⽩,那么问题来了,蛋⽩质结构是固定的,但基因组DNA序列变幻莫测,那究竟怎么实现染⾊质状态的精确调控呢?这时候就到⼋⾯玲珑的lncRNA出场的时候了——lncRNA以其中⼀部分区域与DNA结合,然后其他部分折叠成⾼级结构,与表观因⼦结合,这样就轻松地牵了线,搭了桥
2.1 lncRNA调控组蛋⽩修饰
>>>>Xist与顺式H3K27me3建⽴
X染⾊体失活(X chromosome inactivation,Xi)是哺乳动物雌性个体的⼀种剂量补偿效应[3],通过抑制型表观修饰锁住⼀条X染⾊体。Xist (X染⾊体失活特异转录本,X chromosome inactivation specific transc ript)是X染⾊体失活中⼼内鉴定出的第⼀个Xi相关基因,也是最关键的Xi调控基因。Xist能顺式(in cis)包裹X染⾊体,并募集异染⾊质修饰蛋⽩PRC2等建⽴
true blueH3K27me3,引起转录沉默,最终导致整条染⾊体失活[4],该过程有lncRNA RepA (Xist基因5’端的腺嘌呤重复区转录本)的协同参与(图2)[5]。
图2. Xist与RepA协同包裹X染⾊体并募集PRC2建⽴H3K27me3引起X染⾊体失活。
>>>>Bxd与顺式H3K4me3建⽴
果蝇Hox基因簇内研究的⾸个lncRNA是Bxd (似双胸转录本,Bithoraxoid),其基因座是位于UBx基因(超级双胸基因,Ultrabithorax)和Abd-A基因之间的调控序列——ubx-TRE (Ubx基因相关顺式三胸复合体反应元件,Ubx cis-regulatory trithorax respon elements)。Sanchez-Elsner对果蝇成⾍盘细胞及S2细胞的研究表明,Bxd能与ubx-TRE结合并募集TrxG成员组蛋⽩甲基转移酶ASH1,激活Ubx转录[6]
(图3)。
图3. Bxd与ubx-TRE结合并募集ASH1激活Ubx转录。
>>>>HOTAIR与反式H3K27me3建⽴及H3K4me3擦除
HOTAIR是⽬前研究较清楚的参与⼈Hox基因簇调控的关键基因之⼀。HOTAIR位于Hoxc11和Hoxc12之间,通过与两个关键的组蛋⽩修饰复合体相互作⽤,反式(in trans)调控HoxD基因簇的表达:催化H3K27me3建⽴的PRC2复合体[7],及催化H3K4me2/3擦除的LSD1-CoREST-REST复合体(组蛋⽩特异性去甲基化酶1 - RE1结构域转录抑制因⼦共抑制因⼦1 - RE1结构域转录抑制因⼦复合体,lysine-specific demethyla1-RE1-Silencing Transc ription factor corepressor 1-RE1-Silencing Transc ription factor complex,LSD1-CoREST-REST)[8](图4)。图4. HOTAIR通过与两个组蛋⽩修饰复合体相互作⽤反式调控HoxD基因簇的表达。
>>>>HOTTIP与顺式H3K4me3建⽴
好听的英文歌曲名字HOTTIP (HoxA基因簇末端转录本,HoxA transc ript at the distal tip)对HoxA基因簇5’区域基因(Hoxa13⾄Hoxa6)的表达具有调控功能。2011年,Wang, K. C.等[9]的研究表明,HOTTIP通过WDR5 (衔接蛋⽩WD重复序列蛋⽩5,WD repeat-containing protein 5)募集MLL (混合型⽩⾎病相关蛋⽩复合
体,Mixed lineage leukemia)⾄HoxA基因簇5’区域,催化建⽴激活型染⾊质修饰H3K4me3,顺式激活Hoxa11和Hoxa13等基因的表达(图5)。
图5. ⼈HOTTIP通过WDR5募集MLL⾄HoxA基因簇5’区域,催化建⽴H3K4me3,顺式激活基因表达。
obvious的意思
>>>>Mira与顺式H3K4me3建⽴
Bertani等以视黄酸(Retinoic acid,RA)处理的⼩⿏胚胎⼲细胞系(mES)为实验材料,通过RNA-ChIP (RNA-染⾊体免疫沉淀,RNA-chromatin immunoprecipitation)等技术研究发现,Mira能与其基因座形成DNA/RNA杂合体,并募集TrxG复合体成员MLL1,催化建⽴H3K4me3,激活相邻基因Hoxa6与Hoxa7的表达,导致mES向⽣殖系分化[10](图6)。
图6. Mira通过募集MLL激活相邻Hoxa6与Hoxa7基因的表达。
>>>>Evf2与组蛋⽩去⼄酰化
aeis
元旦英语怎么说DLX5和DLX6间的极端保守区(ultraconrved region)含2个Dlx5/6相关增强⼦(Dlx5/6-Enhencer,Dlx5/6-E,Dlx5/6-EI;Dlx5/6-EII)。Evf2是Dlx5/6-E相关的转录本。利⽤荧光素酶报告系统,Feng等发现在体外Dlx2存在条件下,Evf2能增强含Dlx5/6-E的SV40等启动⼦的转录活性,并且是剂量依赖的,但DLX2本⾝没有这种功能,表明Evf2可能作为DLX2的共激活因⼦(co-activator)增强Dlx5/6增强
⼦活性[11]。⽽Evf2在低浓度条件下则能通过其Dlx6反义特性顺式抑制Dlx6转录,通过募集MECP2,进⽽募集HDAC,使组蛋⽩去⼄酰化,抑制Dlx5基因的转录(图7)。
图7:Evf2在⾼浓度条件下作为DLX2的共激活因⼦,增强Dlx5/6增强⼦活性,激活Dlx5及Dlx6转录。Evf2在低浓度条件下能通过其Dlx6反义特性顺式抑制Dlx6转录,通过募集MECP2,进⽽募集HDAC,抑制Dlx5。
>>>>asOct4-pg5与反式H3K27me3及H3K9me3的建⽴
Oct4的表达受到asOct4-pg5的调控。asOct4-pg5是Oct4假基因5 (Oct4 pudogene 5, Oct4-pg5)的反义⽆poly(A)结构lncRNA。asOct4-pg5能募集EZH2及G9a等组蛋⽩甲基转移酶结合到Oct4及Oct4-pg5启动⼦区,建⽴H3K27me3、H3K9me3等抑制型染⾊质修饰,进⽽抑制Oct4及Oct4-pg5的转录;⽽当asOct4-pg5与PURA (富嘌呤元件结合蛋⽩A,purine rich element binding protein A)及NCL(核仁蛋⽩,nucleolin)结合后会失去募集EZH2及G9a的能⼒,抑制功能消失[12] (图8)。
图8. asOct4-pg5与Oct4表达调控。A:存在⼀种Oct4-pg5反义的⽆poly(A)结构的lncRNA——asOct4-pg5。B:asOct4-pg5能募集EZH2及G9a等组蛋⽩甲基转移酶结合到Oct4 (或Oct4-
pg5,图中未显⽰)启动⼦区,建⽴H3K27me3、H3K9me3等异染⾊质修饰,进⽽抑制Oct4的转录。C:当asOct4-pg5与PURA及NCL结合后会失去募集EZH2及G9a的能⼒。
>>>>ANRIL (p15AS)与H3K4me3、H3K9me3及H3K27me3
Hann等发现了INK4基因座反义⾮编码RNA,命名为ANRIL (antin noncoding RNA in the INK4 locus),Yu等也发现了INK4基因座反义⾮编码RNA,命名为p15AS [13],为⽅便起见统⼀命名为ANRIL。RACE分析表明ANRIL并⾮单⼀转录本,有很多剪接形式存在,甚⾄有环状的ANRIL (circular ANRIL,cANRIL)[14]。研究表明,ANRIL能顺式(主要模式)及反式作⽤于
INK4β基因的启动⼦及外显⼦1,导致H3K4me3⽔平降低,H3K9me3⽔平升⾼,促进异染⾊质形成,引起INK4β转录沉默[13] (图9)。
以⼈前列腺癌细胞系PC-3为材料,Yap等发现RNA polII转录的新⽣的ANRIL能与PRC1组分CBX7 (Chromo结构域蛋⽩同系物7,Chromobox protein homolog 7)结合,促进异染⾊质形成,同时形成的ANRIL-CBX7复合体能解除CBX7与H3K27me3的结合,使转录抑制处于⼀种动态变化状态[15] (图9)。Kotake等的研究表明,INK4β/INK4α/ARF基因簇H3K27me3等抑制型修饰的建⽴,是ANRIL募集PRC2实现的,其中ANRIL与亚基SUZ12结合,顺式抑制INK4β的转录[16](图9)。
图9. 新⽣的ANRIL能与CBX7结合,促进异染⾊质形成,同时形成的ANRIL-CBX7复合体能解除CBX7与H3K27me3的结合,使转录抑制处于⼀种动态变化状态。ANRIL募集PRC2,使
经理英文
INK4β/INK4α/ARF基因簇建⽴H3K27me3等抑制型修饰。ANRIL与SUZ12结合,顺式抑制INK4β的转录。
>>>>DBE-T与顺式H3K36me2建⽴
⾯肩胛臂肌⾁萎缩(facioscapulohumeral muscular dystrophy,FSHD)是⼀种常染⾊体显性遗传疾病,是由于D4Z4重复序列拷贝数降低导致的。FSHD病⼈由于D4Z4重复序列拷贝数降低,导致DBE-T (D4Z4重复序列结合元件转录本,D4Z4 repeat binding element transc ript)特异性转录[17]。Cabianca等的研究表明,D4Z4重复序列的丢失,导致PcG蛋⽩不能与该区域结
英语爱情签名合,PRC2建⽴的H3K27me3及PRC1建⽴的抑制型修饰H2AK119ub1 (组蛋⽩H2A第119位赖氨酸残基单泛素化,histone H2A lysine 119 monoubiquitination)丢失[17, 18];同时,DBE-T是⼀种染⾊质定位的lncRNA,能顺式的通过募集TrxG蛋⽩成员Ash1L⾄4号染⾊体长臂第35区
(4q35),催化建⽴激活型修饰H3K36me2 (组蛋⽩H3第36位赖氨酸残基⼆甲基化,histone H3 lysine 36 dimethylation),导致染⾊质重塑,激活4q35区域基因的转录,最终导致FSHD疾病的发⽣[17](图10)。
图10. DBE-T能顺式募集Ash1L⾄4q35区,催化建⽴激活型染⾊质修饰H3K36me2,激活4q35区基因转录,最终导致FSHD疾病的发⽣。平面设计师培训班
>>>>NeST与反式H3K4me3建⽴
NeST (nettoie Salmonella pas Theiler’s [cleanup Salmonella not Theiler’s])是发现的⾸个与免疫反应相关的lncRNA。在⼩⿏中,其基因座与γ⼲扰素基因(Interferon-γ,Infg)毗邻。NeST最初被认为是泰勒病毒(Theiler’s virus)易感位点。NeST定位于细胞核内,属于增强⼦型lncRNA。在活化的CD8+ T细胞中,NeST通过与衔接蛋⽩WDR5结合,募集MLL,反式激活Ifng (图11),从⽽提⾼了抗肠炎沙门菌亚属⿏伤寒病毒(Salmonella enterica Typhimurium)的能⼒[19]。
图11. 在活化的CD8+ T细胞中,NeST通过与衔接蛋⽩WDR5结合,募集MLL反式激活Infg。>>>>ncRNA-CCND1与顺式组蛋⽩⼄酰化
研究发现,在受到电离辐射后,CCND1启动⼦及5’调控区转录形成多种ncRNA-CCND1 (细胞周期蛋⽩D1的5’调控区相关⾮编码转录本,ncRNAs transcribed from the cyclin D1 5’ regulated region),这些含寡聚GGUG的lncRNA能结合并激活TLS (脂肪瘤内异位蛋⽩,translocated in liposarcoma),进⽽顺式募集TLS⾄CCND1启动⼦的CRE区(CREB调控元件,CREB regulate element),抑制CBP、EP300等的组蛋⽩⼄酰化转移酶(histone acetylation transfera,HAT)活性。由于CCND1的转录依赖H3K9/K14ac (组蛋⽩H3第9位及第14位赖氨酸残基⼄酰
化,histone 3 lysine 9/14 acetylation),因此CBP/EP300 HAT活性的抑制直接导致CCND1沉默[20] (
图12)。
图12. CCND1启动⼦及5’调控区转录形成多种ncRNA-CCND1,这些含寡聚GGUG的lncRNA⼀⽅⾯能结合并激活TLS,另⼀⽅⾯则顺式募集TLS⾄CCND1启动⼦的CRE区,抑制CBP、
EP300等的HAT活性,导致CCND1沉默。
>>>>PTENpg1 uasRNA α及PTENpg1 asRNA α与异染⾊质化
carvingPTEN (磷酸酶与张⼒蛋⽩同源蛋⽩,phosphata and tensin homolog)基因是⼀种肿瘤抑制基因[21]。研究表明,PTEN的假基因1 (PTEN pudogene,PTENpg1)[22]以及PTENpg1的反义RNA(PTENpg1 antin RNA,PTENpg1 asRNA)[23]均属于lncRNA基因,参与了PTEN的表达调控。
PTENpg1 asRNA有三种:未剪切的PTENpg1 uasRNA α、剪切的PTENpg1 asRNA α及PTENpg1 asRNA β。PTENpg1 uasRNA α及PTENpg1 asRNA α能反式作⽤于PTEN启动⼦区,募集DNMT3a及EZH2导致PTEN启动⼦区异染⾊质化,从⽽在转录前⽔平抑制PTEN的表达。
PTENpg1 asRNA β则能与PTENpg1相互结合,增加PTENpg1的稳定性并促进其出核进⼊胞质,同时,PTENpg1可作为ceRNA,吸附针对PTEN的miRNA,从⽽削弱了miRNA对PTEN的负调控,增强
了PTEN mRNA的稳定性,在转录后⽔平促进PTEN的表达[23] (图13)。
图13. PTENpg1 uasRNA α及PTENpg1 asRNA α能反式作⽤于PTEN启动⼦区,募集DNMT3a 及EZH2导致PTEN启动⼦区异染⾊质化,从⽽在转录前⽔平抑制PTEN的表达;PTENpg1 asRNA β则能与PTENpg1相互结合,增加PTENpg1的稳定性并促进其出核进⼊胞质,同时能增强PTENpg1吸附针对PTEN的miRNA的能⼒,从⽽削弱了miRNA对PTEN的负调控,增强了PTEN mRNA的稳定性,在转录后⽔平促进PTEN的表达。
>>>>Kcnq1ot1与Kcnq1基因座沉默
基因印记是⼀种表观遗传机制,是⼀种⼆倍体细胞中⽗母亲本特异的基因表达模式。为什么哺乳动物放弃⼆倍体优势⽽进化出印记沉默系统是⾃印记现象发现以来⼀直困扰⽣物学者们的难题之⼀。
印记基因⼀般成簇存在,印记基因簇受印记调控元件(Imprinting control element,ICE)的调控[26]。印记基因簇的共同特征是都含有配⼦差异性DNA甲基化区域(Differentially DNA-methylated region,DMR)。⽬前定义了两种印记基因簇:Igf2r、Kcnq1、Gnas、Pws等印记基因簇的DMR在卵⼦成熟过程中获得母源甲基化印记,这种含母源DNA甲基化印记DMR的印记基因簇为I型印记基因簇;Igf2、Dlk1、Rasgrf1等印记基因簇在精⼦发⽣过程中获得⽗源甲基化印记,这种含⽗源DNA甲基化印记DMR的印记基因簇为II型印记基因簇。
印记基因簇中⾄少含1个lncRNA [27, 28],但这些lncRNA的调控功能还需要进⼀步的研究。⽬前认为I型印记基因簇的印记状态的稳定与lncRNA的表达有关。Pandey等证明Kcnq1ot1能募集G9a及PRC2,催化建⽴H3K27me3及H3K9me3等异染⾊质修饰,导致Kcnq1基因座沉默[29];Faizaan等发现Kcnq1ot1能与DNMT1形成复合体,催化建⽴DNA甲基化,导致Kcnq1基因座沉默[30](图14)。
图14. Kcnq1ot1能募集G9a及PRC2,催化建⽴H3K27me3及H3K9me3等异染⾊质修饰,还能募集DNMT1,催化建⽴DNA甲基化,导致Kcnq1基因座沉默。
>>>>pRNA与rDNA异染⾊质化
在mES中,pRNA前体IGS-rRNA (intergenic spacer rRNA)抑制TTF-1 (RNA聚合酶I转录终⽌因⼦1,RNA polymera I transc ription termination factor 1)与TIP5 (TTF-1互作蛋⽩5,TTF1-interacting protein 5)的结合,保护rDNA不被异染⾊质化,⽽在mES分化后,IGS-rRNA被加⼯成成熟的pRNA,pRNA介导TTF-1与TIP5形成复合体,进⽽将其募集⾄rDNA启动⼦区域,造成DNMT家族及PARP1的富集,最终导致rDNA异染⾊质化[24, 25](图15)。
图15. mES分化后成熟的pRNA通过介导TTF-1与TIP5形成复合体进⽽促进rDNA异染⾊质化。
>>>>lncRNA与裂殖酵母臂间区异染⾊质化
在裂殖酵母,臂间区外侧重复序列的转录及其下游过程与异染⾊质建⽴相关[31]。裂殖酵母异染⾊质建⽴的机制有2种假说:(1) siRNA机制,即RNA聚合酶II (RNA polymera II,RNA PolII)先起始转录产⽣lncRNA,然后RDRC (RNA指导的RNA聚合酶复合体,RNA-directed RNA polymera complex)识别并结合正在转录的lncRNA,合成双链RNA (double strand快速全身美白
RNA,dsRNA),同时RDRC的Cid12亚基催化dsRNA末端多聚腺苷酸化,进⽽被Dicer识别结合并加⼯成siRNA,组成RITS,其Argonaute (Ago1)亚基结合siRNA并与正在转录的重复序列lncRNA结合,其含chromo结构域的Chp1亚基则与H3K9me2/3结合,募集组蛋⽩甲基转移酶Clr4及异染⾊质结合蛋⽩Swi6等,实现异染⾊质化(图16);(2) 组蛋⽩修饰H3K9me2/3直接募集RITS及RDRC⾄正在转录的异染⾊质lncRNA上,不涉及siRNA。
图16. 裂殖酵母异染⾊质形成机制
2.2lncRNA调控DNA甲基化修饰
>>>>Tsix与DNA甲基化
Tsix (跨越Xist全长的反向⾮编码RNA)是最主要的Xist负调控基因。Tsix能结合于Xist基因5’端两CTCF (CCCTC结合因⼦,CCCTC-binding factor)结合域之间,募集抑制型表观因⼦(如CTCF、DNMT、EE
D [32]),催化DNA甲基化(主要)及H3K9me3 (次要)的建⽴[33]。Jpx则通过结合CTCF抑制了CTCF对Xist的转录抑制,从⽽起到激活Xist转录的作⽤[34] (图17)。
图17. Tsix通过募集CTCF等使Xist启动⼦区甲基化⽽抑制Xist转录,Jpx则通过结合CTCF抑制了CTCF对Xist的转录抑制。