RNA的防护:CRISPRs保护原核生物免受移动基因元件
(第2组翻译人员:黄亚宁,李淑娟 字秋艳,陆晓媚 ,匡双便,徐蕾 )
摘要:在原核生物中CRISPR/Cas 体系提供了对入侵病毒和质粒的抗性。在机制中有三个明显的阶段已经被识别。首先,入侵的片段DNA作为间隔区(spacer)整合到重复的CRISPR位点。随后,CRISPR被转录,而转录物被Cas绯闻少女第一季蛋白反复地裂开,生成短包的RNA(crRNA),crRNA含有spacer序列。最后,crRNA指导Cas蛋白机械mechiery到互补的入侵目标,或是DNA或是RNA,从而抑制病毒后质粒的增值。这篇文章,我们讨论了现在已经了解到的这种神奇的具有遗传性的防御系统,并描述与真核生物中RNAi功能的相似性和区别。
大纲:
1 引言 2 CRISPR位点和Cas基因
3 作用方式 4 与真核生RNAi的类比
5 结论 参考文献
1 引言
通过有移动遗传元件的基因材料的连续性交换,来显著地影响到质量和数量的微生物的进化。病毒存在于地球上大多数丰富的实体中(Bergh等人1989;Wommack和Colwel等人2000),他们通过一系列的活动来进行扩增:病毒吸附到宿主的细胞壁,穿过细胞膜注入病毒基因组(DNA或RNA),病毒基因组的表达,病毒基因组的复制以及病毒蛋白衣的组装,最后是子代病毒的释放(Sturino 和 Klaenhammer,2004)。质粒是另外一种独立的可移动元件。质粒进入到宿主寄主后,或是游离在细胞质或是作为宿主基因组的整合序列。质粒可以通过结合作用从供体细胞转运到受体,利用专用的转移系统(Llosa等人。2002)。
尽管偶然功能的获得是水平基因转运的结果,与可移动元件的重组也可以引起严重破坏(或是结构上的破坏或是宿主基因组的调控区域导致的功能丧失)。另外,噬菌体感染可能最终导致宿主细胞的裂解。为了避免这些有害的影响,复杂机制进行演变从而防御宿主生物体核酸受可遗传性元件的入侵。几种防御系统已经认识了,原核生物中的免疫系统与真核生物有很大不同。一个被动式防御机制可以作用在病毒粒子吸附的水平或是注入它的
遗传物质。宿主中病毒受体蛋白的自发突变可以扰乱病毒的附着和遗传物质的注入,但不应先感到宿主的健康,比如说,但大肠杆菌的麦芽糖孔蛋白使用λ-噬菌体(197太空陨石)。而众所周知的主动防御机制是限制性-修饰(R-M)系统。专一的甲基化转移酶类修饰了宿主DNA中可能破裂的位点,防止被限制酶解链。引入外来的DNA缺乏这些修饰,因此可以被内切酶有目的的消化(回顾, Tock和Dryden,2005)。额外的作用机制呈现了与真核生物细胞凋亡的功能相似性,这个机制是原核生物失败的感染机制(Abi)。这个机制抑制噬菌体的增值,或是通过阻塞噬菌体的复制机构或是通过抑制宿主的翻译。这个结果是宿主和病毒都死亡,它们的牺牲保全剩下的躯体(Chopin等人。2005)。
近年来,另外一个防御机制已经被发现,这个机制是基于集群规律性穿插短回文重复序列(CRISPRs)和CRISPR关联的基因(cas基因)。CRISPR/Cas体系可以将来自入侵的可移动元件的核酸片段整合到短的成熟RNAs(crRNAs).这些crRNAs特定地指导Cas的蛋白机构到它们互补的目标:或是来自侵入的病毒或质粒的DNA或是RNA。因此,CRISPR/Cas体系可以提供宿主获得可遗传的抗性(回顾Sorek等人。2008; 先人Oost等人。2009; Horvath和Barrangou 2010; Karginov和Hannon 2010;Marraffini和Sontheimer2010a)。这篇文章,我们叙述了CRISPR/Cas过去将来时体系作用机制的特征,并讨论
了与真核生物RNA干扰的相似处和不同之处。好翻译
2 CRISPR位点和Cas基因
CRISPRs在1987年首次发现,当一个来自大肠杆菌K12的染色体片段被测序(Ishino等人。1987)。从那以后,许多CRISPR序列在真核生物中被识别(概述看:crispr.u-psud.fr/crispr/CRISPRdataba.php)。CRISPRs中48%的细菌组的序列已经被检测出,其中95%的序列为古细菌的基因组。
CRISPRs由一簇相同的重复序列组成,这些序列被不全相同的相似长度的间隔序列分开(见后面的讨论)。CRISPR的排列常常是在前面的是多达500个碱基对的富含AT的引导肽序列(Jann等人。2002)。每个基因组CRISPR位点的数量冲cherokee1到20submitting,长度变化从很小到上百的重复间隔对。目前最长记录是绿弯菌属的CRISPR,有374重复序列和间隔区。CRISPR12种主要的类型已经被提议,以重复序列的相似性为依据(Kunin等人。2007)。重复序列的大小变化从24到47bp,因此,间隔区的大小从24到72bp。这个重复序列和间隔区的大小典型地在30bp左右。一些重复序列有编码潜在牢固二级结构的CRISPR RNAs的回文序列,因此,其他序列似乎缺少这种序列(图1B)。每一簇主要和一种Cas的亚型相关,在后面讨论。在2005年,三个不同的研究小组独立地观察到至少一个间隔序列的子集是与噬菌体和质粒DNA序列是相同的(Bolotin等人,2005; Mojica等人,2005; Pourcel等人,2005)。匹配间隔序列的病毒或质粒片段叫做原间隔(Deveau等人,2008)。来源于病毒序列的间隔序列导致了假设,即CRISPR/Cas体系可能涉及到原核生物对外来核酸的抗性(回顾Makarova2006)。CRISPR的组成是超变量,在宿主环境中快速地被染色体外的元件所塑造(Lillestol等人,2006; Andersson和Banfield 2008; Tyson和Banfield 2008; Banfield和Young 2009; Held和Whitaker 2009; Lillestol等人,2009)。染色体外的元件通过广泛基因转移轮流响应(Andersson和Banfield,2008)或通过突变(Deveau等人,2008; Heidelberg等人,2009; Semenova等人,2009;Ploeg,2009)来避免CRISP的防御机制,说明宿主和捕食者的正在作斗争。
图1:所有在这篇文章中描述的4中亚型的CRISPR/Cas,所有的八种CRISPR/Cas参见Haft等人05年和Van der Oost等人09年的文献 A:在四种试验研究过的生物中cas基因临近结构示意图,每一种都用框图代表一种亚类型。CRISPR由灰矩形代表的leader,红方块代表的重复子,还有蓝矩形代表的spacer。只显示了一种CRISPR的片段。基因用箭头指出,蓝色箭头指出基因有可能涉及到spacer需求。黄箭头指出基因涉及到CRISPR转录,处理和目标干涉。核酸内切酶剪切前crRNA生成crRNA这个过程用Blod箭头着重标出。Hatching pattern指出基因的相似性:RAMP基因拥有纵线,聚合酶基因拥有横线,CasC同源物有虚线(diagonal lines)其他无关紧要的基因都涂满颜色。构成CasC复合体的基因用下划线标出。B:各种生物中的CRISPR Rna重复序列在此给出。酶切点位用三角形标出,经管重复序列不尽相同,所有CRISPR RNA酶切事件产生一个八核苷酸的5'端柄。请注意,在Streptococcus thermophilus中的CRISPR RNA酶切没点还没有被证实。回文结构用下划线标出。就如早先Kunin等人研究过的一样,P.furiosus中的序列并不像能够形成茎环结构的样子。C:预测不同 CRISPR RNA 的重复序列的二级结构。切割位点用箭头指示。如前面库宁等人所描述的,古菌P. Furiosus的重复是不可能形成一个颈环结构(库宁等人,2007).
b这个最佳保守cas基因是呈现在所有亚型的cas1和cas2(Haft等人,2005)。因此,他们是目前适合CRISPR/Cas的标记。假定的核酸酶/整合酶Cas1(Makarova 等人,2006)作为一个需要金属离子的核酸酶已经被说明,这个核酸酶可以裂解ssDNA和monthdsDNA,从dsDNA中裂解约80bp长度的DNA片段。Cas1结构揭示了一个具有两个区域体系的异常的折叠(Wiedenheft等人,2009)。小的Cas2蛋白从富含U区域裂解ssRNAs。解决了来自几个物种的Cas2的晶体结构,揭示了铁氧还蛋白折叠,对于内切核糖核酸酶而言是很不平常的(Beloglazova等人,2008)。认为Cas1参与了间隔区的整合(Makarova等人,2006)。预测当间隔区已经存在于CRISPR阵列时,大肠杆菌中的Cas1和Cas2不参与抗病毒作用机制的防御阶段,这个预测与观察是一致(Brouns等人,2008;Hale等人,2009)。在几个基因组中包括Geobacter sulfurreducens的基因组,Cas1与Cas4基因的融合说明Cas4,一个类似RecB的核酸酶超敏感位点(Makarova 等人,2006),可能也参与了间隔区的获得(Oost 等人,2009)。Cas3是一个特殊的例子,是一个典型的单一的多肽,由2个区域组成:一个DH区域,在双链寡核苷酸中有一个依赖金属离子的核酸酶活性(Aravind 和 Koonin 1998; Han和Krauss2011年元宵节,2009)和一个DEAD/H盒解旋酶区域(Makarova等人,2006)。有趣的是,在Cas亚型这些区域是分隔的,并且在Cas亚型中
Cas3与Cas2融合(Makarova等人,2006)。Cas5和Cas6,以前解释为核心Cas蛋白,表示一类远离相关Cas蛋白,作为RAMPs涉及到。他们似乎有相似的3D结构,并共享至少羧基末端富含甘氨酸的环(Makarova 等人。2002)。两个RAMP蛋白(CasE and Cas6)最近发现是一个不依赖金属离子的内切酶,这个内切酶参与到CRISPR RNA (pre-crRNA)的加工,后面有描述(Brouns 等人,2008; Carte等人,2008)。另外,最近发现了由多个亚基组成的Cas复合物的两种类型。在大肠杆菌中,一个复合体是由5个基因簇c1–4 and cas5e(Cas5e and C3是RAMPs)编码的,并且这个产物形成了一个C复合体称为Cascade (CRISPR-associated complex for antiviral defen,CRISPRsweetbox好听的歌关联的抗病毒复合物) (Brouns等人,2008)。一个crRNA-结合Cmr-复合体包含Cmr-6已从火球菌属中分离出来(Hale等人,2009)。对实验性地确定和假设的内容以及核心中考志愿填报Cas蛋白和Cas复合体的描述见表1.