细菌是如何从⼊侵者那⾥获得间隔序列03122015-Nature-Article-CRISPR-Cas-adaptive-immunity
Comments'title: How bacteria get spacers from invaders
评论题⽬:细菌是如何从⼊侵者那⾥获得间隔序列(spacer)的
Comments'abstract Bacteria u CRISPR-Cas systemto develop immunity to virus. Details of how the systems lect viral DNAfragments and integrate them into bacterial DNA to create a memory of invadershave now been reported.
评论摘要细菌会利⽤CRISPR-Cas系统来对病毒形成免疫作⽤。本期Nature有⼈对这些系统如何选择病毒性DNA并通过将其整合到细菌性DNA中来对⼊侵者产⽣记忆进⾏了详细的报道。(评论内容)
就在⼏年前,免疫性记忆还被⼈们认为是脊椎动物所特有的特征——科学家们会对认为细菌可能具有“记住”攻击过它们的病毒的想法不屑⼀顾。然⽽这种⼏乎令⼈难以置信的细菌性免疫记忆的概念已经被⼈们证实确实存在了。本期Nature中的两篇⽂章,⼀篇由Heler等⼈完成,另⼀篇由Nunez等⼈完成,对这⼀现象在分⼦机制⽅⾯⽬前所取得的进程进⾏了报道。
细菌是通过采集短DNA序列的⽅法来记住⼊侵者的,这些DNA序列被称为病毒遗传物质中的间隔序列前体(protospacer)。这些序列被整合到细菌⾃⾝的DNA中,特异性地被整合在被称为常规聚集性间隔性
短回⽂重复序列(CRISPR,图1)的重复性序列排列中;被整合进来的序列称为间隔序列(spacer)。当细菌被⼀种已经被认知的病毒再次攻击时,这些间隔序列会从整个序列排列中被转录出来,所形成的转录物被⽤于对含有CRISPR相关性(Cas)蛋⽩的复合物进⾏引导,这种复合物会在病毒的核酸分⼦中将间隔序列前体切割。
如果转录形成的间隔序列引导Cas蛋⽩对CRISPR序列排列进⾏切割的话,是会发⽣CRISPR序列排列的偶然性破坏事件的,这样会使细菌的遗传物质发⽣灾难性的降解。为了阻⽌这种⾃⾝免疫作⽤发⽣,⼀些细菌中含有那些只有当⽬标DNA两侧由已知的间隔序列前体占据时才会发⽣DNA切割的CRISPR-Cas系统,这些序列被称为间隔序列前体相邻基序(PAMs)。⽽在没有PAMs的CRISPR序列排列中位于间隔序列两侧的重复序列则不会被切割(图1)。
哪⼀种间隔序列会被选定从⽽使其只对PAM相关性的间隔序列前体进⾏作⽤,这⼀作⽤的机制⽬前还不清楚。Heler及同事展⽰了在两种链球菌(Streptococcus)中的Cas9蛋⽩会对具有正确PAM的间隔序列做出选择。在此之前,⼈们已知这种蛋⽩的主要作⽤是切割⽬标DNA。
当作者们将具有不同PAM特异性的Cas9蛋⽩之间进⾏互换后,他们发现所形成的间隔序列会按着PAM的序列发⽣改变。因此这些CRISPR-Cas系统会有效地利⽤Cas9的能⼒⽽为记忆以及切割等功能来识别PAM序列,⽽不是从杂乱⽆章的序列中使具有固定记忆作⽤的蛋⽩形成对PAM 的识别。在其他类型
的CRISPR-Cas系统中,⽐如在⼤肠杆菌中,具有记忆作⽤的蛋⽩⾄少部分具有内在性的、通过⼀种迄今还不清楚的机制⽽对PAM编码性间隔序列前体做出选择的能⼒。
Figure 1 | The bacterialimmune respon. a, When bacteria are invaded by viral DNA, memorizing proteincomplexes of the CRISPR–Cas immune system lect short quences (protospacers)of the foreign DNA and integrate them as spacer quences into their ownchromosome. The spacers are integrated into an array of repeat quences calledclustered regularly interspaced short palindromic repeats (CRISPRs); differentspacers are shown in orange, pink and red. b, If the bacterium issubquently expod to previously encountered DNA, a transcript of the spacerguides a cleavage protein complex to cut out the protospacer. In some types ofCRISPR–Cas system, cleavage occurs only if the protospacer is flanked by aprotospacer adjacent motif (PAM), and the CRISPR array is not cleaved becauthe spacers lack PAMs. Heler et al.and Nu?ez port details of themolecular mechanisms by which CRISPR–Cas systems lect and integrate spacersinto bacterial DNA.图1 细菌性免疫应答
a,当细菌受到病毒DNA的侵袭时,CRISPR-Cas免疫系统的记忆作⽤蛋⽩复合物就会选择外源性DNA中较短的序列(间隔序列前体)并将作为间隔序列整合到细菌⾃⾝的染⾊体中。这些间隔序列被整合到⼀种被称为聚集型正常间隔性短回⽂重复序列(CRISPRs)的重复性序列排列中;图中对不同
的间隔序列以桔黄、粉红和红⾊来显⽰。
b,如果细菌再次暴露在之前遇到过的DNA中时,这些间隔序列的转录物会引导蛋⽩复合物进⾏⼀次切割,将间隔序列前体切割掉。在某些类型的CRISPR-Cas系统中,切割作⽤只会在当间隔序列前体的两侧是由间隔序列前体临近基序(PAM)组成时才会发⽣,⽽在间隔序列两侧没有PAMs时CRISPR排列不会被切割。Heler等⼈及Nunez等⼈对CRISPR-Cas系统选择并将间隔序列整合到细菌DNA中的分⼦机制的细节进⾏了报道。
Heler及同事接着展⽰了Cas9不仅是所形成的间隔序列中确定PAM序列所必需的,⽽且还是将间隔序列整合到CRISPRs中所必需的。这种特征是Cas9所特有的,Cas9指的是可以切割核酸的⼀类蛋⽩,在所研究的其他类型的CRISPR-Cas体系中对外源性DNA整合中Cas9对核酸的切割作⽤并不是必需的,但在某种条件下Cas9的切割会对整合起促进作⽤。
泡面锅
这些发现为由体内条件下研究所揭⽰的分⼦性记忆作⽤的机制增加了重要的细节性内容。每⼀个间隔序列都会整合到带有⼀个新重复序列的CRISPR排列中;我们已经知道新整合的重复序列会在新的间隔序列的另⼀侧维持原有的重复序列,⽽新间隔序列的整合可能会通过这个重复序列上两股DNA的分隔作⽤⽽发⽣。但我们需要更多的信息,我们⼀直期待有⼀种能够揭⽰出更多机制性细节的体外检测系统。
表记
Nunez及同事就建⽴了⼀套这样的系统:它是由⼤肠杆菌的记忆性蛋⽩、⼀个作为间隔序列受体分⼦的超螺旋质粒DNA以及⼀个作为间隔序列供体分⼦的双链DNA所组成。研究⼈员们⾸先通过使⽤这⼀系统证实许多CRISPR记忆作⽤进程特征的⽅式说明了这套系统的有效性。接着他们对体外条件向插⼊的间隔序列的⾼通量测序结果进⾏了分析,并展⽰了记忆性蛋⽩通过对PAM中特异性核苷酸碱基的识别将间隔序列以正确的⽅向进⾏整合的过程。
重要的是,这⼀体系可以使间隔序列的供体很容易地被不同序列、不同末端修饰和双链组成的DNA所替换,从⽽可以对DNA这些特征对间隔序列整合作⽤的影响进⾏研究。通过这种⽅
法,Nunez等⼈展⽰了双链DNA底物上3'末端的羟基(OH)基团是整合作⽤所必需的。基于这样⼀种需求,以及研究⼈员们在体内条件下所找到的整合作⽤中间产物的特点,作者们针对间隔序列插⼊作⽤提出了⼀种看起来⾮常合理的模型。在这种模型中,记忆作⽤酶会催化间隔序列所在DNA链的3' 末端与重复序列末端⼀个特定DNA链之间成键。这⼀共价键形成后会接着在间隔序列的互补链3'末端与重复序列另⼀端互补链之间成键(参见原⽂图5)。
体外条件下对⽣物系统进⾏研究的好处是所有的组分都可以通过⼈⼯的⽅式加⼊到反应中;因此我们可以确定和操控反应所需的每⼀种组分以及它们的特征。但反应过程中有可能会出现由于⽣理活动⽽形成的差异,这种差异可能会由于使⽤了与体内条件下不同的化学环境或者由于调节性元件的缺乏⽽
形成的。这样的元件可能不是⼀个反应末端产物形成所必需的,但它可能在⽣理过程中起到关键性的作⽤。
Nunez及同事正是对这样⼀种差异进⾏了报道。体内⽔平研究的结果显⽰间隔序列的整合主要会发⽣在CRISPR排列的第⼀个重复序列上。但与之相反的是,作者们发现在他们的体外系统中间隔序列的整合还会在其他重复序列附近发⽣,甚⾄在CRISPR排列之外发⽣。研究⼈员们认为这⼀现象可能代表了⼀种形成新排列的⽣理性⽅式。这是有可能的,但体内条件下的调节性元件或者⽣理条件可能通常会限制这种作⽤⽽使直接的整合作⽤发⽣在特异性位置上。
作者们还报道了PAM编码性间隔序列的供体在体外条件下并不是整合作⽤的理想底物,这与体内条件下所见到的相反。还有,他们发现被整合的间隔序列的长度之间可能会相差很多,⽽在⾃然条件下被整合的间隔序列则会收到严格的长度限制。这些差异可以通过这样的事实来解释,即这种体外系统只是模拟了间隔序列整合作⽤的最后⼀步;在⾃然过程中更早的各个步骤可能会在体内条件下形成对PAM的偏好性以及对限制性间隔序列长度的确定。
然⽽体内和体外条件下研究结果的差异对这个主要问题进⾏了强调,即在体内条件下是什么确定了新形成的间隔序列不变的长度。这是由将受处理的间隔序列递交给记忆作⽤酶的蛋⽩复合物决定的吗?如果是这样的话,这些蛋⽩⼜是什么样的呢?我们需要⼀种由所有组分构成的体外系统来解决这些问题,这些构成体系的组分可以催化反应中的每⼀步。
PAMs会针对CRISPR排列阻⽌⾃⾝免疫性作⽤的发⽣,但如果CRISPR-Cas系统偶然性地对其他DNA序列进⾏切割的话,⾃⾝免疫性作⽤还是会发⽣。因此这种情况是如何被阻⽌的?我们已经知道外源性DNA分⼦要⽐宿主的染⾊体更频繁地被CRISPR-Cas系统所检测。将来的研究应该对这种选择性检测作⽤背后的机制进⾏探索。(评论完)
03122015-Nature-Article-CRISPR-Cas-adaptive-immunity
Article1 Title:Cas9specifies functional viral targets during CRISPR-Cas adaptation
题⽬:CRISPR-Cas系统进⾏免疫适应时Cas9对有功能的病毒性作⽤⽬标进⾏确定
篮球投篮Abstract Clustered regularly interspaced shortpalindromic repeat (CRISPR) loci and their associated (Cas) proteins provideadaptive immunity against viral infection in prokaryotes. Upon infection, shortphage quences known as spacers integrate between CRISPR repeats and aretranscribed into small RNA molecules that guide the Cas9 nuclea to the viraltargets (protospacers). Streptococcus pyogenes Cas 9 cleavage of the viralgenome requires the prence of a 5'-NGG-3' protospacer adjacent motif (PAM)quence immediately downstream of the viral target. It is not known whetherand how viral quences flanked by the correct PAM are chon as new spacers.Here we show that Cas9 lects functional spacers by recognizing their PAMduring spacer 最美明星
acquisition. The replacement of cas9 with alleles that lack thePAM recognition motif or recognize an NGGNG PAM eliminated or changed PAMspecificity during spacer acquisition, respectively. Cas9 associates with otherproteins of the acquisition machinery (Cas1, Cas2 and Csn2), presumably toprovide PAM-specificity to this process. The results establish a new functionfor Cas9 in the genesis of prokaryotic immunological memory.
摘要聚集型正常间隔性短回⽂重复序列(CRISPR)的位点及其相关性(Cas)蛋⽩为原核⽣物针对病毒性侵袭提供了获得性免疫作⽤。当细菌受到病毒的侵袭时,会把被称为间隔序列的病毒的短序列整合到CRISPR重复序列之间,这些序列会被转录形成⼩RNA分⼦,这些⼩RNA 分⼦会引导Cas9核酸酶对病毒性作⽤⽬标(间隔序列前体,protospacer)进⾏作⽤。产脓型链球菌(Streptococcuspyogenes)中的Cas9对病毒基因组的切割作⽤需要在病毒性序列作⽤⽬
标下游有⼀个5'-NGG-3'间隔序列前体临近基序(PAM)序列的存在。还不清楚两侧由正确的PAM占据的病毒性序列是否会被选定为新的间隔序列,也不清楚选择的过程是什么。在此我们展⽰了Cas9会通过间隔序列形成期间对其PAM的识别来选定功能性间隔序列。采⽤缺乏PAM识别作⽤基序或者识别NGGNGPAM的等位基因来取代cas9会使间隔序列形成过程中PAM的特异性消失或得到改变。Cas9还与其他间隔序列形成作⽤机制性蛋⽩(Cas1、Cas2和Csn2)之间有相互作⽤,我们认为这些作⽤为这⼀进程提供了PAM特异性。这些结果说明Cas9在原核⽣物免疫记忆的形成中实施⼀种新功能。
(正⽂)
CRISPR位点和Cas蛋⽩为细菌和古细菌针对病毒的侵袭提供了获得性免疫作⽤。为了适应⾼度变化的病毒群体,CRISPR-Cas位点也经历了快速的进化过程,这个过程包括将被称为间隔序列(spacer)的短噬菌体序列整合到CRISPR重复序列之间从⽽形成对侵袭的记忆记录。间隔序列可以被转录成⼩CRISPRRNAs(crRNAs),这些⼩RNA分⼦会通过与侵⼊的DNA之间形成直接的Watson-Crick配对来找出病毒性作⽤⽬标(被定义为间隔序列前体,protospacer)。基于其cas基因所包括的内容,CRISPR-Cas系统可以分为三种不同的类型:I型、II型和III型。每⼀种CRISPR-Cas类型都有着crRNA⽣物合成、⽬标清除以及阻⽌⾃⾝免疫作⽤发⽣的不同机制。在产脓性链球菌中存在的II型CRISPR-Cas系统中,Cas9核酸酶会采⽤crRNAs作为引导序列将双链DNA断裂引⼊到病毒基因组中的⽅法使侵袭的噬菌体失活。Cas9的切割需要在间隔序列前体下游区域存在⼀个间隔序列前体临近基序(PAM)。这⼀需求避免了对CRISPR排列内对间隔序列的切割,也就是⾃⾝免疫作⽤,因为相邻的重复序列中没有PAM序列。PAM序列对⽬标识别和切割的重要性说明存在着这样⼀种机制,它通过正确的PAM序列来保证新形成的间隔序列与其两侧的间隔序列前体之间形成匹配。对于⼤肠杆菌中的I-E型CRISPR-Cas系统来说,过量表达cas1和cas2⾜以在没有噬菌体侵袭的条件下形成新的间隔序列。有报道指出以这种⽅式形成的间隔序列会偏好性地(25-70%)与带有正确PAM的间隔序列前体形成匹配(AWG,W=A/T),这说明Cas1和Cas2⾜以使间隔序列形成并具有某种对带有正确PAM的
间隔序列前体进⾏识别的内在能⼒。在产脓型链球菌的II型系统中,PAM的序列是NGG(低频NAG),其中N可以是任何核苷酸;这⼀基序可以在⽬标切割期间被Cas9核酸酶中的⼀个结构域进⾏识别和结合。在这⼀系统中间隔序列是如何形成的,特别是在这⼀过程中带有正确PAM 序列的间隔序列是如何被选定的我们⼀⽆所知。
Cas9是间隔序列形成所必需的
为了研究间隔序列形成时PAM临近的间隔序列前体识别作⽤的机制,我们将产脓性链球菌的II-A 型CRISPR-Cas位点克隆到链球菌载体pC194中,并将得到的质粒引⼊到⾦黄葡萄球菌RN4220中(图1a),RN4220菌株中没有CRISPR-Cas位点。我们选择这套实验体系是因为它很容易进⾏产脓性链球菌CRISPR-Cas系统的遗传性操控。我们⾸先通过使⽤链球菌噬菌体?NM4γ4进⾏感染的⽅法检测了细菌细胞形成获得性CRISPR免疫作⽤的能⼒,?NM4γ4是?NM4的溶菌性变异株。通过将细菌和噬菌体在上层琼脂中混合⽽进⾏的检测,我们将对噬菌体具有抗性的细菌克隆挑出来并进⾏PCR检测,对CRISPR排列的扩增情况进⾏检测(扩展数据图1a)。抗性克隆中⼤概有50%的克隆形成了⼀个或多个间隔序列(三次独⽴实验中分别为8/13、5/11、
7/16),⽽其余的抗性克隆则是通过⾮CRISPR机制⽽对噬菌体侵袭形成存活的,这些⾮CRISPR机制很可能包括噬菌体受体的突变(扩展数据图2a)。为了最⼤限度地捕获新间隔序列的序列,我们在液
体中进⾏了同样的检测,并在噬菌体侵染的最后阶段重新收集那些存活下来的细菌。这些细菌我们通过PCR对其CRISPR排列进⾏分析,发⽣了扩增的位点上的PCR扩增产物则通过IlluminaMiSeq 序列测定来确定间隔序列形成的程度。对296万个测序阅读进⾏的分析检测出在病毒基因组中的2687个NGG序列中有2083个是间隔序列临近序列,虽然每个序列的形成频率中存在⼀定的变异(扩展数据图1b)。这些数据展现了与带有下游NGGPAM序列的间隔序列前体相匹配的间隔序列的主要选择结果(99.97%,扩展数据图1c)。在液体培养基中细菌细胞对新间隔序列的这种形成过程被证实是⼀种简单但⾼效的过程,说明在⼀个简单步骤中对上百万的新间隔序列进⾏检测是可能的。因此我们在研究中⼀直使⽤这⼀检测⽅法。
为了确定间隔序列形成所需的遗传性条件,我们将细菌菌株进⾏了cas1、cas2或csn2的单个缺失性菌株的改造,并将改造后的菌株使⽤?NM4γ4 噬菌体进⾏侵染。在每⼀种改造后的菌株中间隔序列的形成降低到我们能检测到的范围之外(图1b),这与之前的实验结果相⼀致。因此虽然Cas1、Cas2和Csn2在细菌已有间隔序列的条件下并不是细菌形成抗噬菌体免疫作⽤所必需的(扩展数据图2b,c),但它们是间隔序列形成所必需的。为了确定这些基因是否⾜以诱发这⼀过程,我们在质粒pRH233中通过采⽤四环素诱导性启动⼦在cas9缺乏的条件下在细菌中过量表达cas1、cas2和csn2,并在没有噬菌体侵染的条件下使⽤⾼敏感度PCR检测⽅法来检测新间隔序列的整合情况(扩展数据图3)。我们即使在有诱导剂存在的条件下也检测不到新的间隔序列(图1c)。但当我们加⼊第⼆个从
地瓜饼的做法细菌的天然启动⼦下表达tracrRNA和Cas9的质粒后(扩展数据图3)会在只有诱导剂存在时有间隔序列的形成,所有新形成的间隔序列都与染⾊体或质粒的序列相匹配(图1c,扩展数据表1)。尽管很有可能这些间隔序列的形成会分别导致细胞的死亡或者质粒的消除(plasmid curing),但采⽤我们⾼敏感性PCR检测的⽅法仍然可以在液体培养的条件下检测到间隔序列的形成(扩展数据图3b,c)。tracRNA(图1a)是⼀种可以与Cas9结合的⼩RNA,它是crRNA加⼯过程和Cas9核酸酶活性所必需的。我们想知道间隔序列形成中Cas9的参与是否还需要tracrRNA的存在。在没有噬菌体侵染的条件下,删除tracrRNA会
阻⽌间隔序列的形成(图1c),说明apo-Cas9并不⾜以促进间隔序列的形成,还需要它保持与其共同作⽤因⼦之间的相互作⽤。综上,这些数据说明Cas1、Cas2和Csn2是新间隔序列整合的必要但⾮充分条件,整合作⽤还需要tracrRNA-Cas9复合物的参与。这与⼤肠杆菌的I-E型CRISPR-Cas体系相反,在后者中Cas1和Cas2的过量表达⾜以导致间隔序列进⾏整合。需要提请注意的是在这⼀检测中所使⽤的CRISPR排列是由单个重复序列所组成的,没有已知的间隔序列(扩展数据图3)。因此间隔序列整合作⽤对Cas9的需求并不是⼀种已知的“启动后”间隔序列形成作⽤所造成的结果。这⼀结果说明在I型CRISPR-Cas系统中所见到的间隔序列形成的频率有所增加,⽽这种I型的CRIPSR-Cas系统依赖于带有部分与噬菌体基因组相匹配的已有的间隔序列的存在,⽽且还要有完整的对⽬标实施作⽤的复合物的存在。
Figure 1 | Cas9 isrequired for spacer acquisition.
a, Organization of the S. pyogenes type II CRISPR–Cas locus. Arrowsindicate the annealing position of the primers ud to check for the expansionof the CRISPR array.
b, PCRbad analysis of liquidcultures to check for the acquisition of new spacer quences in the prenceor the abnce of phage ?NM4γ4 infection. Wild type (WT) aswell as different casmutants were analyd.Image is reprentative of three technical replicates. m.o.i., multiplicity ofinfection.
c,Cultures overexpressing Cas1, Cas2 and Csn2 under the control of a tetracycline-induciblepromoter were analyd using PCR for spacer acquisition in the abnce of phageinfection. The strain was complemented with plasmids carrying either Streptococcus thermophilus (St) or S. pyogenes (Sp) Cas9 (e Extended Data Fig.3), in the last ca with or without the tracrRNA gene (Δtracr).Image is reprentative of three technical replicates. aTc,anhydrotetracycline.
图1 Cas9是间隔序列形成所必需的
a,产脓链球菌II型CRISPR-Cas系统位点组成。箭头表⽰⽤于检测CRISPR排列扩增引物退⽕位置。
b,对液体培养条件下基于PCR的检测,⽬的是检验在有或⽆噬菌体?NM4γ4侵染的条件下新间隔序列
形成的情况。我们对野⽣型(WT)及不同的cas突变型进⾏了检测。图像为三次技术性重复的代表。m.o.i.,表⽰多次侵染。
穿小鞋
c,四环素诱导性启动⼦控制下过量表达Cas1、Cas2和Csn2的细菌培养物采⽤PCR进⾏没有噬菌体侵染条件下间隔序列形成情况的检测。所使⽤的菌株分别⽤携带嗜热链球菌(St)或产脓链球菌(Sp)的Cas9质粒补充,最后是有或⽆tracrRNA基因(Δtracr)。图像为三次技术性重复的代表。aTc,⽆⽔四环素。
Cas9会确定新形成的间隔序列的PAM
由于在CRISPR适应过程中这种新发现的必需性条件的存在,以及在细菌⾃我监测和对病毒⽬标序列清除过程中我们已经了解到的Cas9对PAM的识别作⽤,我们认为这种核酸酶可能会在间隔序列形成的过程中参与PAM序列选择作⽤。为了对这⼀假设进⾏检验,我们将产脓链球菌(Sp)和嗜热链球菌(St)CRISPR-Cas系统中的cas9基因进⾏互换,形成两种嵌合型CRISPR位点:tracrRNA Sp-cas9St-cas1Sp-cas2Sp-csn2Sp和tracrRNA St-cas9Sp-cas1St-cas2St-csn2St(图2a)。我们选了嗜热链球菌的II-A型CRISPR-Cas系统(亦称CRISPR3)是因为它是产脓链球菌系统的直系同源物。虽然Sp的CRISPR-Cas系统中PAM的序列是NGG,但St系统中PAM的序列是NGGNG(图2b,扩展数据表1)。我们将每⼀种菌株⽤?NM4γ4噬菌体侵染,然后对新形成的间隔序列进⾏测序,并使⽤WebLo
go来获得与间隔序列前体相匹配的PAM。我们发现每⼀种嵌合型系统都形成了带有与cas9位点存在相关的PAMs的间隔序列,但这些PAMs 却不与tracrRNA、cas1、cas2或者csn2位点的存在相关(图2b,扩展数据表1)。为了排除⾮功能性间隔序列是噬菌体侵染期间负向选择形成的这种可能,即它们是随机形成的,⽽且只在那些含有带⼀个为Cas9切割作⽤的正确PAM的细胞中形成,这样会提供⼀种免疫作⽤⽽使细菌存活,我们在没有噬菌体侵染时对所形成的间隔序列的PAMs进⾏了测序(图1c,2c)。在过量表达Cas1Sp、Cas2Sp和Csn2Sp的细胞中Cas9Sp或者Cas9St蛋⽩都存在。在这项实验中,就像前⾯解释过的,形成了与染⾊体或质粒序列相匹配的间隔序列。含有新间隔序列的PCR产物被克隆岛⼀种可以进⾏测序的商业质粒中(扩展数据表1)。Cas9Sp的表达导致与带有NGGPAM 序列的间隔序列前体相匹配的间隔序列发⽣整合,⽽在同样的细胞中Cas9St的表达则将PAM的组成改变为NGGNG(图2d)。这些结果证实在CRISPR适应作⽤的过程中Cas9通过确定PAM 的序列来保证功能性间隔序列的形成。
Figure 2 | Cas9determines the PAM quence of acquired spacers.
a, c,Genetic composition of the CRISPR–Cas loci tested for spacer during phageinfection (a), or in the abnce of infection (c), with the experimental t up shown in Extended Data Fig. 3. b, d, Sequence logos obtained after the alignment of the 39 flanking quences of the protospacers matched by the newlyacquired spacers in panels aand c, respectively. Numbers indicate the position
s of the flankingnucleotides downstream from the spacer. Number of
quences ud in eachalignment indicated as n.
图2 Cas9对所形成的间隔序列的PAM序列起决定作⽤
a,c,噬菌体侵染(a)或⽆侵染(c)时针对间隔序列所检测的CRISPR-Cas位点的遗传组成,实验设计如扩展数据图3所⽰。
b,d,对组图a,c中与新形成的间隔序列相匹配的间隔序列前体的39个两侧序列对齐⽐较的结果。数值表⽰距间隔序列下游的核苷酸的位置。每个对齐⽐较中所采⽤的序列数以n表⽰。Cas9与Cas1、Cas2和Csn2的相互作⽤
在I型CRISPR-Cas系统中,Cas1和Cas2形成复合物,⽽Cas1的双链DNA核酸酶活性对于启动对侵⼊性病毒DNA的切割并形成⼀个新的间隔序列来说具有重要意义。上述的遗传性研究分析的结果说明在产脓链球菌的II型CRISPR-Cas系统中,在体外条件下所见到的Cas9与PAM结合的功能可以针对Cas1或间隔序列形成机制中其他成员的切割作⽤确定⼀个PAM临近位点。这将保证在这条免疫作⽤的途径中新形成的间隔序列具有为以后Cas9活性所需的正确的PAM。这⼀假设预计Cas9与Cas1、Cas2以及Csn2之间存在⼀种相互作⽤。为了对此进⾏检验,我们采⽤组氨酰标记的Cas9载体在⼤肠杆菌中表
达了II型Cas的操纵⼦,并对可与之共同纯化下来的蛋⽩进⾏了检测。我们发现⼤量可共同纯化下来的蛋⽩的分⼦量接近33kD,这是Cas1的分⼦量⼤⼩(扩展数据图4a)。质谱检测的结果证实了这两种蛋⽩,以及与Cas9共同纯化下来的Cas2和Csn2(扩展数据表2)。这个结果说明存在由Cas9-Cas1-Cas2-Csn2组成的复合物,因此我们采⽤其他的纯化⽅法来更加确切地证实这个复合物的存在。当把组氨酰标记物加⼊到Csn2中后,我们可以分离得到Cas9-Cas1-Cas2-Csn2复合物(图3a,b)。通过质谱进⼀步证实了所纯化的蛋⽩(扩展数据表3)。这说明在Cas9核酸酶和其他只对新间隔序列形成起作⽤的Cas蛋⽩之间存在⽣化⽅⾯的联系,这证实了Cas9是以⼀种PAM确定因⼦的形式在CRISPR免疫作⽤的适应阶段起作⽤。
破门而出
Cas9的PAM结合作⽤基序是间隔序列选择作⽤所必需的
在这个复合物中,Cas9的结合PAM的结构域会确定⼀个具有功能的间隔序列(这个间隔序列会临近⼀个正确的PAM)并且Cas1抑或Cas9的核酸酶活性将会切割⼊侵的DNA来提取出间隔序列。为了检验这⼀模型,我们在没有噬菌体侵染的条件下进⾏了如扩展数据图3中所描述的细菌适应作⽤研究,但在研究中采⽤了不同的野⽣型Cas1、Cas1(E220A)(⽆催化活
性,dCas1)、野⽣型Cas9、Cas9(D10A、H840A)(⽆催化活性,dCas9)以及
Cas9(R1333Q、R1335Q)(在PAM结合基序中含突变,体外条件下会⼤⼤降低与带有NGGPAMs
的⽬标DNA序列的结合能⼒,缩略为Cas9PAM)的组合。我们发现Cas1的核酸酶活性是间隔序列形成所必需的(图3c)。相反,Cas9的核酸酶活性和结合PAM的作⽤则对于这⼀过程可有可⽆。接着我们对突变后Cas9存在的条件下所形成的间隔序列的PAM进⾏了检测(图3d)。我们发现虽然在dCas9存在时所形成的间隔序列展⽰出了正确的PAMs,但在Cas9PAM 存在时形成的间隔序列却与那些序列两侧没有保守性序列的DNA区域相匹配,即这些间隔序列没有PAM序列。含有来⾃嗜热链球菌的⽆催化活性Cas9(D10A,H847A)的细菌细胞会形成带有NGGNGPAMs的间隔序列(扩展数据图5)。这些结果说明Cas1和Cas9是决定间隔序列形成的复合物的⼀部分,这种间隔序列的形成需要Cas1的核酸酶活性以及Cas9的PAM结合作⽤特征来确定新的间隔序列的序列。
Figure3 | S. pyogenes Cas9 PAM recognition domain is required for the acquisition ofspacers with an NGG PAM quence.
a, Separation of the Cas9–Cas1–Cas2–Csn2complex by ion exchange chromatography.
b, SDS–PAGE of fraction 19 (peak)from the complex elution shown in panel a,reprentative of five technical replicates. The four proteins of the complex
wereindividually purified and run alongside the purified fraction to identify eachprotein in the complex.
c, Spacer acquisition was tested asin Fig. 1c in the prence or abnce of different Cas1 or Cas9 activities.Image is reprentative of eight technical replicates. dCas1, nuclea-deadCas1 (E220A mutation); dCas9, nuclea-dead Cas9 (D10A, H840A mutations);
Cas9PAM lacks the PAM recognition function (R1333Q, R1335Q mutations).
d,Sequence logos obtained after the alignment of the 39 flankingquences of the protospacers matched by the newly acquired spacers in panel c.Numbers indicate the positions of the flanking nucleotides downstream from thespacer. Number of quences ud in each alignment indicated as n.
图3 产脓链球菌中Cas9的PAM识别结构域是形成带有NGGPAM序列的间隔序列所必需的
a,通过离⼦交换层析来分离Cas9-Cas1-Cas2-Csn2复合物
北印度洋季风环流b,a图中复合物洗脱组分19的SDS-PAGE结果,图像为5次技术性重复的代表。复合物中的四种蛋⽩都被单个纯化出来并与所纯化的组分同时进⾏电泳来确定复合物中的每⼀组分。
c,如图1c,在有或⽆不同Cas1或Cas9活性条件下的间隔序列形成情况。图像代表8次技术性重复。dCas1,⽆核酸酶活性的Cas1(E220A突变);dCas9,⽆核酸酶活性的Cas9(D10A、H840A突变)
;Cas9PAM,缺乏PAM识别功能(R1333Q,R1335Q突变)。