287
doi:10.3969/j.issn.0253-9608.2015.04.007
DNA同源重组机制的确立
向义和†
清华大学物理系,北京 100084
摘要 介绍了DNA同源重组机制确立的过程。其主要内容包括基因连锁和重组现象的发现,交叉假设的提出,断裂重接假设和复制选择假设的出现,同源重组的三个模型(Holliday模型、单链断裂模型和双链断裂模型)的确立。关键词 连锁基因;同源重组;交叉假设;Holliday模型;单链断裂模型;双链断裂模型
DNA 重组(recombination)是指发生在DNA 分子内部或DNA 分子之间核苷酸序列的交换、重排和转移现象,是已有遗传物质的重新组合过程。同源重组(homologous recombination)是在两个DNA 分子的同源序列之间直接进行交换的一种重组形式。进行交换的同源序列可能是完全相同的,也可能是非常相近的。
同源生物体通过重组可以产生新的基因或等位基因的组合,还可以提高种群内遗传物质的多样性,而人们可使用同源重组进行遗传作图。
本文介绍了DNA 同源重组机制确立的过程。20世纪初发现了基因连锁和重组现象,在探讨重组现象出现的原因时又提出了交叉假设,形成了交换概念。20世纪30年代中期在探讨基因交换的机制时,出现了染色体交换的两种假设:断裂重接假设和复制选择假设。1953年DNA 双螺旋结构发现后,科学家开始在分子水平上探讨同源重组的机制。20世纪60—80年代,科学家分别提出了DNA 同源重组的三种模型:Holliday 模型,单链断裂模型和双链断裂模型。
1 基因连锁和重组现象的发现
1.1 连锁现象的发现
1905年,英国生物学家贝特森(Bateson W.,
1851—1926)和庞尼特(Punnet R. C.)研究香豌豆两对性状的遗传。他们选择的一对性状是花的颜色,有紫色和红色两种;另一对是花粉粒的形状,有长形和圆形两种。将紫花长花粉粒和红花圆花粉粒的植株作亲本进行杂交,结果F 1代都是紫花长花粉粒,可见紫花对红花是显性,长花粉粒对圆花粉粒是显性。将F 1代自交得到的F 2代有紫长、紫圆、红长、红圆4种表型。这4种表型的比率不符合孟德尔
的两对遗传因子的分离比9∶3∶3∶1,其中紫长和红圆的表型的比率远远超出9/16和1/16,而相应的紫圆和红长的表型却大大少于3/16(表1)。[1]
表1 香豌豆紫长×红圆杂交试验
F 2紫长紫圆红长红圆总数实得数 4 831390393 1 338 6 952预计数
3 910.5
1 303.5
1 303.5
434.5
6 952
将实验数据与由孟德尔自由组合定律所预期结果相比较,F 2代中性状的亲本组合类型远远多于重组组合的类型。这等于说,两对基因在杂交子代中的组合并不是随机的,在F 1杂种形成配子时,原来属于同一亲本的两个基因更倾向于进入同一配子中,有更多保持亲本原来组合的倾向,而且这种倾向与显隐性无关。这是在自由组合定律方面第一次出现的显著的例外,无疑,这
†通信作者,E-mail :
是一个重要的发现。
1.2 重组现象的发现
1910年,美国遗传学家摩尔根(Morgan T. H., 1866—1945)和他的学生布里吉斯(Bridges C. B., 1889—1938)用果蝇进行了大量的杂交试验,研究了两对基因的遗传,发现了完全连锁、不完全连锁和重组现象[1]。
在黑腹果蝇中,灰体(B)对黑体(b)是显性,长翅(V)对残翅(v)为显性,这两对基因在常染色体上。他们将灰体长翅(BBVV)和黑体残翅(bbvv)的果蝇杂交,F1代都是灰体长翅(BbVv)。用F1的杂合体进行下列两种方式的测交,所得到的结果却完全不同。①取F1雄蝇(BbVv)和黑体残翅(bbvv)的雌蝇测交。按两对基因的自由组合定律来预测,应产生灰体长翅(BbVv)、灰体残翅(Bbvv)、黑体长翅(bbVv)、黑体残翅(bbvv)4种表型的后代,且比率为1∶1∶1∶1。可是实验的结果并非如此,而是只有数目相同的灰体长翅(BbVv)和黑体残翅(bbvv)两种类型。②如果用F1雌蝇(BbVv)和黑体残翅(bbvv)的雄蝇测交,后代中就出现了灰体长翅(BbVv)、灰体残翅(Bbvv)、黑体长翅(bbVv)、黑体残翅(bbvv)4种表型,但比率是0.42∶0.08∶0.08∶0.42。
摩尔根的解释是:假定基因B和V同处于一条染色体上,基因b和v同处于同源染色体的另一条染色体上。他将这种处于同一条染色体上的基因遗传时较多地联系在一起的现象称为连锁(linkage)。对于上述第一种测交结果摩尔根称为完全连锁(complete linkage)(图1)。
由于F1杂合雄蝇(BbVv)完全连锁,即在同一染色体上的连锁基因(如B、V基因或b、v基因)100%联系在一起传递到下一代。因此只产生数目相等的两种配子BV和bv,所以和黑体残翅(bbvv)的雌蝇测交时,后代只能有数目相等的灰体长翅(BbVv)和黑体残翅(bbvv)两种类型(图1)。
第2种方式的测交,后代出现数目不等的4种表型,其中亲本的类型远远多于新类型。摩尔根称这种连锁为不完全连锁 (incomplete linkage) (图2)。不完全连锁是指位于同一染色体上的2个或2个以上的等位基因,不总是作为一个整体传递到子代。
图1果蝇的完全连锁
新类型是由于同源染色体上的不同对等位基因之间重新组合的结果,这种现象称为重组(recombination)。在本项测交实验中,出现的新类型共占16%,该数值表示基因Bb和Vv 之间的重组值(recombination value)或重组频率(recombination frequency, RF)。重组值用百分数表示,其计算公式如下:
重组值(RF)=重组型数目/(亲组型数目+重组型数目)
重组值从0~50%变化。重组值的大小反映了个体在侧交中同一条染色体上的基因的连锁程度。重组值小,亲组型基因的连锁程度大,当重组值是0时,为完全连锁;重组值大,亲组型基因的连锁程度小,当重组值达到50%,则4种配子成1∶1∶1∶1的比例,也就是自由组合了。
大量的实验资料表明,连锁现象在生物界普遍存在。凡是位于同一条染色体上的基因群,均称为一个连锁群(linkage group)。摩尔根等在1914年已发现黑腹果蝇有4个连锁群,到1967年,在果蝇中至少测定了将近1 000个基因分别属于这4个连锁群。在遗传学上,凡是充分研究过的生物中,连锁群的数目都应该等于单倍体染色体数(n)
。
288
289
2 交叉假设的提出和交换概念的证实
2.1 交叉假设的提出
在同一染色体上相互连锁的基因为什么会出现一定频率的重组?换言之,在两对基因连锁遗传时,形
成亲代所没有的新组合的机制是什么?
在摩尔根等确立遗传的染色体学说之前,1909年比利时的细胞学家詹森斯(Jansns F. A.)在研究两栖类和直翅目昆虫的减数分裂时,观察到二价体(相互配对的两条同源染色体,bivalent)的交叉,提出交叉型假设(chiasmatype hypothesis),这是最早的重组理论。他认为每次交叉都表明父、母本的一条染色单体接触、断裂和重接,形成一个新的组合,其他两条染色单体仍保持完整状态。因此每个交叉是重组行为可见的表现形式,其要点是:①生物在形成配子的过程中,都要经减数分裂,在第一次减数分裂前期,两个同源染色体配对,形成4条染色单体。配对中的同源染色体不是简单地平行靠拢,而是在非姊妹染色单体间的某些点上出现交叉缠结的图像,每一个点上这样的图像称为一个交叉(chiasma),这是同源染色体间对应片段发生过交
换(crossing-over)的地方(图3)。②处于同源染色体的不同座位的相互连锁的两个基因之间如果发生了交换,就导致这两个连锁基因的重组。
图3 配对的同源染色体有两个交叉,交叉结处表示非姊妹
染色单体间发生过交换
这个学说的核心是:交叉是交换的结果,而不是交换的原因。也就是说,遗传学上的交换发生在细胞学上的交叉出现之前[1]。
由图3可见,交换曾发生在非姊妹染色单体2和3及2和4之间。如果交换发生在两个特定的所研究的基因之间,则出现染色体内重组,形成交换的产物。否则,交换发生在所研究的基因之
图2 果蝇的不完全连锁
染色单体
12
34
交叉结
外,则得不到特定基因的染色体内重组的产物。
一般情况下,染色体愈长,显微镜下可以观察到的交叉数愈多。一个交叉就代表一次交换。一般是两个基因在染色体上的距离越远,其互换的比率越大;距离越近,互换率越小,同源重组要求两个DNA分子的序列同源,同源区域越长越有利,同源区太短,越难发生重组。大肠杆菌染色体重组,至少要求有20~40 bp是相同的。
因此,交换值(crossing-over value)的大小就可以用来表示基因间距离的长短。交换值无法直接测定,而只有通过基因之间的重组频率来估计所发生交换的频率。既然连锁基因的交换率(即重组频率)可以代表基因在同一染色体上的相对距离,那么人们就有可能根据基因的重组频率来确定它们在染色体上的相对位置。
基因定位(gene mapping)即根据重组值确定不同基因在染色体上的相对位置和排列顺序。遗传图(genetic map)或染色体图(chromosome map)也是依据基因之间的重组值(或交换值),确定连锁基因在染色体上的相对位置而绘制的一种简单线性示意图。两个基因在染色体图上距离的数量单位称为图距(map distance)。1%重组值去掉其百分率的数值定义为一个图距单位(map unit, mu)。后人为了纪念现代遗传学的奠基人摩尔根,将图距单位称为“厘摩”(centimorgan, cM),1 cM=1%重组值去掉%的数值。
连锁和交换这一对名词在遗传学上被延用下来。1912年摩尔根提出连锁互换定律,其基本内容是:处在同一染色体上的两个或两个以上基因遗传时,联合在一起的频率大于重新组合的频率。重组型的产生是由于配子形成过程中,同源染色体的非姊妹染色单体间发生了局部交换的结果。
2.2 交叉假设的证实
交叉理论虽然得到遗传学家的支持,却遭到细胞学家的反对,因为找不出理论中有关断裂和重接的任何证据。从显微镜照片上来看确实很难想象存在断裂和融合的现象。直到1928年,贝林(Belling)提出交换发生在减数分裂较早时期,此时同源染色体精密相连,因此在双线期观察到的交叉并不表明交换的过程,而是交换的直接结果,这一解释结束了近十年的争论。但有一个问题仍使人们感到困惑,那就是交叉点是在变化的,在接近细胞分裂中期1时明显减少了,而交换一旦发生数目应是固定的,因此科学家仍然怀疑交叉学说。1931年,英国的植物细胞学家达林顿(Darlington C. D.)发现,交叉数目减少是交叉端化的结果,此时才排除了异议[2]。
1978年蒂斯(Tea C.)和琼斯(Jones C. H.)采用姊妹染色单体差别染色(SCD)来直接检验交叉和重组的关系。SCD法可将姊妹染色单体一条染上颜色呈现深紫色,显示为暗的;另一染不上色,显示为明的。他们用SCD法来处理蝗虫细胞减数分裂的染色体,结果发现明暗转换发生在交叉处(
图4)。这就澄清了前面留下的问题。实验
表明交叉正是发生交换的位点。
(a)(b)(c)
图4 在减数分裂中非姊妹染色单体深色链和浅色链之间发生交换:(a)表明交叉;(b)当着丝粒附着到纺锤丝上拉向两极时,形成中央带有交叉的十字形结构;(c)十字
形结构的照片
摩尔根在1926年的言论中提到线性排列的基因通过“互换”而重新组合的概念,这种“交换”的真实存在性直到1931年才被芭芭拉•麦克林托克(McClintock B.)在玉米中以及柯特•斯特恩(Stern C.)在果蝇中证实。
3 染色体交换模型
在20世纪30年代中期出现了染色体交换的两种假设:复制选择模型和断裂重接模型。按照复制选择模型,两个染色单体作为复制的模板进行复
290
291
制,在复制过程中相互交换模板,从而造成交换。按照断裂重接模型,两个染色单体在同一位置上断裂,然后彼此和另一染色单体重新连接起来。3.1 断裂重接模型
同源重组涉及参与重组的双方DNA 分子的断裂与重接。人们已从细胞水平上证明在减数分裂前期,同源染色体配对,两条非姊妹染色单体之间发生断裂、重接和交叉。1937年,达林顿仔细地观察研究了减数分裂的过程,提出重组的断裂和重接的模型。他认为在减数分裂中一对同源染色体相互分离就像将绳子的两股分开一样,会产生扭曲,为了消除张力,只有当两姊妹染色单体在对应点发生断裂才能使张力达到平衡,然后非姊妹染色单体的“断头”相互重接,产生了重组。根据这个模型重组应发生在四线期,因重组是一个相互的过程,所以重组的产物也应当是对称的[2]。
染色体断裂并发生再连接的最有力的证据是来自于哈佛大学生物实验室的分子生物学家梅塞尔森(Melson M.)和韦格勒(Weigle J.)所做的实验。1961年,他们用两个品系的λ噬菌体同时感染大肠杆菌(E. coli )。一个品系λ噬菌体在染色体一端具有标记基因c 和mi ,这个品系用同位素13C 和15N 进行标记,因而形成“重”链。另一个品系的相应座位带有c +和mi +标记基因,并以12
C 和14N 作为标记,因而具有“轻”的DNA 链。两种噬菌体混合感染大肠杆菌细胞后,培养在正常的培养基中,直到裂解。后代噬菌体从裂解细胞中释放出来,收集后进行子代噬菌体DNA 的氯化铯密度梯度离心,结果获得了很宽的噬菌体带。在一系列的条带中,既有重链和轻链两个亲本类型的染色体,
也有一系列重链与轻链发生断裂重新接合的中间类型。从遗传标记方面也证明了不仅具有c mi 和c + mi +亲本组合,同时也有c mi +和c + mi 新组合(图5)。由此表明,重组的发生必定是通过DNA 的物理断裂与再接合而实现的[1]。
3.2 模板选择模型
模板选择模型是由贝林首先提出的,但
1933
图5 l 噬菌体的染色体断裂与重接的证据:(a)两个品系的
λ噬菌体(c mi,++)感染大肠杆菌;(b)氯化铯密度梯度离心显示轻链亲本(上层)、中间类型(中)和重链亲本(下)三种条带;(c)两个标记(c mi)间的交换所产生的重组(c,+)后代,进一步证明了DNA 的断裂与重接
年他又撤回了这一假设。1948年,赫尔希(Hershey A. D., 1908—1997)发现在噬菌体的杂交中产生的重组子有时是非对称的。为了解释这个现象,他接受了斯特蒂文特(Sturtevant A. H.)的建议,提出了在噬菌体中重组可能不是遗传结构的断裂和重接,而是复制时改变了模板所致,即两条染色单体作为复制的模板,新的染色单体各以一个单体模板进行复制,在复制过程中相应交换模板,从而造成重组(图6)[2]。
122
4
132
4
(a) 断裂重接模型
(b) 选择复制模型
图6 断裂重接模型和选择复制模型的比较
292
模板选择模型能够很好地解释基因转变的现象,因此在20世纪50年代兴盛起来。1964年,Holliday 模型的提出者霍利德(Holliday R.)[3]在《真菌中基因转换的机制》一文中对模板选择模型受到支持提出了缘由。他写道:“模板选择假设的好处是它做出了几个十分特别的预测:①基因物质的复制是连续不断的;②基因配对先于基因复制或与基因复制同时发生;③如果把这个假设用于解释交换和转换,并消除通过断裂和再接合引起的姊妹链交换,那么沿着染色体长度连续的交换应该包含相同的两个染色单体;④在一个给定的杂合子位置处,从突变体转换到野生型等位基因和从野生型转换到突变体等位
基因应该以相同的频率出现;⑤在相同的基因内,在不同的突变体之间的交叉中,转换到野生型等位基因的频率应该正比于这些突变体之间的距离,于是允许用附加的重组频率构建线性基因图谱。”接着,霍利德又指出模板选择模型遇到的困难。 他指出:“显然,预测①~③暂时没有得到实验证据的支持,在别处已经充分讨论了模板选择模
型的这些困难。此外,累积的证据不支持预测
④。1962年Kaniti 等发现在芽孢颜色突变体和野生型的交叉中,从突变体到野生型等位基因的转换频率大约是在反方向上转换频率的1/5……在许多研究中似乎是证明了预测⑤。”[3]
4 同源重组分子机制的确立
4.1 Holliday模型
1964年美国分子生物学家霍利德提出了揭示同源重组关键步骤的模型,这是一个解释同源重组的简单但在遗传学历史上极为重要的模型。它很好地解释了DNA 链侵入、分支移位和Holliday 联结体拆分等同源重组的核心过程。
Holliday 模型的主要内容是:①在减数分裂前期1的双线期,同源染色体相互靠近,两条染色单体(双链DNA 分子)联会(图7(a))。②两个DNA 分子中两个方向相同的单链(图7中链2和链3),在DNA 内切酶
作用下,在相同的位置上同时被切开。在每个切开的地方双螺旋稍微解开,释放出单链(图7(b))。③释放的单链通过和
图7 同源染色单体的重组和有效配对的各个阶段的图解说明:两条实线表示染色单体的DNA 双链,而两条虚线表示其他染
色单体的DNA
双链;箭头表示这些链的极性;水平短线给出基因中断处或连接处位置