测序技术的前世今生
测序技术的发展历程
第一代测序技术(Sanger测序)
第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法
或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解),在
2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。
原理:ddNTP的3’无羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中
断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP
(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置
确定待测分子的DNA序列。
第二代测序技术(NGS)
第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本
高,通量低等方面的缺点,严重影响了其真正大规模的应用。经过不断的技术开发和改进,以
Roche公司的454技术、illumina公司的Solexa、Hiq技术和ABI公司的Solid技术为标记的第二
代测序技术诞生了。其大大降低了测序成本的同时,还大幅提高了测序速度,并且保持了高准确
性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但在
序列读长方面比起第一代测序技术则要短很多,大多只有100bp-150bp。
1. illumina
Illumina公司的Solexa和Hiq是目前全球使用量最大的第二代测序机器,占全球75%以上,
以HiSeq系列为主,技术核心原理都是边合成边测序的方法,测序过程主要分为以下4步:
1)构建DNA测序文库
DNA分子用超声波打断成200bp-500bp长的序列片段,并在两端添加上不同的接头。
2)测序流动槽(flowcell)
结构:Flowcell是测序的载体,课吸附DNA文库,每个flowcell有8条lane,每个lane有2
行column,每行column有60个tail,每个tail经CCD镜头课捕获荧光信号。
3)成簇(cluster)
NGS 的核心技术特点,目的在于实现将单一碱基的信号强度进行放大,以达到CCD镜头摄
取荧光的信号要求。大体原理网上都可查到,在此解答2大难理解之处:
一.可逆终止荧光dNTP(Illumina测序核心技术)
荧光修饰dNTP可逆合成终止(包括用叠氮基团即起到了可逆终止作用和用不同荧光集团区
别碱基信号的功能),是Illumina测序的最核心技术。
1. 上图是修饰过的dCTP分子结构式,在核苷酸糖基的3'位连一个叠氮基团(红色基团)。这个
叠氮基团在链延伸的时侯起到了阻止聚合的作用(理解见下图DNA复制时的5’和3’的示意图,
下一个碱基合上时是:下一个核苷酸的5’P连接到上一个核苷酸的3’OH,故如果下一个核苷酸的
3’带有叠氮基团而非自然状态下的OH时,下一个核苷酸就无法合上。)
。
2. 叠氮基团有一个特性,就是遇到巯基试剂(例如:二巯基丙醇),叠氮基团会发生断裂,
并在原来的位置留下一个羟基因此在荧光照相之后可以借此回复3’的-OH状态,百家姓故事 以供下一个碱基
合上。
3. 在碱基上,通过连接臂(蓝色基团)连接一个荧光基团。4种dNTP分别连4种不同颜色
的荧光基团。测序时,通过识别荧光基团的颜色,就可以判断原来的碱基是哪一种。
在dNTP
被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入
激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利
用计算机分析将光学信号转化为测序碱基。荧光信号记录完成后,再加入化学试剂[
TCEP(Tris
(2-carboxyethyl) phosphine,三(2-羧乙基)膦)巯基试剂3'位阻断的叠氮基
]淬灭荧光信号,并用去除
团
,以便能进行下一轮的测序反应。
注:每一步试剂具有极高的处粉肠的做法大全 理效率,因为在要重复几百次的反应中(),每
30~40x测序
步的得率差一点,最终的结果就会差许多,所谓的指数放大效应。
缺点
1) Prephasing:在边合成边测序过程中,每个循环应该合成一个碱基,因为某些原因,
会一个循环合成二个或更多的碱基,这种多合成碱基的情况就称为Prephasing。叠氮基团在
常温下不是很稳定,尤其是3'位的叠氮基脱落,是导致测序时的Prepha的主要原因。
Prephasing越严重,则测长越短(因为多个1个循环只记录1个碱基,如果1个循环中同时
合上了多个碱基,则势必相对长度缩短)。Prephasing占了Illumina测序长度中几乎一半的
限制性因素。
(叠氮基团在常温下不是很稳定,Illumina的测序SBS试剂鼻塞偏方 都要低温保存。Illumina的新型测序仪
(HiSeq/NextSeq/MiSeq等)的内部还内置了一个小冰箱,来给试剂降温。)
2) Phasing:在边合成边测序过程中,每个循环应该合成一个碱基,因为某些原因,
会一个循环没有合成碱基,这种少合成碱基的情况就称为Phasing。用修饰的dNTP代替天
然dNTP来进行边合成边军队文职干部 测序的工作,就会遇到天然聚合酶对修饰dNTP的聚合效率低的问
题。Phasing越严重,则测长越短。Phasing是除Prephasing外的另一个重要长限制因素。(另
外还有的两个测长限制因素是:桥式PCR对文库长度的限制、和激光会打断DNA链。
(天然聚合酶对修饰dNTP的聚合效率低:Illumina用基因工程定向进化的方法不断地
改进其测序聚合酶,以提高酶对修饰dNTP的合成效率。现在Illumina的试剂已经改到
V4版。Illumina的每次酶改版,都带来测序能力的大幅提升。)
二 化学方法选择性、定点切断特定DNA链
在Illumina的测序过程中,无论是单端还是双端测序,都会用到特异选择性链切断的过程。
其中单端测序的要切断1次,双端测序中的两条链要先后各切断1次(共2次)。
单端测序(35cycles):在完成桥式PCR后,把Read 1测序引物杂交到模板上之前,需要切
断桥式PCR所形成的双链中的一条,只留下单一的模板链,以作为模板,供下面的边合成、边
测序之用。
方法:高碘酸希夫反应:过碘酸把糖类相邻两个碳上的羟基氧化成醛基。
原理:P5最后一个碱基A的糖基的第4和第5位的C分别加入一个-OH(二羟基-diol,即构
成P5-diol-OH),桥式PCR后用高碘酸钠溶液处理,高碘酸根快速、精确地将二个醇基之间的那
个碳碳键切断,洗掉P5相接的那条DNA链,当然,最后一个碱基A也被洗掉了,如下图:
双端测序
第一条链切断(在上图中的第2步):第一次桥式PCR之后(25-28cycles)和单端测序中的那次
切断的目标一样,是要留下双链中的一条,以作为read 1的测序模板。
方法: 通过在P5中加入一个U碱基(具体序列信息待查),而后在要切断这链链的时侯,
用USER酶(Uracil Specific Excision Reagent,尿嘧啶链特定切断试剂)来切一下。
USER™(尿嘧啶-特异性切除试剂)酶在尿嘧啶位置产生一个单核苷酸缺口。USER 酶是尿嘧啶 DNA 糖基化酶(UDG)和 DNA 糖
基化酶-裂解酶 Endo VIII 的混合物。UDG 催化尿嘧啶碱基的切割,形成一个脱碱基(脱嘧啶)位点,但保持磷酸二酯骨架结构完整。
Endo VIII 的裂解酶活力使脱碱基位点 3 和 5 端的磷酸二酯键断裂,释放无碱基的脱氧核糖。
第二次切断(上图中的7):
方法: “甲酰毛笔草书字帖欣赏 胺基嘧啶糖苷酶,FPG”对“8-氧鸟嘌吟糖苷,8-oxo-G”的选择性切断作用。
P7的3’末端最后一个G被修饰为8-oxoguanine,是FPG的作用位点,Fpg就把“8-oxo-G”碱
基切掉(步骤A),并把那条链给切断(步骤B),剩下的结构是P7的3’末端有一个与上一个
核苷酸的3’-OH相连的磷酸基以及一个不完整糖基的磷酸基,也就是上图中,其5’
磷酸基团连接着上一个核苷酸的3’端,所以此结构相当于Blocked P7 接头的3’ ,起到了阻止链
延伸的作用。
在后面重新长簇的时候,会重新利用这个接头,所以要恢复3'端羟基,此时再用“脱嘌呤嘧
啶内切核酸酶,AP-endonuclea”把带不完整糖基的那个磷酸基切掉(至此,彻底切掉了P7的最
后一个尿嘧啶G),3'端羟基就露出来了(步骤C)。
4)测序
边合成边测序,向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的
4中dNTP(具体见上文)。这些dNTP的3’-OH被叠氮基团保护,因而每次只能添加一个dNTP,
这就确保了在测序过程中,一次只会被添加一个碱基。同时在dNTP被添加到合成链上后,所有
未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激
发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱
基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以
便能进行下一轮的测序反应。
30x-50x测序深度对于Hisq系列需要100小时,而对于2017年初最新推出的NovaSeq系列
则只需要40个小时!
下面是测序量比较(双流动槽为例,如为单流动槽则测序量减少为下表的一半,时间不变)
一次测序的数据总产量的单位Gb,不是计算机字节,而是测序碱基的数目(Giga ba)
第三代测序技术
单分子测序,以PacBio公司的SMRT和Oxford Nanopore Technologies纳米孔单分子测序技
术为主,最大的特点就是单分子测序,测序过程无需进行PCR扩增,超长读长,平均达到10Kb-15Kb,
是二代测序技术的100倍以上。
基本原理是:边合成边测序的原则,DNA聚合酶和模板结合, 4 种碱基(荧光标记dNTP),
在碱基配对阶段发出不同光,根据光的波长与峰值可判断进入的碱基类型。读长主要跟酶的活性
保持有关。
SMRT技术的测序速度很快,每秒约10个dNTP。但是,同时其测序错误率比较高(这几乎
是目前单分子测序技术的通病),达到10%-15%,而且以缺失序列和错位居多。但可通过多次测
序来进行有效的纠错。
PacBio SMRT技术除了能够检测普通的碱基之外,还可以通过检测相邻两个碱基之间的测序
时间,来检测碱基的表观修饰情况,如甲基化。因为假设某个碱基存在表观修饰,则通过聚合酶
时的速度会减慢,那么相邻两峰之间的距离会增大,我们可以通过这个时间上的差异来检测表观
甲基化修饰等信息。
Oxford Nanopore
Oxford Nanopore 的MinION是另一个比较受关注的第三代测序仪,俗称U盘测序仪。是基
于电信号而不是股权变更协议 光信号的测序技术!
技术关键是特殊的纳米孔,孔内共价结合有分子接头。当DNA碱基通过纳米孔时,它们使
电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同
的),灵敏的电子设备检测到这些变化从而鉴定所通过的碱基,理论上,它也能直接测序RNA。。
附:
本文发布于:2023-04-20 02:26:19,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/82/505253.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |