illuminaSBS测序详解中国古代兵器
最近回头重新看了illlumina paired end quence的测序原理视频,发现了以前没有注意的⼀些问题,⽽这些问题也是⼤家平时容易搞错的,因此花了⼏天时间将illumina 的paired end quence 从构建⽂库到上机测序的整个过程以及原理较为详细的写了出来。
基础知识:illumina测序的核⼼在于利⽤可逆终⽌的、荧光标记的dNTP进⾏边合成边测序
Flowcell(流动池)是有着2个或8个lane(泳道)的玻璃板,。每个lane可以测⼀个样本或者多样本的混合物,且随机布满了能够与⽂库两端接头分别互补配对或⼀致的寡核苷酸(oligos,P7和P5接头)。⼀个lane包含两列,每⼀列有60个tile,每个tile会种下不同的cluster,每个tile在⼀次循环中会拍照4次(每个碱基⼀次)。
paried-end quencing
⼀、Library Preparation⽂库的构建
1. 利⽤转座⼦(transposome)对双链DNA进⾏剪切以及接头(adapter)的连接
2. 接头连接成功后,利⽤低循环扩增技术在接头处进⾏修饰,分别在两端添加quencing primer bindin
g site1/quencing primer binding site2(即测序引物结合位点)、index1/index2以及我们称之P5和P7的寡核苷酸序列
上图并没有将之前的adapter标志出来,下图是维基百科的⽰意图,详细⼀些。
这⾥要注意两点(1)P5和P7是不同的,它们分别和flowcell上的接头互补和相同。为了⽅便阐述,将与P5互补的接头称为P5’,与P7互补的接头称为P7’。(2)index1和index2也是不同的,与P5相连的是index2,与P7相连的是index1。
1月英语怎么写
关于index,也叫barcodes,因为⼀个lane可以同时测多个样品,为了避免混淆样品的read products,每种样品的DNA由⼀种index修饰,这样测序得到的reads都是具有index标记的,在测序结果中,依据之前标签与样品的对应关系,就可以获得对应样品的数据。⽽这⾥的index1和index2是为了区分paired-end测序得到的双端reads。
⼆、Cluster generation 簇⽣成
1. Flowcell上随机分布了两种不同的寡核苷酸序列,分别与P5互补(即P5’),与P7⼀致(即P7)。
2. 待测quence通过P5与folwcell上的P5’序列杂交互补,以待测quence为模板进⾏互补链(即rever strand)的延伸,互补链的两端为P5’和P7’。
肥胖的原因3. 接下来模板链被切断并洗下
勤俭节约小故事Rever strand的P7’与Flowcell上的P7杂交互补,进⾏链的合成,这就是我们所熟知的桥式PCR
接下来合成的双链被解链,再分别与Flowcell上的接头杂交互补,延伸....解链,杂交,延伸,解链...如此重复35个循环
4. 桥式PCR完成后,使⽤NAOH将双链解链,并利⽤甲酰胺基嘧啶糖苷酶(Fpg)对8-氧鸟嘌呤糖苷(8-oxo-G)的选择性切断作⽤,选择性地将P5’与链的连接切断,留下与Flowcell上P7连接的链,也就是Forward strand。同时游离的3’端被阻断,防⽌不必要的DNA延伸
三、测序
1. 测序引物(quencing primer)结合到靠近P5的测序引物结合位点1(quencing primer binding site 1)上,在系统中加⼊四种dNTP和DNA聚合酶。这⾥的dNTP有两个特点:它是有荧光基团标记的,每种碱基标记的荧光基团不⼀样。它的3’末端连了⼀个叠氮基。这个叠氮基能够阻断后⾯的碱基与它相连
因此在聚合酶的作⽤下,与Forward strand相应位置碱基配对的dNTP就会结合到新合成的链上,⽽由于叠氮基的存在,后⾯的dNTP⽆法继续连接。这时⽤⽔将剩余的dNTP和酶给冲掉,将Flowcell进⾏
扫描,扫描出来的荧光对应的碱基的配对碱基即是该链该位置的碱基。同时在这个Flowcell上有成千上万个cluster也在进⾏同样的反应,因此⼀个循环就能同时检测多个样本(这也是⾼通量的核⼼所在)。这个循环完成后,加⼊化学试剂把叠氮基和标记的荧光基团切掉,进⾏下⼀个循环(碱基的连接、检测与切除)。如此重复直⾄所有链的碱基序列被检测出。也就是Forward read 序列。
王子烟
2. Index测序:所有循环结束后,read products 被洗掉,index1 primer与链上index primer1 结合位点杂交配对,进⾏index1的合成及检测
3. Index1测序完成后,洗脱测序产物。此时机器已通过荧光得到了index1的序列
古诗草4.Index2测序:Forward strand顶端的P5序列与Flowcell上的P5’杂交配对,进⾏index2测序。测序完成后洗脱产物
四、Paried-end quencing(即对Rever strand测序)
1. 洗脱index2测序产物后,以Flowcell上的P5’为引物,Forward strand为模板进⾏桥式扩增,得到双链
2. NAOH使双链变性为单链,并洗去已经测序完成的Forward strand
昨日的世界
利息英文3. 类似的,readprimer2结合到靠近P7’的read primer binding site 2开始对Rever strand的测序。测序完成后即可得到Rever read序列。
总结:有两点需要重点注意:(1)DNA⽚段连接的两个接头P5和P7,它们与Flowcell上的两种寡核苷酸序列分别互补和相同,并不是都相同
(2)结合在DNA⽚段两端的index序列也不同,分别是index1和index2
前⾯介绍的都是paired-end的测序,⽽single-end测序⽅式是只将index,quencing primer binding site以及P7/P5添加到 fragamented DNA⽚段的⼀端,另⼀端直接连上P5/P7,将⽚段固定在Flowcell上桥式PCR⽣成DNA簇,然后单端测序读取序列
最后给出illumina的官⽅视频
/v_show/id_XMTI1MjA5Mzg5Mg==.html?
spm=a2h0k.8191407.0.0&from=s1.8-1-1.2