一种转录组文库的建库方法及其应用与流程
1.本发明属于基因测序领域,具体涉及一种转录组文库的建库方法及其应用。
背景技术:
2.转录组文库有助于知悉转录物的集合,需要对逆转录成的cdna进行扩增后才能建库。
3.目前的扩增方案主要分为两类: 1. 基于pcr指数扩增技术:该技术要求cdna模板两端都有通用引物序列,在smart-seq、seqwell、drop-seq、strt-seq、scrb-seq、10
×ꢀ
genomics以及microwell-seq等方案中通用引物序列是通过模板转换作用获得;在quartz-seq和matq-seq中是先通过末端转移酶tdt在所有cdna末端添加相同重复碱基后以该重复碱基为延伸位置从而获得通用引物序列;在bd rhapsody和seekone
®ꢀ
mm单细胞rna-seq技术方案中通过携带有通用序列的随机引物进行二链合成获得通用引物序列;2. 基于体外线性转录技术:在mars-seq、cell-seq和indrop等技术方案中需要将cdna合成二链后转录为大量的rna,然后将倍增的rna连接单链接头后逆转录为dna进一步pcr扩增。在这些cdna扩增方案中模板转换方案较为方便快捷,但其模板转换效率只有20-60%,而且模板转换效率严重依赖与rna 5’帽子结构,因此一条rna平均发生一次模板转换,这极大的限制了使用二代测序对rna全长序列的分析,例如10
×ꢀ
genomics只能检测单细胞rna的3’或者5’序列;体外线性转录技术和tdt技术方案虽然能实现对rna全长序列的分析,但其实验流程复杂,时间浪费严重。更复杂的是,无论通过pcr指数扩增还是体外转录线性扩增最后得到的dna扩增产物还需要进一步的打断、接头连接与index扩增,整个流程最快也需要8小时才能完成,因此需要更加快速的而且能够用于rna全长序列分析的高效率cdna扩增和建库方案。
技术实现要素:
4.本发明提供一种转录组文库的建库方法及其应用,旨在提供一种快速的建库方案。
5.为达到上述目的,本发明提供一种转录组文库构建方法,包括以下步骤:步骤s1:提供待检测rna反应体系,所述待检测rna反应体系含有待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用逆转录引物对所述待检测rna进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤b):采用逆转录引物对所述待检测rna进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链合成,得到所述双链产物,所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;
步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到片段化的双链产物;步骤s4:采用pcr体系与所述片段化的双链产物反应,得到转录组文库;其中,所述pcr体系包含扩增酶及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述通用引物序列相同的引物结合序列,所述第二引物包含与所述接头序列相同的接头结合序列,且所述第一引物和/或所述第二引物还包含文库标签。
6.可选地,所述待检测rna反应体系为含有所述待检测rna的悬液或含有所述待检测rna的细胞悬液。
7.可选地,所述逆转录序列为固定序列、随机序列或者半随机序列;和/或,所述第一引物还包含第一接头测序接头序列,所述第一接头测序接头序列与所述引物结合序列连接;和/或,所述第二引物还包含第二接头测序接头序列,所述第二接头测序接头序列与所述接头结合序列连接。
8.此外,本发明提供一种单细胞转录组文库构建方法,包括以下步骤:步骤s1:提供多个单细胞的待检测rna体系,各所述单细胞的待检测rna体系含有单细胞的待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列、细胞标签以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点,同一组的所述多条逆转录引物含有的细胞标签相同,不同组的所述多条逆转录引物含有的细胞标签不同;步骤b):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链合成,得到所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列、细胞标签以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点,同一组的所述多条逆转录引物含有的细胞标签相同,不同组的所述多条逆转录引物含有的细胞标签不同;步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到片段化的双链产物;步骤s4:采用pcr体系与所述片段化的双链产物反应,得到转录组文库;其中,所述pcr体系包含扩增酶及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述通用引物序列相同的引物结合序列,所述第二引物包含与所述接头序列相同的接头结合序列,且所述第一引物和/或所述第二引物还包含文库标签。
9.可选地,所述步骤s1包括:各所述单细胞的待检测rna体系为含有一个单细胞的待检测rna的油包水体系或
含有一个单细胞的待检测rna的微孔体系。
10.可选地,所述步骤s2中,各所述逆转录引物还包含分子标签,所述分子标签与所述细胞标签连接,且所述多条逆转录引物的分子标签不同。
11.此外,本发明提供一种单细胞转录组文库构建方法,包括以下步骤:步骤s1:提供多个单细胞的待检测rna体系,各所述单细胞的待检测rna体系含有单细胞的待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤b):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链合成,得到所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到多个单细胞的片段化的双链产物;步骤s4:提供多组标签体,将多组所述标签体与多个所述单细胞的片段化的双链产物一一对应进行连接反应,得到多个标记的单细胞的片段化的双链产物,其中,每组标签体含有多个标签,各所述标签依次包含引物结合序列1、细胞标签和连接接头,所述连接接头可与所述接头连接,且不同组的多个所述标签的所述细胞标签不同,同一组的多个所述标签的所述细胞标签相同;步骤s5:采用pcr体系与所述片段化的双链产物反应,得到单细胞转录组文库;其中,所述pcr体系包含扩增酶及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述引物结合序列1相同的序列,所述第二引物包含与通用引物序列相同的序列,且所述第一引物和/或所述第二引物还包含文库标签。
12.可选地,各所述逆转录引物还包含分子标签,所述分子标签连接于所述通用引物序列以及逆转录序列之间,多条所述逆转录引物的所述分子标签不同;或,各所述标签还可包含分子标签,所述分子标签连接于所述细胞标签和连接接头之间,多条所述标签的所述分子标签不同。
13.可选地,多个所述单细胞中,至少包含来源于两个样品的单细胞,各所述逆转录引物还包含样品标签,所述样品标签连接于所述通用引物序列以及逆转录序列之间,多组所述逆转录引物中,与来源于同一样品的多个单细胞的所述待检测rna体系进行所述逆转录反应的所述逆转录引物的所述样品标签相同,与来源于不同样品的多个单细胞的所述待检测rna体系进行所述逆转录反应的所述逆转录引物的所述样品标签不同。
14.此外,本发明还提供一种测序方法,包括以下步骤:步骤a10:采用上述转录组文库构建方法、采用上述任一单细胞转录组文库构建方法构建测序文库;
步骤a20:使用测序平台对所述测序文库进行测序。
15.本发明中,通过使用含有通用引物序列和逆转录序列的引物进行逆转录,采用含相同双接头的转座酶进行切割并引入接头序列,对切割后的双链产物进行扩增,获得转录组文库。本发明建库简便、快速,不仅减少rna建库时间,同时还能够分析rna全长序列。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅为本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
17.图1为本发明一实施例流程示意图;图2为本发明使用的细胞标签微珠上的逆转录引物结构示意图;图3为本发明转座子与普通转座子结构对比的示意图;图4为本发明单细胞转录文库的构建一实施例原理示意图;图5为本发明单细胞转录文库的构建又一实施例原理示意图;图6为实施例1构建成功的3’单细胞rna测序文库质控;图7为单细胞文库的测序策略;图8为实施例2构建成功的固定单细胞文库质控。
18.图9为实施例3构建成功的固定混样单细胞文库质控。
19.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
20.为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。
21.需要说明的是,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。另外,全文中出现的“和/或”的含义,包括三个并列的方案,以“a和/或b”为例,包括a方案、或b方案、或a和b同时满足的方案。此外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
22.鉴于现有的转录组建库流程复杂,效率低下的问题,本发明提供本发明提供一种转录组文库构建方法,参见图1,包括以下步骤:步骤s1:提供待检测rna反应体系,所述待检测rna反应体系含有待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用逆转录引物对所述待检测rna进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转
录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤b):采用逆转录引物对所述待检测rna进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链合成,得到所述双链产物,所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到片段化的双链产物;步骤s4:采用pcr体系与所述片段化的双链产物反应,得到转录组文库;其中,所述pcr体系包含扩增酶及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述通用引物序列相同的引物结合序列,所述第二引物包含与所述接头序列相同的接头结合序列,且所述第一引物和/或所述第二引物还包含文库标签。
23.本发明中,通过使用含有通用引物序列和逆转录序列的引物进行逆转录,采用含相同双接头的转座酶进行切割并引入接头序列,对切割后的双链产物进行扩增,获得转录组文库。本发明建库简便、快速,不仅减少rna建库时间,同时还能够分析rna全长序列。
24.需要说明的是,在所述步骤s1中,可根据具体情况选择对应的反应体系,在一些实施例中,所述待检测rna反应体系为含有所述待检测rna的悬液或含有所述待检测rna的细胞悬液,所述细胞悬液可以是新鲜细胞也可以是固定透化细胞。
25.需要说明的是,本发明说明的固定透化细胞是将待检测细胞先进行固定处理,使其rna固定于细胞内,避免其向细胞外扩散,导致rna损失及细胞污染;后经透化处理,细胞膜通透性增强,便于试剂的进入。
26.具体地,在一些实施例中,含有所述待检测rna的固定透化细胞的包括以下制备步骤:将单细胞采用固定液进行固定后,采用透化试剂进行处理,得到所述固定透化细胞。
27.所述固定液包含交联性质的甲醛、多聚甲醛固定、非交联性质的醇类、酸类中的至少一种,所述透化试剂包含活性表面物质。
28.需要说明的是,在所述步骤s2中,由于转座酶的切割对象是双链产物,因此,在可以构建双链产物的前提下,可以根据实际检测需要选择所述步骤s2中(a)或(b)中的任意方式获取双链产物,选取步骤(a)获取方式更为简单,测序时间进一步缩短,而选择(b)由于最终产物为双链dna,结构更加稳定,更加易于长时间的保存。
29.在一些实施例中,所述逆转录序列可根据需要选择,例如,在对于真核生物,所述逆转录序列可以选取固定序列、随机序列或半随机序列;当设计成固定序列时,可以逆转录出靶向序列,当固定序列可为oligo-(dt)n序列,n的数量在10~100之间时,可对含有polya的序列进行测序;例如,也可设计成随机序列或半随机序列,可实现基因全序列检测。
30.在一些实施例中,所述逆转录引物可负载在一个负载体上,参见图2,可以理解的是,所述通用引物序列与所述负载体连接,并所述通用引物序列与所述负载体可在特定条件下断裂,以此保证所述逆转录序列与rna结合进行逆转录。具体地,在靠近所述通用引物
序列端部设计一个断点与所述通用引物序列连接,所述断点可为pc linker等等。
31.参见图3中的a,常规转座酶包埋的两种不同接头,经该转座酶切割后,会引入两个不同的接头,在本发明的单细胞转录组中使用常规转座酶的结果是在测序文库中会存在部分不完整的单细胞转录组文库,影响测序产出及测序基因数等指标。而在本发明步骤s3中,采用含有相同接头的转座酶(图3中的b或c),最终会实现只在其中一端引入接头,而另一端的接头由逆转录引物引入,则可避免上述问题的发生。在一些实施例中,所述转座酶为含有相同双接头的t5转座酶。
32.需要说明的是,在所述步骤s4中:所述第一引物还包含第一接头测序接头序列,所述第一接头测序接头序列与所述引物结合序列连接;所述通用引物序列、引物结合序列以及第一测序接头序列可以根据测序需要进行设计;所述通用引物序列可以包含read1 sequence primer的全部或部分序列;所述引物结合序列包含与通用引物序列相同的序列;所述第一测序接头序列设计成为illumina测序平台可识别的p5序列。
33.当所述第一引物含有文库标签时,所述文库标签设于所述第一接头测序接头序列与所述引物结合序列之间。
34.所述第二引物还包含第二接头测序接头序列,所述第二接头测序接头序列与所述接头结合序列连接。可以理解的是,接头结合序列、接头以及第二测序接头序列可以根据测序需要进行设计,例如,所述接头包含read2 sequence primer的全部或部分序列,用以cdna的另一端引入引物结合位点;所述接头结合序列包含与所述接头序列相同的序列。所述第二测序接头序列可以设计成illumina测序平台可识别的p7序列。
35.当所述第二引物含有文库标签时,所述文库标签设于所述第二接头测序接头序列与所述接头结合序列之间。
36.在一些实施例中,所述步骤s4包括:步骤s401:采用扩增引物对片段化的双链产物进行扩增;步骤s402:进行片段分选,得到得到长度合适的转录组文库。
37.鉴于现有的单细胞转录组检测灵敏度低及建库过程繁琐等问题,本发明将上述转录组文库构建方法应用于单细胞转录组文库的构建,为此,本发明一种单细胞转录组文库构建方法,参见图4,包括以下步骤:步骤s1:提供多个单细胞的待检测rna体系,各所述单细胞的待检测rna体系含有单细胞的待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列、细胞标签以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点,同一组的所述多条逆转录引物含有的细胞标签相同,不同组的所述多条逆转录引物含有的细胞标签不同;步骤b):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链
合成,得到所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列、细胞标签以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点,同一组的所述多条逆转录引物含有的细胞标签相同,不同组的所述多条逆转录引物含有的细胞标签不同;步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到片段化的双链产物;步骤s4:采用pcr体系与所述片段化的双链产物反应,得到转录组文库;其中,所述pcr体系包含扩增酶以及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述通用引物序列相同的引物结合序列,所述第二引物包含与所述接头序列相同的接头结合序列,所述接头结合序列包含与所述接头序列相同的序列,且所述第一引物和/或所述第二引物还包含文库标签。
38.本发明中,通过使用含有通用引物序列和逆转录序列的引物进行逆转录,采用含相同双接头的转座酶进行切割并引入接头序列,对切割后的双链产物进行扩增,获得转录组文库。本发明建库简便、快速,不仅减少rna建库时间,同时还能够分析rna全长序列。
39.需要说明的是,在所述步骤s1中,可根据具体情况选择对应的反应体系,在一些实施例中,所述待检测rna反应体系为含有所述待检测rna的悬液或含有所述待检测rna的细胞悬液,所述细胞悬液可以是新鲜细胞也可以是固定透化细胞。
40.需要说明的是,本发明说明的固定透化细胞是将待检测细胞先进行固定处理,使其rna固定于细胞内,避免其向细胞外扩散,导致rna损失及细胞污染;后经透化处理,细胞膜通透性增强,便于试剂的进入。
41.具体地,在一些实施例中,含有所述待检测rna的固定透化细胞的包括以下制备步骤:将单细胞采用固定液进行固定后,采用透化试剂进行处理,得到所述固定透化细胞。
42.所述固定液包含交联性质的甲醛、多聚甲醛固定、非交联性质的醇类、酸类中的至少一种,所述透化试剂包含活性表面物质。
43.需要说明的是,在所述步骤s2中,由于转座酶的切割对象是双链产物,因此,在可以构建双链产物的前提下,可以根据实际检测需要选择所述步骤s2中(a)或(b)中的任意方式获取双链产物,选取步骤(a)获取方式更为简单,测序时间进一步缩短,而选择(b)由于最终产物为双链dna,结构更加稳定,更加易于长时间的保存。
44.在一些实施例中,所述逆转录序列可根据需要选择,例如,在对于真核生物,所述逆转录系列可以选取固定序列、随机序列或半随机序列;当设计成固定序列时,可以逆转录出靶向序列,当固定序列可为oligo-(dt)n序列,n的数量在10~100之间时,可对含有polya的序列进行测序;例如,也可设计成随机序列或半随机序列,可实现基因全序列检测。
45.在一些实施例中,所述逆转录引物可负载在一个负载体上,参见图2,可以理解的是,所述通用引物序列与所述负载体连接,并所述通用引物序列与所述负载体可在特定条件下断裂,以此保证所述逆转录序列与rna结合进行逆转录。具体地,在靠近所述通用引物序列端部设计一个断点与所述通用引物序列连接,所述断点可为pc linker等等。
46.参见图3中的a,常规转座酶包埋的两种不同接头,经该转座酶切割后,会引入两个
不同的接头,在本发明的单细胞转录组中使用常规转座酶的结果是在测序文库中会存在部分不完整的单细胞转录组文库,影响测序产出及测序基因数等指标。而在本发明步骤s3中,采用含有相同接头的转座酶(图3中的b或c),最终会实现只在其中一端引入接头,而另一端的接头由逆转录引物引入,则可避免上述问题的发生。在一些实施例中,所述转座酶为含有相同双接头的t5转座酶。
47.需要说明的是,在所述步骤s4中:所述第一引物还包含第一接头测序接头序列,所述第一接头测序接头序列与所述引物结合序列连接;所述通用引物序列、引物结合序列以及第一测序接头序列可以根据测序需要进行设计;所述通用引物序列可以包含read1 sequence primer的全部或部分序列;所述引物结合序列包含与通用引物序列相同的序列;所述第一测序接头序列设计成为illumina测序平台可识别的p5序列。
48.当所述第一引物含有文库标签时,所述文库标签设于所述第一接头测序接头序列与所述引物结合序列之间。
49.所述第二引物还包含第二接头测序接头序列,所述第二接头测序接头序列与所述接头结合序列连接。可以理解的是,接头结合序列、接头以及第二测序接头序列可以根据测序需要进行设计,例如,所述接头包含read2 sequence primer的全部或部分序列,用以cdna的另一端引入引物结合位点;所述接头结合序列包含与所述接头序列相同的序列。所述第二测序接头序列可以设计成illumina测序平台可识别的p7序列。
50.当所述第二引物含有文库标签时,所述文库标签设于所述第二接头测序接头序列与所述接头结合序列之间。
51.在一些实施例中,使用pcr扩增酶或者包含有链替代活性的多聚酶进行所述扩增。在酶的作用下在反应过程中形成完整的双链结构。
52.在一些实施例中,所述步骤s4包括:步骤s401:采用扩增引物对片段化的双链产物进行扩增;步骤s402:进行片段分选,得到得到长度合适的转录组文库。
53.此外,本发明还提供了单细胞转录组文库另一种构建方法,参见图5,包括以下步骤:步骤s1:提供多个单细胞的待检测rna体系,各所述单细胞的待检测rna体系含有单细胞的待检测rna;步骤s2:采用步骤a)或步骤b)中的任一方式获取双链产物:步骤a):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链即为所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;步骤b):采用多组逆转录引物对多个单细胞的所述待检测rna体系一一对应进行逆转录反应,得到mrna/cdna杂合链,再以所述mrna/cdna杂合链中的cdna为模板进行二链合成,得到所述双链产物,各组所述逆转录引物包含多条逆转录引物,各所述逆转录引物依次包含通用引物序列以及逆转录序列,所述逆转录序列可与所述待检测rna结合进行逆转录,所述通用引物序列用以在cdna的一端引入引物结合位点;
步骤s3:采用含有相同两个接头的转座酶对所述双链产物进行切割,得到多个单细胞的片段化的双链产物;步骤s4:提供多组标签体,将多组所述标签体与多个所述单细胞的片段化的双链产物一一对应进行连接反应,得到多个标记的单细胞的片段化的双链产物,其中,每组标签体含有多个标签,各所述标签依次包含引物结合序列1、细胞标签和连接接头,所述连接接头可与所述接头连接,且不同组的多个所述标签的所述细胞标签不同,同一组的多个所述标签的所述细胞标签相同;步骤s5:采用pcr体系与所述片段化的双链产物反应,得到单细胞转录组文库;其中,所述pcr体系包含扩增酶及扩增引物,所述扩增酶具有链替代活性,所述扩增引物包含第一引物与第二引物,所述第一引物包含与所述引物结合序列1相同的序列,所述第二引物包含与通用引物序列相同的引物结合序列2,且所述第一引物和/或所述第二引物还包含文库标签。
54.需要说明的是,在所述步骤s1中,可根据具体情况选择对应的反应体系,在一些实施例中,所述待检测rna反应体系为含有所述待检测rna的细胞悬液或含有所述待检测rna的固定透化细胞。
55.需要说明的是,本发明说明的固定透化细胞是将待检测细胞先进行固定透化处理后,使其rna固定于细胞内,避免其向细胞外扩散,导致rna损失及细胞污染;后经透化处理,细胞膜通透性增强,便于试剂的进入。
56.需要说明的是的,单细胞建库时,需要对单细胞进行隔离,使其避免污染,具体地,在一些实施例中,所述步骤s1包括:各所述单细胞的待检测rna体系为含有一个单细胞rna的油包水体系或含有一个单细胞rna的微孔体系。进一步地,当集成多个隔离的单细胞体系时,可以进行高通量的单细胞建库,例如微流控芯片等等。
57.在一些实施例中,所述步骤s2中,各所述逆转录引物还包含分子标签,所述分子标签连接于所述通用引物序列以及逆转录序列之间,多条所述逆转录引物的所述分子标签不同。通过引入分子标签,可以分辨每条测序序列。
58.当然,分子标签还可以通过标签引入,具体地,在一些实施例中,各所述标签还可包含分子标签,所述分子标签连接于所述细胞标签和连接接头之间,多条所述标签的所述分子标签不同。
59.在一些实施例中,所述逆转录引物可负载在一个负载体上,参见图2,可以理解的是,所述通用引物序列与所述负载体连接,并所述通用引物序列与所述负载体可在特定条件下断裂,以此保证所述逆转录序列与rna结合进行逆转录。
60.具体地,在靠近所述通用引物序列端部设计一个断点与所述通用引物序列连接,所述断点可为pc linker等等。
61.需要说明的是,由于转座酶的切割对象是双链产物,因此,在可以构建双链产物的前提下,可以根据实际检测需要选择所述步骤s2中(a)或(b)中的任意方式获取双链产物,选取步骤(a)获取方式更为简单,实验操作时间进一步缩短,而选择(b)由于最终产物为双链dna,结构更加稳定,更加易于长时间的保存。
62.在一些实施例中,所述逆转录序列可根据需要选择,例如,在对于真核生物,所述逆转录系列可以选取固定序列、随机序列或半随机序列;当设计成固定序列时,可以逆转录
出靶向序列,当固定序列可为oligo-(dt)n序列,n的数量在10~100之间时,可对含有polya的序列进行测序;例如,也可设计成随机序列或半随机序列,可实现基因全序列检测。
63.在一些实施例中,多个所述单细胞中,至少包含来源于两个样品的单细胞,各所述逆转录引物还包含样品标签,所述样品标签连接于所述通用引物序列以及逆转录序列之间,多组所述逆转录引物中,与来源于同一样品的多个单细胞的所述待检测rna体系进行所述逆转录反应的所述逆转录引物的所述样品标签相同,与来源于不同样品的多个单细胞的所述待检测rna体系进行所述逆转录反应的所述逆转录引物的所述样品标签不同。
64.参见图3中的a,常规转座酶包埋的两种不同接头,经该转座酶切割后,会引入两个不同的接头,在本发明的单细胞转录组中使用常规转座酶的结果是在测序文库中会存在部分不完整的单细胞转录组文库,影响测序数据量产出及测序基因数等指标。而在本发明步骤s3中,采用含有相同接头的转座酶(图3中的b或c),最终会实现只在其中一端引入接头,而另一端的接头由逆转录引物引入,则可避免上述问题的发生。可以理解的是所述通用引物序列与所述连接接头可根据测序平台进行设计,所述通用引物序列与所述连接接头连接后可成为read1 sequence primer序列。在一些实施例中,所述转座酶为含有相同双接头的t5转座酶。
65.在一些实施例中,所述接头与所述连接接头采用介导引物连接,所述介导引物包括第一连接区域与第二连接区域,所述第一连接区域与所述接头互补,所述第二连接区域与所述连接接头互补。
66.在一些实施例中,所述步骤s4中,每组标签体还含有一个微珠,所述微珠与多个所述标签的所述引物结合序列1连接,且所述连接可在提供一定条件下进行断裂。具体地,在所述引物结合序列1的一端设计一个断点,所述断点与所述微珠连接,所述断点为pc linker等等。
67.需要说明的是,在所述步骤s5中,在一些实施例中,所述第一引物包含与引物结合序列1相同的序列;可以理解的是引物结合序列1、接头、连接接头可根据测序平台进行设计,接头以及连接接头包含read1 sequence primer的全部或部分序列,例如引物结合序列1设计成为illumina测序平台可识别的p5序列。
68.在一些实施例中,所述第二引物还包含第二接头测序接头序列,所述第二接头测序接头序列与所述引物结合序列2连接。可以理解的是,引物结合序列2、通用引物序列以及第二测序接头序列可以根据测序需要进行设计,例如,引物结合序列2、通用引物序列包含read2 sequence primer的全部或部分序列,用以cdna的另一端引入引物结合位点;所述第二测序接头序列可以设计成illumina测序平台可识别的p7序列。
69.当所述第二引物含有文库标签时,所述文库标签设于所述第二接头测序接头序列与所述接头结合序列之间。
70.在一些实施例中,所述步骤s4包括:步骤s401:采用扩增引物对片段化的双链产物进行扩增;步骤s402:进行片段分选,得到得到长度合适的转录组文库。
71.此外,本发明提供一种测序方法,包括以下步骤:步骤a10:采用上述转录组文库构建方法、采用上述任一单细胞转录组文库构建方法构建测序文库;
步骤a20:使用测序平台对所述测序文库进行测序。
72.采用上述建库方法建库后,通过测序平台可对文库产物进行测序。
73.以下结合具体实施例和附图对本发明的技术方案作进一步详细说明,应当理解,以下实施例仅仅用以解释本发明,并不用于限定本发明。
74.实施例1一、使用含有read2 seqprimer序列的转座子包埋转座酶1. 购买高转座活性的tn5转座酶(南京诺维赞),该转座酶可以特异性识别转座子两端反向重复的me序列(mosaic end),形成转座复合体后无偏好性地将转座子插入目标序列中;2. 按以下序列合成引物并溶解至10μm的浓度:primera : ctgtctcttatacacatct为me序列的正向序列primerb:gtctcgtgggctcggagatgtgtataagagacag,其中agatgtgtataagagacag为me序列的反向序列,gtctcgtgggctcgg为read2 sequencing primer部分序列;3. 将两种引物等量混合后按照以下温度条件退火,命名为rd2n mix:4. 按以下配方将rd2n mix包埋进转座酶:5. 混匀后置于30℃反应1 h。反应产物命名为tte mix,-30 ~
ꢀ‑
15℃保存。
75.二、构建高通量3’单细胞rna测序文库1. 抽取外周血并获得新鲜的pbmc细胞(外周血单核细胞),重悬于pbs中,进行细胞计数,确定单位体积中的细胞个数;
2. 油包水液滴生成及细胞标记2.1试剂准备2.1.1提前将seekone
®ꢀ
dd 3’单细胞文库构建试剂盒中的barcoded beads从-80℃中取出,平衡至室温;具体序列如下:5
’‑
ctacacgacgctcttccgatctjjjjjjjjjjjjjjjjjnnnnnnnnnnnntttttttttttttttttttttttttttttt-3’其中,ctacacgacgctcttccgatct为read1 sequencing primer,jjjjjjjjjjjjjjjjj为cell barcode,nnnnnnnnnnnn为分子标签,tttttttttttttttttttttttttttttt为与mrna中的polya互补配对,其中,每个j和n均选自atcg中的任一碱基。
76.2.1.2按照下表配置反应体系,表中的试剂为北京寻因公司已经市售的seekone
®ꢀ
dd根据细胞浓度计算细胞数为2000时的上样体积(μl)和补加nuclease-free water体积(μl),先加入相应的nuclease-free water至mix吹打混匀后,再加入单细胞悬液(细胞悬液加入前需吹打混匀),共计34.2 μl;最终单细胞混合液总体积为80 μl。
77.2.2 按照seekone
®ꢀ
dd 3’单细胞文库构建试剂盒说明书向芯片中加入对应试剂;芯片通道1:吸取78μl步骤2.1中的细胞相试剂,避免产生气泡;芯片通道2:将室温平衡好的barcoded beads充分振荡30 sec,瞬时离心5 sec,确保barcoded beads液体内没有气泡,用移液器吸取40 μl,吸头尖插入对应的孔位底部,缓慢注入,不要产生气泡;芯片通道3:吸取240μl carrier oil,插入标签3对应的孔位,缓慢注入,不要产生气泡;2.3 将gasket挂载于芯片夹具上层,确保gasket孔和芯片孔对齐。
78.2.4 seekone
®ꢀ
dd仪器运行按照seekone
®ꢀ
dd 3’单细胞文库构建试剂盒说明书操作流程将芯片放入seekone
®ꢀ
dd仪器中,开始运行程序;2.5油包水液滴转移程序运行结束后,点击弹出按钮,取出芯片。使用移液器将对应孔内生成的油包水
转移至新的0.2ml的pcr管中;2.6逆转录将步骤2.5中装有油包水的pcr管,放入pcr仪中运行下列程序,pcr热盖85℃,体积100μl;3. 逆转录产物回收3.1 反应结束后,向上述pcr管中加入100μl demulsion agent 试剂,室温静置2 min,瞬时离心;3.2 从pcr管底部缓慢吸取120 μl 透明油相丢弃,不要吸到粉红反应液;3.3 加入180 μl振荡混匀后的cleanup beads,轻轻缓慢吹打至少15次,室温孵育10 min;3.4 孵育结束后,将pcr管置于磁力架上吸附至溶液澄清,去除上清;3.5 保持在磁力架上加入300 μl 80%乙醇,约30 sec后去除上清;重复此步骤一次;3.6 瞬时离心,用10 μl移液器去除所有残留的上清;3.7 室温静置2 min使乙醇挥发,加入22.5 μl nuclease-free water充分悬浮磁珠,室温静置2 min;3.8 置于磁力架上吸附至溶液澄清,转移上清22 μl至新的0.2 ml pcr管中。
79.4. 转座酶打断4.1 于室温解冻5
ꢀ×ꢀ
tagment buffer l,上下颠倒混匀后备用4.2在根据说明书(诺维赞td501)在灭菌pcr管中依次添加各反应组分,混匀后置于pcr仪中50℃反应10min后冷却至10℃;
4.3 使用1
×ꢀ
dna分选磁珠纯化得到22.5μl的打断dna溶液液。
80.5. 链替代延伸并扩增文库5.1 根据说明书(诺维赞td501),按以下体系吹匀后进行扩增以添加文库接头和样本标签:其中p5 引物和n7引物序列为:5.2 将pcr产物用dna clean beads进行分选得到文库,文库大小如图6所示;5.3 illumina novaseq 6000测序,测序策略如图7所示。该方案与传统使用模板转换方案(10
×ꢀ
genomics 3’单细胞转录组建库试剂盒)的流程对比如下表所示,可以明显看出实验步骤与所需时间大幅降低。
81.实施例2
一、构建高通量固定单细胞rna测序文库1. 获取新鲜培养的k562细胞重悬于pbs中,然后使用4%多聚甲醛溶液固定10min并在0.2%(v/v) triton x-100水溶液中透化细胞膜,洗涤后pbs重悬新细胞,计量细胞浓度;2. 油包水液滴生成及细胞标记2.1试剂准备2.1.1提前将seekone
®ꢀ
dd 全序列单细胞rna文库构建试剂盒中的barcoded beads从-80℃中取出,平衡至室温;2.1.2按照下表配置反应体系根据细胞浓度计算细胞数为2000时的上样体积(μl)和补加nuclease-free water体积(μl),先加入相应的nuclease-free water至mix吹打混匀后,再加入单细胞悬液(细胞悬液加入前需吹打混匀),共计34.2 μl;最终单细胞混合液总体积为80 μl。注意,与seekone
®ꢀ
dd 3’单细胞文库构建试剂盒不同,该试剂盒中所用的逆转录引物为随机引物,具体序列如下:5
’‑
ctacacgacgctcttccgatctjjjjjjjjjjjjjjjjjnnnnnnnnnnnnttnnn-3’其中,ctacacgacgctcttccgatct为read1 sequencing primer,jjjjjjjjjjjjjjjjj为cell barcode,nnnnnnnnnnnn为分子标签,ttnnn为逆转录序列,可与rna序列随机结合,其中,每个j和n均选自atcg中的任一碱基。
82.2.2 按照seekone
®ꢀ
dd 全序列单细胞rna文库构建试剂盒说明书向芯片中加入对应试剂;芯片通道1:吸取78μl步骤2.1中的细胞相试剂,避免产生气泡;芯片通道2:将室温平衡好的barcoded beads充分振荡30 sec,瞬时离心5 sec,确保barcoded beads液体内没有气泡,用移液器吸取40 μl,吸头尖插入对应的孔位底部,缓慢注入,不要产生气泡;芯片通道3:吸取240μl carrier oil,插入标签3对应的孔位,缓慢注入,不要产生气泡;2.3 将gasket挂载于芯片夹具上层,确保gasket孔和芯片孔对齐。
83.2.4 seekone
®ꢀ
dd仪器运行按照seekone
®ꢀ
dd 全序列单细胞rna文库构建试剂盒说明书操作流程将芯片放
入seekone
®ꢀ
dd仪器中,开始运行程序;2.5油包水液滴转移程序运行结束后,点击弹出按钮,取出芯片。使用移液器将对应孔内生成的油包水转移至新的0.2ml的pcr管中;2.6逆转录将步骤2.5中装有油包水的pcr管,放入pcr仪中运行下列程序,pcr热盖85℃,体积100μl;3 细胞回收与转座酶打断3.1 反应结束后,向上述pcr管中加入100μl demulsion agent 试剂,室温静置2 min,瞬时离心;3.2 从pcr管底部缓慢吸取120 μl 透明油相丢弃,不要吸到粉红反应液;此时逆转录后的固定细胞存在于粉红水相中;3.3 配置转座酶反应体系根据说明书(诺维赞td501)在灭菌pcr管中依次添加以下各反应组分并混匀:3.4 将粉红水相转移至1.5ml离心管,4℃条件下1000g离心5min,小心去除上层上清;重新加入1ml 含有0.1% triton x-100的1x pbs溶液,重复4℃条件下1000g离心5min后完全去除上清;3.5将转座酶反应体系加入固定细胞中吹打混匀后转移至pcr管,置于pcr仪中50℃反应10min后冷却至10℃。
84.3.6 将转座反应溶液转移至1.5ml离心管,4℃条件下1000g离心5min,小心去除上
层上清;重新加入1ml含有0.1%(v/v)tritonx-100的1xpbs溶液,重复4℃条件下1000g离心5min后完全去除上清;3.7向管中加入蛋白酶k和2%(v/v)sds,55度反应1h进行解交联反应;3.8反应结束后,向管中加入1倍体积的dnacleanbeads进行纯化,50.5μl双蒸水洗脱;3.9转移50ul上清液至新的0.2ml离心管中。
85.4.文库延伸及扩增4.1根据说明书(诺维赞td501)按以下体系配置扩增反应液:其中p5引物和n7引物序列为:4.2将上述配置好的扩增反应液加入步骤3.9的产物中,按照上表中的扩增程序pcr以添加文库接头和样本标签;4.3将pcr产物用dnacleanbeads进行分选得到文库。如图8所示,文库片段主峰为230bp,无杂带;4.4使用illumina测序仪按照图7所示的测序策略测序,测序数据分析结果如下表所示。
86.在投入2000固定细胞时测序得到1018个细胞数据,细胞捕获率50.9%。在平均每个细胞测95452条reads的情况下中位细胞的基因数为3123个基因,说明该方案可以较好检测多聚甲醛固定细胞的单细胞转录组。其中有效基因map率低是因为大量核糖体rna被随机引物逆转录导致,可以进一步使用细胞生物学和分子生物技术提高该指标,单纯提高这两个指标不影响本发明的创新性和实用性。
87.实施例3一、使用含有read1 seqprimer序列的转座子包埋转座酶1. 购买高转座活性的tn5转座酶(南京诺维赞),该转座酶可以特异性识别转座子两端反向重复的me序列(mosaic end),形成转座复合体后无偏好性地将转座子插入目标序列中;2. 按以下序列合成引物并溶解至10μm的浓度:primera : ctgtctcttatacacatct为me序列的正向序列primerc: tcgtcggcagcgtcagatgtgtataagagacag,其中agatgtgtataagagacag为me序列的反向序列,tcgtcggcagcgtc为read1 sequencing primer部分序列;2. 将两种引物等量混合后按照以下温度条件退火,命名为rd1n mix:
4. 按以下配方将rd1n mix包埋进转座酶:混匀后置于30℃反应1 h。反应产物命名为tte-1n mix,-30 ~
ꢀ‑
15℃保存。
88.二、构建高通量固定单细胞rna测序文库1. 获取新鲜培养的k562细胞(人)重悬于pbs中,然后使用4%多聚甲醛溶液固定10min并在0.2%(v/v) triton x-100水溶液中透化细胞膜,洗涤后pbs重悬细胞,计量细胞浓度;2.获取新鲜培养的yac(鼠)细胞重悬于pbs中,然后使用4%多聚甲醛溶液固定10min并在0.2%(v/v) triton x-100水溶液中透化细胞膜,洗涤后pbs重悬细胞,计量细胞浓度;3. 逆转录反应3.1根据细胞浓度分别计算k562与yac上样体积(μl)。
89.3.2按照下表配置2个逆转录反应体系,表中的试剂为北京寻因公司已经市售的seekone
®ꢀ
dd试剂盒
3.3按照下述反应程序进行逆转录反应。
90.4 细胞回收与转座酶打断4.1 反应结束后,将逆转录产物分别转移至1.5ml离心管,做好标记。加入1ml 含有0.1% triton x-100的1x pbs溶液,4℃条件下1000g离心5min,小心去除上层上清;重新加入1ml 含有0.1% triton x-100的1x pbs溶液,重复4℃条件下1000g离心5min后完全去除上清;4.2 配置转座酶反应体系根据说明书(诺维赞td501)在灭菌pcr管中依次添加以下各反应组分并混匀:
4.3将转座酶反应体系分别加入步骤4.1的固定细胞中吹打混匀后转移至pcr管,做好标记,将pcr管置于pcr仪中50℃反应10min后冷却至10℃。
91.5.细胞回收与连接反应5.1试剂准备提前将barcoded beads从-80℃中取出,平衡至室温;具体序列如下:5
’‑
aatgatacggcgaccaccgagatctacacnnnnnnnnnnnnnnnttgctgt-3’;其中,aatgatacggcgaccaccgagatctacac为引物结合序列1,nnnnnnnnnnnnnnn是细胞标签,ttgctgt为接头序列;5.2将步骤4.3反应产物分别转移至1.5ml离心管,做好标记。加入1ml 含有0.1% triton x-100的1x pbs溶液,4℃条件下1000g离心5min,小心去除上层上清;重新加入1ml 含有0.1% triton x-100的1x pbs溶液,重复4℃条件下1000g离心5min后完全去除上清,pbs重悬细胞,并分别计算k562和yac细胞浓度;5.3按以下体系配置连接反应体系根据细胞浓度计算k562与yac细胞数分别为1000和2000时的上样体积(μl)和补加nuclease-free water体积(μl),先加入相应的nuclease-free water至连接反应mix吹打混匀后,再加入单细胞悬液(细胞悬液加入前需吹打混匀),共计36μl;最终单细胞连接反应混合液总体积为80 μl。
92.5.4按照seekone
®ꢀ
dd 3’单细胞文库构建试剂盒说明书向芯片中加入对应试剂;芯片通道1:吸取78μl步骤5.3中的含细胞的连接试剂,避免产生气泡;芯片通道2:将室温平衡好的barcoded beads充分振荡30 sec,瞬时离心5 sec,确保barcoded beads液体内没有气泡,用移液器吸取40 μl,吸头尖插入对应的孔位底部,缓
慢注入,不要产生气泡;芯片通道3:吸取240μl carrier oil,插入标签3对应的孔位,缓慢注入,不要产生气泡;5.5 将gasket挂载于芯片夹具上层,确保gasket孔和芯片孔对齐。
93.5.6 seekone
®ꢀ
dd仪器运行按照seekone
®ꢀ
dd 3’单细胞文库构建试剂盒说明书操作流程将芯片放入seekone
®ꢀ
dd仪器中,开始运行程序;5.7 油包水液滴转移程序运行结束后,点击弹出按钮,取出芯片。使用移液器将对应孔内生成的油包水转移至新的0.2ml的pcr管中;5.8 连接反应将步骤5.7中装有油包水的pcr管,放入pcr仪中运行下列程序,pcr热盖关闭,体积100μl;6 产物回收6.1 反应结束后,向上述pcr管中加入100μl demulsion agent 试剂,室温静置2 min,瞬时离心;6.2 从pcr管底部缓慢吸取120 μl 透明油相丢弃,不要吸到上层水相;此时连接后的固定细胞存在于上层水相中;6.3将上层水相溶液转移至1.5ml离心管,4℃条件下1000g离心5min,小心去除上层上清;重新加入1ml 含有0.1% (v/v)triton x-100的1x pbs溶液,重复4℃条件下1000g离心5min后完全去除上清;6.4向管中加入蛋白酶k和2%(v/v)sds,55度反应1h进行解交联反应;6.5反应结束后,向管中加入1倍体积的dna clean beads进行纯化,30.5μl双蒸水洗脱;6.6 转移30ul上清液至新的0.2ml 离心管中。
94.7 文库延伸及扩增7.1 根据说明书(诺维赞td501)按以下体系配置扩增反应液:
其中p5引物和n7引物序列为:7.2将上述配置好的扩增反应液加入步骤6.6的产物中,按照上表中的扩增程序pcr以添加文库接头和文库标签;7.3将pcr产物用dnacleanbeads进行分选得到文库。如图9所示,文库片段主峰为268bp;7.4使用illumina测序仪将图5中的产物测序,测序数据分析结果如下表所示。
95.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应
包括在本发明的专利保护范围内。