第4 1卷第3期
2020年5月吉首大学学报(自然科学版)
Journal of Jishou University (Natural Sciences Edition)Vol. 4 1 No. 3
May2020
文章编号:1007 2985(2020)03 0028 08
扬子鳃蛭线粒体基因组全序列测定及其系统学地位
----基于 Paebio 和 Illumina 技术 *
*收稿日期:2020
03 20
基金项目:国家自然科学基金资助项目(31970/199)
作者简介:谷生丽( 1978—),女,安徽繁昌人,皖南医学院讲师,博士研究生,主要从事寄生虫病研究;刘谏君为本文共
同第一作者
通信作者:聂刘旺(1962—),男,安徽怀宁人,安徽师范大学教授,博士生导师,主要从事龟类保护研究.E-mail : lwnie @ahnu. edu. cn.
谷生丽12,刘谏君X孙恩涛湛孝东聂刘旺1
(1安徽师范大学生命科学院,安徽芜湖24 1000;.皖南医学院
医学寄生虫学教研室,安徽芜湖24 1002)
摘 要:利用Illumina 和Paebio 测序技术对扬子鳃蛭Ozobranchus ja.nta.nus')线粒体基因组全序列
进行测序及注释, 并与NCBI 数据库中蛭纲(Hirdinca )其他物种的线粒体全序列的排列方式和系统进化关系进行了比较,以确定其系统学地
位.结果显示:获得的线粒体基因组序列长度为14 868 bp,蛋白编码基因存在2种起始密码子,分别为ATG 和ATT ;终止
密码子共有4种,分别为TAA ,TAG ,TA 和T ;蛭纲10个物种的线粒体基因组全序列基因排序可分为2种类型,其差异表 现在tRNAs 的互换和长非编码区的长度的不同;扬子鳃蛭所属的吻蛭目(Rhynchobdcllida)均为b 型,绝大部分无吻蛭目
(Arhynchobdcllida)的排列方式为a 型.基于蛭纲物种的13个蛋白编码基因(PCGs)的Neighbor-oining(NJ )树进化分析显 示,扬子鳃蛭与其他吻蛭目物种聚类.
关键词:扬子鳃蛭;线粒体基因组全序列;蛭纲;Paebio 和Illumina 测序中图分类号:S855. 9
文献标志码:A
DOI : 10. 134 38/j. cnki. jdzk. 2020. 03. 006
扬子鳃蛭Ozobranchus j antanus Oka ,1912)是一种淡水吸血蛭类,隶属蛭纲(Hirudinea)吻蛭目
(Rhynchobdellidn)鳃蛭科(Ozobranchidae)鳃蛭属(Ozbranchu )[1],常寄生于乌龟(Maurmy rrevesii )
的颈部及四肢皱褶区.目前仅日本和我国有关于扬子鳃蛭分布的报道23].2014年,日本学者Suzuki ⑷首 次报道未经任何预处理的扬子鳃蛭经液氮冷冻24 h 后,可100%复苏存活,且在一90 °C 的温度下可长期
存活32个月,引起了研究者极大的兴趣.迄今,有关扬子鳃蛭线粒体基因组的研究甚少,Liu 等⑴对扬子鳃 蛭线粒体全序列数据进行了简短报道,但没有对其结构进行分析;Nakano 等[6]基于线粒体COX1基因分 析了扬子鳃蛭的遗传多样性.本研究采用Paebio 三代单分子测序技术以及Illumina 二代测序技术对扬子
鳃蛭线粒体基因组进行测序和注释,并与目前NCBI nucleotide 数据库中已完成测序的其他10种蛭类的
线粒体基因组全序列进行比较、分析,
以期为深入了解扬子鳃蛭线粒体基因组的结构及其系统学地位提供
—基于Pacbio和Illumina技术29第3期谷生丽,等:扬子鳃蛭线粒体基因组全序列测定及其系统学地位—
基础数据.
1材料与方法
1.1材料收集及DNA提取
本实验用扬子鳃蛭采自安徽省无为市某龟类养殖场.取吸附于乌龟体表的扬子鳃蛭成虫1只,用去离子水冲洗,经SDS/蛋白酶K裂解,再使用酚/氯仿提取总DNAt%琼脂糖凝胶电泳检测DNA完整性. 1.2Illumina和Pacbio建库及测序
取1“g DNA,用Covaris M220将DNA超声打断至300〜500bp的短片段,用TruSeq TM Nano DNA Sample Prep Kit补平并在3'端加A,然后连接index接头,富集DNA后进行PCR扩增.利用2%琼脂糖回收目的条带,TBS380定量后按比例混合上机,使用Illumina Hiq平台对文库进行测序.
参照文献[7],取1“g DNA,用G-tubes方法将基因组处理成15~20kb的片段,末端补平后,两端分别加上环状接头,最后使用Pacbio Sequel平台进行DNA测序.
1.3数据质控及统计
参照文献[8]tllumina测序的原始数据使用Trimmomatic去除接头及低质量序列.Pacbio测序的原始数据使用SMART Analysis将bam文件格式转化成fasta格式文件,并过滤到小于100bp和质量小于
0.8的Polymera reads,去除adapter序列.
1.4线粒体基因组组装及注释
参照文献[9],利用ABySSV2.0组装Illumina测序数据,然后利用blasR比对Pacbio三代数据,根据比对结果对单分子测序数据进行一次矫正与纠错,最后利用纠正过的单分子测序数据与二代数据进行混合组装.使用SPAdes挑选覆盖深度足够高且组装长度较长的序列作为候选序列[0],比对NT库进行确认.再次利用Illumina数据进行校验.得到完整的基因组数据之后,使用MITOS进行基因组的初步注释[11],再参考GenBank数据库中相似物种的线粒体基因组数据进行最终注释,最后使用GCview绘制基因组图谱[12].
1.5线粒体基因组数据比较分析
参照文献[3],使用MAFFT version7在线比对扬子鳃蛭的线粒体基因组序列与GenBank数据库中扬子鳃蛭线粒体基因组全序列(登录号KY861060.1)之间的差异.
登录NCBI nucleotide数据库,输入关键词"Hirudinea mitochondrion complete genome",以检索蛭纲的线粒体基因组全序列.结果共检索到11个物种的线粒体基因组全序列数据,其中Poecilobdella ma-nillensis和Hirudinaria manillensis为同种异名,且基因序列完全相同,故有效种为10个.下载10个线粒
体基因组序列,并加入本研究所获得扬子鳃蛭的线粒体基因组数据,进行蛭类线粒体基因组排序的比较分析.
为进一步确定扬子鳃蛭的分类地位,除下载以上全序列的10种蛭的线粒体基因组外,另加入了蛭纲中包含所有13个蛋白编码基因(PCGs)的不完整线粒体基因组序列,它们分别为吻蛭目舌蛭科(Gloss-phoniidae)的Haementeria officinalis和Placobdella parasitica,无吻蛭目医蛭科(Hirudinidae)的Hiru-do verbana和Hirudo medicinalis,以及同属于环节动物门的其他外类群寡毛纲的Lumbicus terre--tris和Perionyx excavatus及多毛纲的Orbinia latreillii的相应序列.参照文献口4],利用MEGA6.0软件对18个物种的13个蛋白编码基因DNA序列构建Neighbor-oining(NJ)树并进行分析.
2结果
2.1扬子鳃蛭线粒体基因组的组装
本研究采用Illumina和Pacbio平台对扬子鳃蛭的DNA进行测序,其中:Illumina测序得到原始数据4432Mb,质控之后剩余3733Mb,片段长度为450bp;Pacbio得到过滤后Subreads数目为9752,Sub-
30吉首大学学报(自然科学版)第41卷
reads 最大的长度为20 926 bp,Subreads 的平均长度为3 834 bp. Pacbio 的长度分布如图1所示.
寸
0L
OO
寸0L 9
寸0
L
寸寸O L e
o o i o
A 七
SUOCI
0 0.5
1
1.5 2
Length/104 bp
图1 PacBio Subreads 的长度分布
源的拼音Fig. 1 Length Distribution of PacBio Subreads
2. 2扬子鳃蛭线粒体基因组注释
经二代和三代数据组装获得扬子鳃蛭线粒体基因组序列长度为14 868 bp, A + T 含量(72. 4%)显著 高于G + C 含量(27. 6%).所有基因都在同一条链,即J 链(Maoritystan)编码全部基因,包含13个蛋白
编码基因、22个tRNA 基因、2个rRNA 基因及1个长非编码区(Long Non-coding Region, LNR)(图2). 经过统计,扬子鳃蛭线粒体基因组中蛋白质编码基因占整个线粒体基因组长度的74. 60%.
图2扬子鳃蛭线粒体基因组结构
Ozobranchus jantanus
14 868 kbp
■ —CDS ■ —TRNA ■ —rRNA
■ 一Other
■ 一GC content ■ 一GC skew+
经期有血块怎么回事■ 一GC skew-
teach过去式Fig. 2 Schematic Map of the Mitochondrial Genome of O. jantanus
本研究中扬子鳃蛭的编码基因共存在2种起始密码子,分别为ATG(ND 5,ND 4L,ND 4,ND 1,
ND 3,ND 2,COX 1,COX 2,A7T 8,ND 6,CYTB,A7T 6)和 ATT(COX 3)终止密码子共有 4 种,分别为生肖英语
TAA (ND5ND4LND1, COX 2ATP8, CYTB ATP6), TAG (ND3) TA (ND4ND6)和 T(ND2, COX 1COX 3).除最长非编码区为301 bp 外,其他基因间隔共19处,最长为43 bp,其他间隔区总长度为
162 bp.重叠区共6处,最大为一12 bp,总重叠区长度为一28 bp.具体结果详见表
1.
第3期谷生丽,等:扬子鳃蛭线粒体基因组全序列测定及其系统学地位—
—基于Pacbio和Illumina技术31
表1扬子鳃蛭线粒体基因组注释
Table1Complete Mitochondrial Genome Annotation for O.jantanus
基因名
基因位点
大小/bp反义密码子基因间隔/bp
密码子
起点终点起始终止
tRNA-His16464CAC(H)1
ND566176617010ATG TAA tRNA-Phe1767183266TTC(F)29
tRNA-Glu1862192564GAA(E)-3
tRNA-Pro1923198664CCA(P)8
RNA-Thr1995205864ACA(T)6
ND4L20652358294-7ATG TAA ND42352368513342ATG TA RNA-Cy3688375063TGC(C)23
tRNA-Met3774383966ATG(M)0
12S RNA384045827430
tRNA-Val4583465068GTA(V)1
16S RNA4652582511741
iRNA-Leu5827589064CTA(L1)43
tRNA-Ala5934599663GCA(A)0
RNA-Ser5997606367TCA(S2)6
iRNA-Leu6070613566TTA(L2)3
ND1613970719332ATG TAA tRNA-Ile7074713663ATC(I)2
tRNA-Lys7139720062AAA(K)0
ND37201755435422ATG TAG tRNA-Ser7577764165AGA(S1)0
ND276428635994-12ATG T COX186241016015370ATG T tRNA-Asn101611022565AAC(N)0
COX210226109096841ATG TAA tRNA-Asp109111097868GAC(D0
ATP810979111401625ATG TAA tRNA-Tyr111461120964TAC(Y)0
tRNA-Gly112101127465GGA(G)-5
COX311270120567870ATT T tRNA-Gln120571212569CAA(Q)0
ND61212612601476-1ATG TA CYTB126011373711372ATG TAA tRNA-Trp137401380162TGA(W)1
ATP613803145016994ATG TAA tRNA-Arg145061456762CGA(R)0
Control Region14568148683010
2.3基于线粒体mtDNA结构和13个蛋白编码基因DNA序列的蛭类系统发育分析
喉咙有痰怎么治将NCBI核酸数据库中检索到的10种蛭纲物种的线粒体基因组全序列数据信息汇总,发现10种蛭纲物种均隶属于真蛭亚纲(Euhirudinea)的无吻蛭目(Arhynchobdellida)和吻蛭目(Rhynchobdellida) (表2).饺子的形状
32吉首大学学报(自然科学版)
第41卷
表2 10种蛭纲物种的线粒体全序列基本数据
Table 2 Basic Data of Complete Mitochondrial Sequence of 10 Species of Hirudinea
中文名
拉丁学名分类长度/bp 登录号线粒体谱 系类型长非编码区长度/bp
尖细金线蛭Whitmania acranulata 无吻蛭目黄蛭科14 462KC688271. 1a 87光润金线蛭Whitmania laevis 无吻蛭目黄蛭科14 433KC688269. 1
a 78
宽体金线蛭
Whitmania pigra 无吻蛭目黄蛭科14 426EU304459. 1a 80日本医蛭
Hirudo nipponia
无吻蛭目医蛭科14 414KC667144. 1a 83菲牛蛭
Poecilobdella manillensis 无吻蛭目医蛭科14 470NC_023925. 1
a 77八目石蛭
Erpobdella octoculata 无吻蛭目石蛭科
14 407KC688270. 1a 96
日本石蛭
Erpobdella japonica 无吻 蛭目 石蛭科14 725
MF358688. 1
b 337—
Placobdella lamohei 吻蛭目舌蛭科15 190LT159849. 1b 636扬子鳃蛭Ozobranchus jantanus
吻蛭目鳃蛭科
14 864KY861060. 1b 299—
Zeylanicobdella arugamensis
吻蛭目鱼蛭科
16 161KY47437 8 1
b
1 670
对目前已完成的10种蛭纲线粒体基因组的基因分布情况进行初步分析,结果见图3.
a
型
COX2 ATP8
LNR
ND4L
ND3
COX1 | ~~0口04^0
両 CYTB U ATP6
ND5
李云迪匕^厂]池4
际 p —j 池1 匕口 ND2 N D G Y
Q W
R
F EP T
CM V
LI S2A L2
I K S1
COX2ATP
虬 LNR
ND4L
K
ND3
COX] |厂|疝貢用| CYTB c |~两c.c |
秋浦歌的意思
ND — CCOT T
池4 cQ 莎I d 应 |o ^q
「
ND1
山厂口 ND2 N D Y G Q W R H F EP T
CM
V LI AS2L2
I K SI
图3蛭纲线粒体基因组基因序列差异
Fig. 3 Differences in Gene Order in the Mitochondrial Genomes from the Hirudinea
如3所示,所有蛭的蛋白质编码基因在线粒体上的排列顺序均相同,但4个tRNAs 有基因位置互换
现象.蛭纲物种线粒体基因按照排序方式的不同可分为a 和b 2种类型.a 型:无吻蛭目中除日本石蛭(Er
pobdella aoia )外,均呈此排列方式 ATP8和COX3中间为 RNA(G )和RNA(Y ),16S 和ND1之
间为RNA(L1) tRNA(S2) tRNA(A) tRNA(L2),最长的非编码区(LNR)均小于100 bp. b 型:所有
吻蛭目物种如扬子鳃蛭以及无吻蛭目中的日本石蛭呈现此排列方式,即ATP8和COX 3中间为RNA
(Y )和 RNA(G ),16S 和 ND 1 之间为 RNA(L1) tRNA (A) tRNA (S2) tRNA (L2),且 LNR 均大于
299 bp.其中鱼蛭属 QZeylanicobdella )的 Zeylanicobdella arugamensis [55 的 LNR 达 1 670 bp.
基于线粒体的13个蛋白编码基因DNA 序列的蛭类系统发育分析结果如图4所示.
--------NC 023925.1 Poecilobdella manillensis mitochondrion complete genome P ---------KC6882
70.1 Erpobdella octoculata mitochondrion complete genome J —EU304459.1 Whitmania pigra mitochondrion complete genome
---------------KC688271.1 Whitmania acranulata mitochondrion complete genome
--------------------------------------KC688269.1 Whitmania laevis mitochondrion complete genome Arhynchobdellida
_____________ --------------------KC667144.1 Hirudo nipponia mitochondrion complete genome
________________------KU672397.1 Hirudo verbana mitochondrion partial genome
------KU672396.1 Hirudo medicinalis mitochondrion partial genome
-------------------------------------------MF358688.1 Erpobdella japonica mitochondrion complete genome
-------------------------------------------------KY474378.1 Zeylanicobdella arugamensis mitochondrion complete genome __ _________________________KY861060.1 Ozobranchus jantanus mitochondrion complete genome -----------Ozobranchus jantanus Rhynchobdellida
-----------------------LT159848.1 Haementeria officinalis strain GTOCOR mitochondrion partial genome ______-------------LT159849.1 Placobdella lamothei strain MXTON mitochondrion complete genome
------------LT159850.1 Placobdella parasitica strain ONAP mitochondrion partial genome
___________--------------------------EF494507.1 Perionyx excavatus mitochondrion complete genome _____-----------------------------------------NC 001673.1 Lumbricus terrestris mitochondrion complete genome Outgroup
NC 007933.1 Orb ini a latreillii mitochondrion complete genome '0.05 图4 基于线粒体13个蛋白编码基因DNA 序列构建的蛭纲物种的NJ 树
Fig. 4 NJ Phylogenetic Tree of Hirudinea Species Bad on 13 PCGs