2022,42(2):001
灯红酒绿的反义词J.SHANXI AGRIC,
UNIV .(Natural Science Edition )
学报(自然科学版)04091
谷子mTERF 基因家族全基因组鉴定与分析
任雪梅1,刘浩瑞1,南力彰2,陈晋杰1,韩渊怀1,
2*
(1.山西农业大学生命科学学院,山西太谷,030801;2.山西农业大学农学院,山西太谷,030801)
摘要:[目的]线粒体转录终止因子(mitochondrial transcription termination factor ,mTERF )是由核基因编码调控细
胞器基因表达的一类蛋白。本研究从谷子基因组中鉴定了mTERF 基因家族成员,为探究该基因家族在谷子生长发育中的生物学功能提供理论基础。[方法]通过生物信息学方法分析该家族基因的染色体分布、系统发育进化树、保守结构域及基序、顺式作用元件、基因表达及亚细胞定位。[结果]共鉴定到37个谷子mTERF 基因家族成员,在染色体上呈不均匀分布,1号染色体上基因数目最多;37个谷子mTERF 蛋白都含有保守的mTERF 结构域,绝大多数mTERF 蛋白中motif 按一定的顺序排列,motif1在每个mTERF 蛋白上较其它motif 保守;该家族含有光、干旱诱导、醇溶蛋白代谢、细胞周期、昼夜节律、黄酮合成响应的顺式元件以及生长素、赤霉素等多种植物激素响应的顺式元件;谷子、玉米及拟南芥的97个mTERF 家族的基因可分为6大类;谷子mTERF 基因表达具有组织特异性,
其中Si9g06960在叶片的表达量最高;该家族蛋白主要在叶绿体及线粒体中有定位信号。[结论]谷子mTERF 基因家族可能影响叶绿体及线粒体的形态发育,对谷子的生长及逆境响应等生物学过程发挥着重要的作用,该研究有助于了解谷子mTERF 对谷子生长发育及抗逆等生物学过程的意义,为后续基因的研究提供指导。关键词:谷子;mTERF ;全基因组;表达分析中图分类号:S515
文献标识码:A
文章编号:1671-8151(2022)02-0001-11
谷子(Setaria italica )是我国古老的栽培粮食作物[1]。谷子为旱生C 4禾谷类作物,具有突出的抗旱、耐贫瘠的特点;且为二倍体(2n=2x=18)自花授粉的作物,具有基因组小(约为490Mb )、重复序列少、易于诱变和筛选突变体等优点,正发展为新的模式植物[2]。谷子脱壳后称为小米,富含人体所需的氨基酸、脂肪酸、矿物质等营养成分,具有提高人体免疫力、促消化、预防疾病等作用[3-4]。病毒分析
线粒体和叶绿体起源于原核生物,在被真核细胞吞噬后逐渐建立起共生关系的半自主细胞器[5-6]。线粒体和叶绿体绝大多数的原核基因组的基因都转移到细胞核,仅保留了几十个基因主要行使基因表达、氧化磷酸化及光合作用的功能[7]。而绝大多数在线粒体及叶绿体中行使功能的蛋白,包括线粒体及叶绿体基因表达机制所需的成
员都由核基因编码,转录完成后运到细胞质中进行翻译和加工,再运输到线粒体和叶绿体中。因此,线粒体和叶绿体功能的正常行使需要细胞核调控基因和其自身基因组表达精确统一地协调。已有研究表明核基因编码的模块蛋白能够结合并调节细胞器基因的表达,如三十五肽重复蛋白(pentatricopeptide repeat proteins ,PPR )、线粒体转录终止因子(mitochondrial transcription termina⁃tion factor ,mTERF )等[8]。
mTERF 广泛存在于动植物中,具有调节细胞器基因表达及植物抗逆性等生物学过程的作用[9]。mTERF 最早发现是作为人类线粒体DNA 的结合蛋白,并具有终止线粒体基因转录的作用,因此将其命名为线粒体转录终止因子[10]。mTERF 蛋白由重复多个的mTERF 基序组成,序列具有高度保
任雪梅,刘浩瑞,南力彰,等.谷子mTERF 基因家族全基因组鉴定与分析[J ].山西农业大学学报(自然科学版),2022,42(2):1-11.
Ren X M ,Liu H R ,Nan L Z ,et al.Genome -wide identification and analysis of mTERF gene family in Setaria italica [J ].Jour⁃nal of Shanxi Agricultural University (Natural Science Edition ),2022,42(2):1-11.doi :10.13842/jki.issn1671-8151.202111028
收稿日期:2021⁃11⁃28修回日期:2022⁃01⁃26
基金项目:山西农业大学科技创新基金项目(2018YJ32);山西省优秀博士来晋工作奖励资金科研项目(SXYBKY2018035)作者简介:任雪梅(1990-),女,讲师,硕士生导师,研究方向:谷子发育相关基因的挖掘及功能解析
*通信作者:
韩渊怀,教授,博士生导师,E -mail :**************
2022山西农业大学学报(自然科学版)
守性,其中每个mTERF基序含有约30个氨基酸[11]。在动物中mTERF家族有4个成员,即mTERF1~mTERF4,都定位在线粒体,其功能研究也较为深入[12]。在植物中,拟南芥mTERF基因被研究报道的数目最多。植物mTERF通常定位于线粒体或(和)叶绿体,通过调控线粒体或(和)叶绿体基因的编辑、剪切等方式影响其基因表达[13]。目前,mTERF家族已经在拟南芥、玉米、油菜、大麦、葡萄、辣椒、衣藻等多个物种中研究报道[14-20]。但目前只有衣藻MOC1、油菜BnaA06. mTERF1、玉米Zm⁃mTERF4和Zm⁃mTERF10以及拟南芥At-mTERF1、2、4、5、6、8、9、10、11、12、15、18、22和27等已经在功能上进行了相关功能研究[19-41]。相对来说,谷子mTERF基因功能方面的研究要明显落后于拟南芥、玉米等植物。
本文主要鉴定了谷子mTERF基因家族成员,并通过生物信息学方法对其进行染色体分布、系统发育进化树、保守结构域及基序、启动子顺式作用元件、基因表达及亚细胞定位分析,推测谷子mTERF基因家族可能影响叶绿体及线粒体的形态发育,对谷子的生长及逆境响应等生物学过程发挥着重要的作用,该研究有助于了解谷子mTERF对谷子生长发育及抗逆等生物学过程的意义,为后续基因的研究提供指导。
1材料与方法
1.1全基因组序列的获取
从MDSi:Multi-omics Databa for Setaria italica(http://foxtail-millet.biocloud/home)数据库中获取谷子xiaomi的基因组数据、总蛋白序列、CDS序列及基因注释文件。
1.2谷子mTERF基因的鉴定及染色体分布
使用Pfam数据库(http://pfam.xfam/)下载mTERF结构域(PF02536)的HMMER模型。通过TBtools软件中的Simple HMM Search命令搜索谷子总蛋白序列,筛选谷子mTERF家族的候选基因;通过TBtools软件分别用拟南芥(https:// www.arabidopsis/)和玉米(https://www. maizegdb/)mTERF家族蛋白质序列与谷子总蛋白序列进行比对,筛选E-value<1e-5的基因为谷
子mTERF家族的候选基因。使用Pfam数据库中的Batch arch(http://pfam.xfam/arch#tabview=tab1)对获得的所有候选基因序列进行验证,进一步确定该基因家族的成员。
通过谷子基因组注释文件,获得谷子mTERF 家族基因的位置信息,并使用TBtools中的Graph⁃ics功能对结果进行可视化。
1.3谷子mTERF家族基因的系统进化分析
通过MEGA7.0将筛选的37个谷子mTERF 蛋白序列与拟南芥及玉米的mTERF家族蛋白序列进行多重序列比对,并采用邻接法(Neighbor-Joining)构建进化树,分析谷子与拟南芥及玉米同源家族的进化关系,使用iTOL(https://bl. i)在线工具对进化树进行美化。
1.4谷子mTERF家族的结构域和motif分析
使用TBtools分析谷子mTERF家族的结构域,通过MEME(https://meme-suite/)对其进行motif分析,并使用TBtools对结果数据进行可视化。
1.5谷子mTERF家族顺式作用元件分析
使用TBtools软件以谷子基因组注释文件,基因序列文件,CDS序列文件提取基因上游2000bp 的序列。并通过Plant CARE(http://bioinformat⁃ics.psb.ugent.be/webtools/plantcare/html/)分析其顺式作用元件。
1.6谷子mTERF家族基因表达分析
在MDSi数据库中下载并整理谷子mTERF 家族在晋谷21不同组织中的表达量数据,包括根、茎、叶、萌发的籽粒及灌浆期S1~S5时期的籽粒(分别对应灌浆初期、前期、中期、后期及末期)使用TBtools软件绘制表达热图。对温室种植的谷子材料取不同组织的样品,通过Trizol法提取RNA,使用诺唯赞HiScript II Q RT SuperMix for qPCR(+gDNA wiper)进行反转录,通过谷子MDSi数据库设计引物(表1),进行荧光定量PCR,内参引物参考前人论文发表[2]。
1.7谷子mTERF家族亚细胞定位分析
通过TargetP(http://www.cbs.dtu.dk/r⁃vices/TargetP/)数据库对mTERF家族的蛋白序列进行亚细胞定位分析并整理结果。
教师自我介绍
2结果与分析
2.1谷子mTERF基因的鉴定及其在染色体上的分布
根据拟南芥、玉米mTERF蛋白序列在谷子数
2
42(2)任雪梅等:谷子mTERF 基因家族全基因组鉴定与分析据库中进行Blast ,同时使用mTERF 蛋白家族的HMMER 模型及Pfam 数据库分析,共鉴定出37个mTERF 基因家族成员(图1)。该家族的37个基因在染色体上分布不均匀,1号染色体上基因数目最多,有13个;8号染色体上没有基因分布;2~7及9号染色体分别有4,6,1,3,3,2及5个基因。mTERF 基因分布情况和拟南芥及玉米中类似,且拟南芥mTERF 基因也在1号染色体上分布最多[14]。
不要乱扔垃圾英语>电脑检测不到u盘2.2mTERF 家族进化树分析
为了解析mTERF 家族在谷子、拟南芥及玉米
中的进化关系,使用MEGA7.0中的NJ 法对3个物种的97个mTERF 基因构建进化树(图2)。97个mTERF 基因被分为6个亚族,命名为group Ⅰ~VI 。Group V 不包含谷子mTERF 基因,
Group VI 中谷子mTERF 基因数目最多,为13个,其它group 含有3~8个。由进化树分析图中得出,玉米Zm ⁃mTERF4(Zm00001eb349900)聚类到group I ,与谷子mTERF 基因Si3g23620、Si1g30850等距离较近;拟南芥mTERF 家族基因At⁃mTERF8(pTAC15、AT5G54180)、At⁃mTERF
15(AT1G74120)及At⁃mTERF27(AT1G21150)聚类到group II ,谷子mTERF 基因Si1g32550、Si6g13410及Si1g33060也聚类到该group ;At ⁃mTERF2(EMB2219b 、AT2G21710)、At⁃mTERF5
(MDA1、AT4G14605)、At⁃mTERF10(AT2G34620)及At ⁃mTERF22(AT5G64950)聚类到group III ,与谷子mTERF 基因Si5g38490、Si1g34710、Si2g03690、Si6g20970、Si5g41280及Si9g02800聚类在一起;At⁃mTERF1(SOLDAT10、AT2G03050)、At ⁃mTERF6(AT4G38160)、At ⁃mTERF9(TWIRT1f 、AT5G55580)及At ⁃mTERF12(AT4G09620)聚类到group IV ,与谷子mTERF 基因Si2g36890、Si9g06960、Si1g32510等距离较近;At ⁃mTERF4(BSM/RUG2、AT2G02990)及At ⁃mTERF18(SHOT1、AT3G60400)聚类到group V ;At⁃mTERF11(AT3G18870)聚类到group VI ,与谷子mTERF 基因Si3g24120、Si4g13270及Si9g03470距离较近,同时,玉米Zm ⁃mTERF10(SMK3、Zm00001eb136360)也聚类到该group ,与谷子mTERF 基因Si2g30880距离较近。推测聚类到同一个group 的谷子mTERF 与其同一类群的拟南芥mTERF 基因或玉米mTERF 基因进化关系密切,可能行使相似的生物学功能。
表1
荧光定量PCR 引物序列
Table 1
The primer quence for real⁃time PCR
基因ID Gene ID Si1g23030Si1g32480Si5g41280Si9g06960Si9g37480(内参)
引物Primer
F :ATGGGTAGCTGCTCCTCAAA R :TCTGGAGCTTTGACACCAG
G F :GGCATCCAGTCCTCTCCTC R :GGTAGTCCTCCACCGAGAAG F :GAGAAACTCTGCCCACTCCT R :TCCTTGTCCATGTCCAGGTC F :TCGCAGGTGAAGGACAAGAT R :AGAGGAAGGCAAAGATGGGG F :ATGGCCCGTACCAAGCAAACT R :
GGATCTCACGGAGGGCAACAGT33eh
图1
谷子mTERF 基因在染色体上的分布
Fig.1
Chromosome location of mTERF genes of S.italica
3
2022
山西农业大学学报(自然科学版)2.3mTERF 家族的结构域分析
对谷子mTERF 的37个基因家族成员进行结
构域分析发现,该家族基因编码的氨基酸序列都很保守,都含有保守的mTERF 基序,不同基因的氨基酸序列中mTERF 基序重复的的个数不同,长短有所差异(图3)。2.4
mTERF 家族的motif 分析
对该家族进行motif 预测(图4),结果显示大多数mTERF 蛋白中motif 的排列顺序为motif4、motif3、motif6、motif2、motif7、motif1、motif8、mo⁃tif5。其中,motif2、motif3、motif6、motif7易发生易位。motif1在每个mTERF 蛋白上较其它motif 保守,motif1、motif8及motif5串联在大多数mTERF 蛋白的3’端。大多数mTERF 蛋白的motif 都含有保守的脯氨酸(P )、亮氨酸(L )及甘氨酸(G ),与前人在玉米mTERF 蛋白报道的结果一致[15]。
2.5mTERF 家族启动子顺式作用元件分析顺式作用元件是参与植物生长发育过程中基
因转录调控和非生物胁迫反应的重要分子开关[42-44]。为了进一步探究mTERF 基因家族在谷子生长发育中的作用,使用PlantCARE 网站对mTERF 基因上游2000bp 启动子区序列进行分析(图5)。该家族基因主要含有13类顺式作用元件,包括:光响应元件、昼夜节律响应元件、5种植物激素(包
含:生长素、赤霉素、脱落酸、水杨酸及茉莉酸甲酯)响应元件、籽粒特异调控元件、胚乳表达元件、醇溶蛋白代谢元件、细胞周期调控元件、干旱诱导及黄酮合成相关的MYB 结合位点。不同的mTERF 基因含有顺式元件的种类不同,平均每个mTERF 基因启动子区含有6.2种顺式作用元件,大多数mTERF 基因启动子区含有5种以上顺式作用元件,仅在基因Si1g33060、Si2g36890
及
图2
谷子mTERF 家族的系统进化树分析
Fig.2
Phylogenetic tree analysis of mTERF genes of S.italica
4
广告赏析42(2)任雪梅等:谷子mTERF 基因家族全基因组鉴定与分析Si6g13410中都只含有4类作用元件。细胞周期调控的元件数目最少,仅分布在基因Si1g30850及Si4g13270启动子区域中各一个。籽粒特异调控
顺式元件仅分布在基因Si2g32000启动子区3个,基因Si3g24120及Si3g35570启动子区各1个。细
胞周期调控元件也是分布较少的一类顺式作用元
图3
谷子mTERF 家族结构域分析
Fig.3
Domain analysis of mTERF genes of
S.italica
图4
谷子mTERF 家族motif 分析
Fig.4
给孩子鼓励的话Motif analysis of mTERF family of S.italica
5