玉米驯化和改良群体基因组的比较
人们为了满足需要对作物进行了持续上万年的驯化和植物育种进化实验,彻底改变了其野生特性。玉米经历了特别显著的改变。研究人员持续进行了数十年的探索,识别出了潜在的玉米进化基因,但是这些努力还限制在一定范围之内。这里,我们报道了一种玉米综合评价进化模型,是基于对75奥巴马访问古巴份野生种、地方品种和改良的玉米自交系进行全基因组重测序。我们发现了驯化后的多样性恢复的证据,很可能是来自野生近亲的基因渗入,驯化期间的选择效应比改良的证据更加强烈。我们鉴定了一些具有选择信号的基因,这些基因比以前主要以形态变化来鉴定信号显得更为强烈。最后,通过分析全转录组基因表达,我们发现了玉米在驯化和改良期间,二者一致的顺式作用元件移除的变化的证据,说明,现代育种增加了目标高度表达基因在表达上的优势。
考古学和遗传学证据指出大约在一万多年前,在墨西哥西南部的巴尔萨斯河流域玉米被驯化。与驯化相关的一个基本表型变化是从野生祖先Zea mays ssp. Parviglumis变成一种无分枝植物,籽粒紧紧依附在玉米棒子上,导致玉米完全依靠人类繁殖。在接下来的驯化中,玉米遭受了更加集中有针对性改良,杂交玉米自交系的发展使其达到了顶峰,使玉米高度适应
现代农业实践。我们目前利用群体基因组学分析玉米的演化是基于对75份玉米和它的野生近亲基因组的重测序来完成的。我们从35份改良玉米自交系、23份地方品种和17份玉米的野生近亲(14份parviglumis,2份墨西哥种和1份摩擦禾属)产生了781Gb的序列数据,利用shortread技术,每个系的测序平均深度超过5×。利用玉米参考基因组序列(relea 4a.53)reads被拼接起来,接下来的分析是基于最终的一套21141953个高质量的SNPs位点。
玉米地方品种与其他作物品种相比,从他们的野生祖先那里保留了较多的核苷酸多样性,并且显示较低的遗传分化。这可能是因为玉米地方种统计的范围较大和远交系统。连锁不平衡(LD)显著增强了驯化的结果,地方种全基因组重组率ρ估计达到parviglumis比率的25%,并且单倍型平均长度从22kb渐增到30kb。这些结果与驯化瓶颈的效应是一致的,但是一个过度稀缺SNPs表明变异已经开始恢复跨越大部分基因组。然而,地方种基因富集区有较少的特有SNPs(t test, P < 0.001),并且没有过度稀缺SNPs,这个不同可能是由于选择背景效应向着不利的方向突变,驯化后在连锁位点变异在慢慢恢复。现代育种在全基因组多样性方面好像有消极效应或者意味着在我们宽样本的现代品系的单倍型长度。尽管选择不同的自交系,我们估计核苷酸多样性在改良系中可能被高估,在改良期间自交系和地
方品系之间的关系表现全基因组障碍在降低。最后,通过比较玉米地方种和2个墨西哥种基因组,识别出了几个高遗传相似性的扩展区域,综合哪些以前的分类指标,两者具有一致性,更加增强了墨西哥种可能在玉米进化进程中贡献了重要等位基因的可能性。
由于玉米进化期间的选择,基因组识别区段受到很大影响,我们使用一种似然法(跨群体混合似然比法,XP-CLR)对覆盖扩展连锁区域末端等位基因变异频率进行扫描,高XP-CLR的临近的窗口被聚集到同一种特征下,每一种特征代表一个单一选择扫描效应。这些特征在多种着丝粒上显示高XP-CLR值。结合大量着丝粒逆转录因子改变的证据,这些结果表明着丝粒在快速进化。可是,因为着丝粒区域有很少的基因,或因为我们的遗传图谱低估了这些区域的扩展LD,我们进一步的分析掩盖了着丝粒。我们也掩盖了一个新近发现的在一号染色体~50-Mb的倒位多态性。我们在最高的10%的XP-CLR值集中分析了在484驯化和695改良特征。每个驯化特征包含3.4个基因,平均大小322kb,覆盖大约7.6%的玉米基因组,表明多重选择信号,包含高变异、低核苷酸多样性和一个过度高频起源SNPs。我们判断这些特征的平均选择强度为s=0.015,这是在一定范围内,在考古数据的基础上,来自其他驯化和比平均值0.0011还高出一个数量级的跨越剩余染色体组的估计。而选择在玉米改良期间可以更强,从来自我们对改良扫描的XP-CLR值和估计选择系数大大的低于
对驯化的观察值。与驯化特征相比改良特征平均规模较小,并且含有较少的基因。对这一结果可能的解释是不同的地方种的育种者对不同的热带和温带品系的分析不同,并且已经受到了不同的选择压力。事实上,独立的对热带和温带品系进行扫描发现更有力的选择证据,并且几乎没有选择特征的重叠。然而,先前对参与驯化和改良性状位点效应大小的估计,提供了一些独立的在驯化期间选择强度的证据。在改良期间我们发现23%的驯化特征(107)显示另外的选择证据,表明驯化位点的一个子集贡献了持续重要的农艺性状的表型。
个别特征可能产生于单一选择事件,在每个特征上我们指定离这一基因最近的10kb窗口作为最大XP-CLR得分,作为最有可能的候选基因。我们的关于驯化和改良候选基因名单,包括1-2%的玉米筛选的基因组(FGS),代表我们的最佳估计选择范围特征的直接目标,但连锁基因也受到了选择的影响,限制了现代改良对许多特征中发现的3040个基因的使用多样性。
大部分没有包含带注释的序列在驯化和改良中起重要作用(分别是6%和11%),这个发现可以表明在玉米进化过程中的受控制的变异型。然而,大多数的特征鉴定出包含的基因在
高置信度的精细可分级编码,而且应该是证明在检测已有数量性状位点和鉴定异常候选基因上是有用的。例如,候选基因GRMZM2G448355的驯化,直接与水稻上的OsMADS56基因同源,在长日照下推迟了开花,它是在第交流技巧9染色体上控制开花的QTL上发现的(ref. 19),而且2个改进的候选基因含有氮代谢,GRMZM2G036464(编码谷氨酸合成酶)和GRMZM2G428027(编码硝酸还原酶),这些多重位点都存在于一个QTL区域,包含千粒重和氮代谢。在玉米上,只有一小部分新近鉴定的候选基因已经被功能验证。一个例子是候选基因abph1 (GRMZM2G035688)的驯化,该基因因影响叶序而为人所知。然而,功能可以经常因直系同源而被推断出来,被驯化的候选基因GRMZM2G010290编码的蛋白质有不为人所知的功能,但是与拟南芥中影响种子萌发的DAG1和DAG2蛋白质有着相同的序列身份。2个改良相关候选基因,gibberellin 2-Coxidas (被GRMZM2G152354编码)和gibberellin 3-Coxidas(被GRMZM2G036340, dwarf1编码),被发现在植物赤霉素生长合成途径中。在绿色革命基因编码gibberellin 20-Coxidascaster的上游和下游。其它值得的注意的候选基因的改良,包括GRMZM2G082468,拟南芥相同器官中的基因编码脂肪酸转移酵素,在油菜中被设计作为耐干旱的转基因。GRMZM2G087612,与拟南芥的SDP同源,它最先开始储藏种子内油脂分解的产物。
promi什么意思
为了更深入地描绘基因组对驯化的影响,我们利用长寡核苷酸阵列杂交探针来统计25个改良玉米和7个小颖类玉米中18242个基因在种子组织中的精细分级编码的表达。与无候选基因相比,驯化的候选基因在玉米和小颖类玉米的表达上表现出更大的绝对变化(在无候选基因中,29%:22%,P = 0.004),玉米中上流调节和小颖类玉米相关,且在玉米自交系的表达中,只有较低的10%的变异系数(P = 0.006)。表达中降低了的变异于候选基因中被发现(P < 0.001)表明了cis在位点上移动的变异与目标选择相连锁。相对于小颖类玉米,玉米中改良的候选基因也表现出降低表达中的变异(变异系数降低了8%,P=0.019),但是没有在幅度的表达中展现出显著的变化。尽管在玉米中可能因为在连锁位点选择而使表达发生较低的变异,在驯化候选基因的直接改变表明基于顺式调控原件的选择调控区域。
尽管驯化过程中表达的改变未必被苗期组织所限制,驯化候选基因表现出表达时无特定组织的模式,改进的候选基因也表现出无特定组织,但在所有的但除去一个组织中比无候选基因要高度表达(P = 0.025-0.044)。因为改良的候选基因展示出在当代改良玉米和大刍草上无显著表达差异,这个结果表明当代玉米改进可能拥有已经高度表达的靶位点。与完全精细可分级编码相比,并无证据表明偏向于候选基因的基本表达,这与之前重测序筛选
观察到的形成对比。
最终,利用自交系的表达数据来评估候选基因中的驯化的水平。候选基因的驯化表明:有优势(P = 0.001石家庄培训班)但相同或不同的遗传群体中的自交系间优势并无显著差异(t test, P = 0.74),这个结果可以用来简单解释顺式调控原件变异的丢失。改良的候选基因,与无候选基因相比,展现出更高的表达优势,(P = 0.007),绝大多数因为在遗传群体中有更高的优势(P = 0.001),在玉米改良上,可能反映了遗传群体中互补这个重要的角色。
我们对野生型、本地种和当代改良种进行的比较基因组分析揭示了复杂的作物进化并提供了当代育种的建议。早先的研究揭示了一些基因(tb1 和boltzmanntga1)在驯化中迅速地带来了一些形态学上的变化。我们鉴定的大部分的驯化的特点与典型的驯化基因相比,提供了选择上更强的证据,意味着针对上百个基因不同的生物学功能的驯化可能与并为研究的表型有关。与选择连锁的位点上多样性的丢失和观察到的丰富的改良的高表达候选基因表明:当代育种绝大部分已经和基因组上容易实现的目标与可能被聚焦育种尝试在其它位点上的多样性进行有效地合并。
参考文献:trips
1. Briggs, W.H., McMullen, M.D., Gaut, B.S. & Doebley, J. Linkage mapping of domestication loci in a large maize-teosinte backcross resource. Genetics 177, 1915–1928 (2007).
2. Wright, S.I. karlet al. The effects of artificial lection of the maize genome. Science 308, 1310–1314 (2005).
3. Chia, J.-M. et al. Maize HapMap2 identifies extant variation from a genome in flux. Nat. Genet. published online, doi:10.1038/ng.2313 (3 June 2012).
friendfinder
4. Doebley, J., Stec, A. & Hubbard, L. The evolution of apical dominance in maize. Nature 386, 485–488 (1997).
5. Wang, H. et al. deemThe origin of the naked grains of maize. Nature 436, 714–719 (2005).
6. Piperno, D.R., Ranere, A.J., Holst, I., Iriarte, J. & Dickau, R. Starch grain and phytolith evidence for early ninth millennium BP maize from the Central Balsas River Valley, Mexico. Proc. Natl. Acad. Sci. USA 106, 5019–5024 (2009).
7. Matsuoka, Y. et al. A single domestication for maize shown by multilocus microsatellite genotyping. Proc. Natl. Acad. Sci. USA 99, 6080–6084 (2002).