种群历史有效群体⼤⼩——PSMC案例讲解
在上⼀篇⽂章《种群历史有效群体⼤⼩——PSMC原理介绍》中,周⽼师给⼤家简要介绍了PSMC的分析原理。那么这么厉害的⽅法,具体在⽂章中要怎样应⽤呢?本期为⼤家带来四篇PSMC经典⽂章解读,⼀起来看看吧~
美洲旅鸽的遗传灭绝原因
先从⼀篇北美旅鸽种群历史研究的PNAS⽂章开始[1]。1866年,⼀群旅鸽途经了加拿⼤安⼤略省南部。鸟群约1600⽶宽,480千⽶长,飞越⼀地需要14个⼩时。据估计,这条“⽻之河流” ⼤约由35亿只旅鸽形成。在这个时期,整个北美⼤陆东部可能有多达50亿只旅鸽。
但短短半个世纪后,由于被不断猎杀,以及禽类中的鸡新城疫,外加其⼀次仅产⼀枚卵,旅鸽数量逐步减少,直⾄1914年9⽉1⽇彻底灭绝。尽管有以上的不良环境因素,但按理来说50亿只个体的种群应该有极⾼的遗传多样性,为什么会在如此短的时间灭绝呢?
科学家利⽤古代DNA提取技术得到了三只旅鸽标本⾥的基因组序列数据,然后开展种群历史有效群体⼤⼩分析(PSMC)。⽂章的核⼼就是对以下这张PSMC结果的解读。
图1 近百万年间的旅鸽有效群体⼤⼩变化
从图中可以看出,尽管在19世纪中叶旅鸽看起来数量巨⼤,但实际上其有效群体⼤⼩Ne在近百万年间,⼀直在
0.5~1.7×10^5左右上下波动。⽽它们的在19世纪中叶的普查群体⼤⼩Nc⼤概是3~5×10^9,那么Ne/Nc约等于0.0001。这⼀数值⽐其他鸟类低得多(0.05-0.74)。这说明旅鸽群体实际的遗传多样性并不⾼。
从图1中,我们可以发现,旅鸽在近百万年中,有效群体⼤⼩⼀直处于周期性的波动,经历了⼀次⼜⼀次瓶颈效应(种群规模突然⼤规模降低)。其中这些变化也与某些地质时期吻合。⽐如,在从末次间冰期(1.1~1.3×10^5年前,相对温暖的地质时期)后,其种群有效规模开始持续降低,在末次盛冰期(约2.1×10^4年前,严寒的地质时期)降到最低,然后种群再次恢复。总之,这个物种由于⽓候、⾷物供应等因素,总是处于周期性的种群⼤⼩波动中。
我们在前⾯的⽂章提到过,对于物种来说,累积新的突变是⾮常缓慢的,遗传多样性⼀旦下降就很难恢复。所以,在种群收缩期,旅鸽丢失⼤量遗传多样性。⽽在种群扩张期虽然其群体个体数迅速增加,但实际从遗传学⾓度看,都是遗传上⾼度相似的“冗余拷贝”,群体的遗传多样性并没有充分增长。
PSMC的分辨率只能分析到1万年前的⽔平,所以图1在1万年前的位置就戛然⽽⽌了。但我们可以想
我学会了洗碗象,按照旅鸽群体规模的历史波动规律,在近万年的历史中其种群本来应该处于规模下降的趋势中。恰好19世纪,欧洲⼈⼤量在北美洲定居,带来⼤量捕杀、栖息地破坏等不利因素。两种效应叠加在⼀起,⼤⼤加剧了旅鸽的群体衰减。⼀旦群体⼤⼩低于⼀定的阈值,低于这个物种群体⾃我维系的⽔平,那么它们就会迅速⾛向灭绝。
猛犸象的灭绝之谜
我们再来看看这篇有趣的猛犸象种群历史研究。这个研究团队由瑞典⾃然历史博物馆的研究⼈员领导。他们对两头猛犸象的标本进⾏了测序,⼀头来⾃西伯利亚的oimyakon,距今约45,000年,另⼀头则⽣活在北冰洋的wrangle岛,距今约4,300年,猛犸象⼤概就是在这个时期灭绝[2]。⽂章对两个样本的古DNA进⾏全基因组测序,然后推测它们的种群历史。
图2 两个样本的样本获得地点(A),估算年代和测序数据量(B),以及PSMC分析结果(C)
⽂章篇幅不长,⼤部分内容是围绕以下图中PSMC的分析结果展开的。从PSMC结果中,我们可以看到两个猛犸象的个体的PSMC分析结果基本是重叠的(注意:oimyakon来⾃于4.5万年前,所以对应的预测范围也做了调整,仅⽌于约4.5万年前)。从图中可以看到猛犸象群体经历过两次瓶颈效应(有效群体⼤⼩下降)。⽂章中对两次瓶颈期的解读,也结合了对应的地质时期。
(1)较远那次瓶颈期
较远那次是在早期或中期更新世期间,约是285,000 年前。因为这个时间点早于倒数第⼆次间冰期(也叫埃姆间冰
较远那次是在早期或中期更新世期间,约是285,000 年前。因为这个时间点早于倒数第⼆次间冰期(也叫埃姆间冰
期,Eemian Interglacial,约116,000–130,000 年前,对应图2C中右侧的竖阴影)。间冰期⽓温会持续上升,这理论上会对缩⼩习惯极低寒冷环境的猛犸象的栖息地范围。但这次瓶颈效应早于埃姆间冰期,因此这瓶颈效应不⼤可能是埃姆间冰期的⽓候剧变导致的。
(2)较近那次瓶颈期
古诗山中更近那⼀次瓶颈期,则是⼤概12,000年前有效群体⼤⼩开始下降,直到灭绝。12,000年前这个时期对应更新世和全新世过渡期(Pleistocene/Holocene transition,对应图中2C中的左侧的竖阴影线)。
兔年的对联
为了让⼤家初步了解更新世和全新世的关系,可以参阅表1。在更新世和全新世过渡期,冰期结束⽓温上升,海平⾯上升导致Wrangel与⼤陆隔离成为了岛屿。同⼀时期,欧亚⼤陆的猛犸象消失了,猛犸象这个物种仅仅在Wrangel岛存活,直到约4000年前灭绝。
表1 第四纪地质时期时间表中国传统节日介绍
关于这个这次瓶颈期的分析讨论,应该说不是有新发现,⽽是与已有的研究结果吻合。对应的猛犸象的灭绝,可以百
度“第四纪灭绝事件”。在更新世和全新世过渡期,在全球各个地区出现⼤量巨型动物群的灭绝事件,其中就包括猛犸象。其中原因包括⽓候突变(⽓温突变对⼤型动物冲击更⼤),⼈类猎杀(⼈类在这个时期从⾮洲扩散到全球,相⽐已经适应并惧怕⼈类的⾮洲⼤型哺乳动物,其他地区动物则对⼈类的⼒量⼀⽆所知)等。
总之,最后的这⼀批猛犸象仅仅在Wrangel岛存活(⼤概是因为属于北极岛屿,⽐较寒冷,适合猛犸象⽣存,且与世隔绝可以减少⼈类的捕杀)。但⽣存了⼏千年后,Wrangel岛上的猛犸象也灭绝了。
这其中很重要的原因就是因为岛屿上猛犸象的种群⼤⼩有限,⽆法维持⾜够⾼的遗传多样性。我们上⽂提到过,⼀个物种有效群体⼤⼩如果低于⼀定阈值,就将⽆法抵御遗传漂变导致的遗传多样性丢失,导致物种⾛向灭绝的不归路。
这篇⽂章中,通过分析两个样本的基因组杂合度,发现Wrangel岛上的猛犸象相⽐它四万年前西伯利亚的同类,基因组的确杂合率显著降低(个体杂合度低就是群体多样性低的⼀个体现)。所以,多样性持续下降导致残留在Wrangel岛上的猛犸象群体对环境变化的适应性进⼀步降低,这是它们最终灭绝的因素之⼀。
值得注意的是,任何基于序列的分析,本质上只能获得序列的差异度(核酸替换率),然后基于该物种的突变速率,将序列差异度换算为序列的分化时间。在该⽂章图2C的PSMC图的X轴是双坐标轴。下沿X坐标轴⽤的单位是核酸差异度(K),这是PSMC分析的直接结果。上沿X坐标轴⽤的单位才是我们熟悉的分化时间(T),这是基于每⼀代核酸突变速度u将K换算为T的结果。
如同我们上⽂提到过,某个物种的核酸突变速度本⾝也是基于各种渠道时间的预估,不同来源的数据差异范围很⼤。所以你注意的话,图2C的上沿X坐标的时间刻度有⼀个相当⼤估算预期波动范围(括号中的数字),这实际上就对应不同来源的u值估算的T值的波动。
这再印证了我之前的建议,进化的东西都是推测已经消失的东西,⽆法⼤部分⽆法实在实证伪,只求逻辑⾃洽。如果有多种不同来源的突变速率数据,选择1个符合⾃⼰预期的即可。做饭日记300字
须鲸种群规模史
PSMC当然不仅仅⽤于研究古DNA分析,更多还是⽤于研究现存的物种。现在随着基因组denovo测序的降价,组装⼏个基因组变得很容易,那么寻找⽣物学亮点“拼凑”出⼀篇⽂章,就显得尤为重要。
基于新组装的基因组,开展PSMC分析研究物种的种群规模史,当然⼀种即简单⼜有⼀定创新性的分析点(既然是新基因组,⾃然是前⼈没有做过的)。⽐如这篇2018年研究,须鲸多个物种基因组的⽂章[3]。其中,PSMC也是⽂章中重要的⼀部分内容,我们简要解读⼀下这个部分。
图3 六种须鲸的历史有效群体⼤⼩(Ne)包山楚简
图3中的6种须鲸,包括蓝鲸(blue whale)、鳁鲸(Sei whale)、⼩须鲸(Minke whale)、灰鲸(gray whale)、座头
图3中的6种须鲸,包括蓝鲸(blue whale)、鳁鲸(Sei whale)、⼩须鲸(Minke whale)、灰鲸(gray whale)、座头鲸(humpback whale )、长须鲸(Finwhale)。亮棕⾊竖阴影是更新世的间冰期,灰⾊竖阴影则分别对应MPT(Mid-Pleistocenetransition,中更新世过渡期)和PPT(Plio-Pleistocene transition,上新世-更新世转换期,⼤概2.6百万年)。
将这些地质时期描绘到图中,就很容易将⽓候变化(地质时期对应的就是⽓候的变化)与种群的变化对应起来。⽐如,在PPT期各种须鲸都保持了很⼤的Ne;在MPT期后,⼤部分须鲸Ne(有效群体⼤⼩)保持稳定,但蓝鲸经历了⼀次剧烈的Ne下降;⽽在末次间冰期后(⼤概10万年前),各个种的Ne开始有缓慢降低等等。
所以,要解读PSMC的结果,⽐较重要的⼀点就是搜集重要地质时期的具体时间,以及对应的已经报道的物种兴衰史。提前做好这些功课,才能把⼀张枯燥的PSMC图讨论出花样。
⼤熊猫的种群规模史
在⼤熊猫重测序的⽂章中也使⽤了PSMC的⽅法拟合了历史上⼤熊猫的群体有效⼤⼩(图4a)[3]。对于熊猫的历史有效群体⼤⼩变化过程,主要也是和地质时期共同讨论,这⾥就不再详细描述。
⽐如,较早的⼀次瓶颈效应对应更新世的冰期,较近的⼀次瓶颈效应则发⽣在⼤概2万年前,对应的是末次盛冰期,这部分内容详细的描述建议可以查看原⽂。值得注意的是,这张图中也加⼊了另⼀个⽓候指标——历史上中国黄⼟的堆积速度。这⼀指标和⽓候的⼲燥与湿润相关,可以看出这个指标与⼤熊猫的Ne负相关(r=-0.3)。
值得关注的是,PSMC由于只利⽤1个个体两个单倍型间的差异,来预估两个等位基因间的分化时间以及对应时期的有效群体⼤⼩。如果是更近的时间范围内(1万年内),由于积累的变异太少,PSMC的⽅法则⽆法准确估计Ne值。这篇⽂章中,⽤了∂a∂i的⽅法来弥补PSMC的不⾜,估算了1万年以内的⼤熊猫有效群体⼤⼩。因为只有到1万年内,才能更好讨论⼈类的活动,对⼤熊猫群体的影响。
但∂a∂i这个软件使⽤⽐较复杂,需要预设多种模型,才能⽤于模拟群体的变化过程。那么,对于想估计1万年以内的Ne 值,⼜想使⽤⽅法简单,还有什么选择呢?⼤家可以关注后续对PSMC的改进型⽅法的介绍。
图4 PSMC和∂a∂i 分别估计较远和较近时代的⼤熊猫有效群体⼤⼩
今天的⽂章分享就到这⾥,如果你还觉得意犹未尽,可以来我们的Omicshare课堂,学习周⽼师这两节与物种分化相关的在线课程。
视频观看⽅式
电脑端:
登录Omicshare课堂
⼿机端:
琴棋书画的棋指的是什么通过点击基迪奥微信公众号底部菜单栏【视频教程】观看学习
课程链接:
参考⽂献:
[1] Hung C M, Shaner P J L, Zink R M, et al. Drastic populationfluctuations explain the rapid extinction of the pasnger pigeon[J].Proceedings of the National Academy of Sciences, 2014, 111(29): 10636-10641.
[2] Palkopoulou E, Mallick S, Skoglund P, et al. Completegenomes reveal signatures of demographic and genetic declines in the woollymammoth[J]. Current Biology, 2015, 25(10): 1395-1400.
[3] Árnason Ú, Lammers F,Kumar V, et al. Whole-genome quencing of the blue whale and other rorqualsfinds signatures for introgressive gene flow[J]. Science advances, 2018, 4(4):eaap9873.
[4] Zhao S, Zheng P, Dong S,et al. Whole-genome quencing of giant pandas provides insights intodemographic history and local adaptation[J]. Nature Genetics, 2013, 45(1): 67.
>九九消寒