Admixture:⼀款快速分析群体遗传结构的软件
群体遗传结构(Structure)指遗传变异在物种或群体中的⼀种⾮随机分布。按照地理分布或其他标准可将⼀个群体分为若⼲亚群,处于同⼀亚群内的不同个体亲缘关系较⾼,⽽亚群与亚群之间则亲缘关系稍远。群体结构分析有助于理解进化过程,并且可以通过基因型和表型的关联研究确定个体所属的亚群。
⼀般进⾏群体分析所使⽤的软件为STRUCTURE,但是STRUCTURE的运⾏速度较慢,如今Admixture凭借其⾼速的运算速度逐渐成为群体遗传结构分析的主流软件。
在众多的涉及到亲缘关系分析⽂章中⼏乎都会提到群体遗传结构分析,下⾯是⼏个例⼦:日常工作
图⽚摘⾃⽂章Genomicanalys identify distinct patterns of lection in domesticated pigs and Tibetanwild boars。本分析利⽤全世界⼴泛分布的野猪或者家猪共103 只,来鉴定和藏猪遗传关系最近的品种。图⽚中每⼀列表⽰⼀个个体,其中不同颜⾊⽚段的长度表⽰该个体基因组中某个祖先所占的⽐例。图⽚左侧K=2 到9 表⽰本次研究假定的祖先群体个数从2⼀直到9;图⽚上下横坐标分别表明了群体名称以及地理分布。当K=2 时,欧洲群体和亚、⾮洲群体明显分开;K=3 时,来⾃东南亚群岛的猪属的4 个个体以及1 个⾮洲疣猪个体与剩余的亚洲个体分开;K=4 时,藏猪和亚洲野猪与亚洲的驯化猪分开;K=5 时,103 个个体明显分为5 个群体,欧洲猪、藏猪、中国西南地区的驯化猪、中国东南地区驯化猪和亚洲野猪、猪属的4 个个体和1 个⾮洲疣猪,其中的藏猪基因组中包含多个祖先成分,这可能是
由于祖先本⾝的多态性,或者是近期藏猪与邻近的驯化猪发⽣了杂交⽽导致了基因渗⼊所造成的。
通过这样的图,我们就可以明显看到来⾃不同地点的不同种群所包含的亚群或祖先的个数以及相似率。
Single nucleotide polymorphism profilesreveal an admixture genetic structure of grapevine germplasm from Calabria,Italy, uncovering its key role for the diversification of cultivars in theMediterranean Basin。横坐标表⽰不同样本,纵坐标表⽰每个样本所包含的亚群或祖先的个数、种类以及⽐例。
这样的题是不是很明显很直观⼜觉得“⾼⼤上”呢?其实这样的图⼀点都不难做,只要按照以下步骤,就可以得到这样的图了。
爆炒香辣虾的做法
《我和我的祖国》Admixture使⽤步骤:
喂奶文胸1.输⼊⽂件
Admixture的输⼊⽂件格式有以下三种:PLINK(.bed),PLINK(.ped)或者EIGENSTRAT(.geno),最常⽤的就是Plink产⽣的(.bed)⽂件了。
采⽤PLINK 进⾏群体结构分析。⾸先创建PLINK 的输⽂件-Ped ⽂件,然后利⽤Admixture软件构建群体遗传结构和群体世系信息。
⾸先,我们将已经有的vcf⽂件处理成Plink可以分析的格式,这⼀步需要⽤到vcftools(linux系统下可以很容易地下载安装),代码如下:
这⼀步的输出结果为:plink.ped和plink.map,ped⽂件和map⽂件在后续处理中缺⼀不可。
2.过滤SNP⽂件
使⽤上⼀步产⽣的.ped和.map⽂件,⽤Plink进⾏SNP过滤,代码如下:
输出为:QC.bed(binary file,genotype information)、QC.fam(first six columns of plink.bed)、QC.bim(extended MAP file:two extra cols=allelenames),该步就得到了Admixture可以输⼊的bed⽂件来进⾏群体结构分析和作图。
K是样本所包含的亚群或者祖先数,如若不知道理想的K值,可以设定K=1,2,3,4,5,⽤admixture进⾏计算:
r9sk3.提取CV值
3.提取CV值
提取CV值后,可以得到上⼀步得到的不同K值的错误率,⼀般认为CV error最⼩值为最佳K值。
如果觉得数字不是很明显,也可以通过绘制直线图直观进⾏K值的选择,如下图所⽰,K=3时,Cross-validation error值最⼩。
4.使⽤R画图
最后⼀步!就是拿着我们的数据来做图了。⼀般该步使⽤R来进⾏图⽚绘制,R是⼀款强⼤的绘图计算程序,在Linux系统和Windows系统下都能使⽤,代码很简单,只需要如下⼏⾏:
物理核心素养
⾄此,群体结构分析的图就得到啦!可以根据⾃⼰⽂章的需要对图⽚进⾏润⾊,在⽂章中加⼊这样的图,相信会为⽂章增⾊不少。
参考:admixture-manual
赞赏作者码
⽂献阅读技巧,请点击:批判性阅读⽂献
综述撰写技巧:
论著撰写流程:论著撰写的⼤致流程与⼼得——“当稻农”
SCI投稿注意事项:这场恋爱认真谈——SCI投稿注意事项
Cover letter撰写⽅法:这场恋爱认真谈——SCI投稿注意事项
SCI修回如何回答审稿⼈提问:⽂章修回,如何回答审稿⼈提问. 附模板
SCI英⽂写作辅助⼯具:SCI及⽇常英⽂写作利器——Grammarly
SCI被拒稿后怎么办:SCI论⽂被拒后,后续调整“四步⾛”
SCI审稿状态:SCI投稿过程中主要有哪些状态,持续时间⼤概多久?
先擦隔离还是防晒霜
SCI投稿类型:⽣物医学类SCI可投稿的六⼤⽂章类型
图⽚处理⼯具:Image J⼀款强⼤的科研图⽚处理软件
职业卫生简单的科研作图⼯具: