我应该选择CCA还是RDA分析?
在做微⽣物项⽬的时候,想检测环境因⼦、样品、菌群三者之间的关系或者两两之间的关系,该选择CCA,还是RDA 呢?今天我们来聊聊这个问题。
冗余分析(redundancy analysis, RDA)或者典范对应分析(canonical correspondence analysis, CCA)是基于对应分析(correspondence analysis, CA)发展⽽来的⼀种排序⽅法,将对应分析与多元回归分析相结合,每⼀步计算均与环境因⼦进⾏回归,⼜称多元直接梯度分析。
goodbye歌词RDA 或CCA 模型的选择原则:RDA是基于线性模型,CCA是基于单峰模型。⼀般会选择CCA来做直接梯度分析。但是如果CCA排序的效果不太好,就可以考虑⽤RDA分析。
desolate
先⽤species-sample数据(97%相似性的样品OTU表)做DCA(detrendedcorrespondence analysis)分析,看分析结果中Lengths ofgradient 的第⼀轴的⼤⼩。如果⼤于4.0,就应该选CCA;如果3.0-4.0 之间,选RDA 和CCA均可;如果⼩于3.0,RDA 的结果要好于CCA。
⽬前CCA要⽐RDA⽤得更普遍,有两个原因:
耶鲁大学开放课程globalization翻译1.
德国音乐学院⼤部分情况下,两者的分析结果并差别并不⼤。其实,CCA⾮线性模型其实可以容纳线性模型,线性关系可以算是⾮线性模型的特例。所有⽤RDA可以做的,CCA也可以做,只不过在如果梯度⽐较短的话RDA要精确⼀点。但是,如果是⾮线性关系,⽤线性的RDA来分析,那个准确度就⼤⼤打折扣了。因为,本来点就不在同⼀条直线上,现在⾮得⽤直线去拟合,肯定不合适。这也是为什么SD⼩于3也可以⽤CCA,但是SD⼤于4,就不能⽤RDA的原因。
2.
正因为⼤家都⽤CCA,⽤得多了,⽂献多了,⼤家为了⽅便⽐较,所有更多的选择是CCA,RDA⾃然就越来越少了。(这逻辑,没⽑病)
CCA图⾥⾯的微⽣物是该分类⽔平下丰度在前10的微⽣物(默认是前10种):在特定的分类⽔平下(⽐如⽬⽔平)。⾸先,我们将⽤于作图的所有样本中的同种微⽣物的丰度值相加计算出各个微⽣物的总丰度,然后对这个总丰度值进⾏排序,结果取丰度排名前10的微⽣物来做CCA分析。
1
英雄双行体微⽣物和样品间的关系
如图,⽤线段链接⽬标微⽣物与样品,线段的长短代表了相应样品中⽬标微⽣物丰度的⼤⼩,越长丰debrand
度值越⼤,反之越⼩。
2
中学辅导班微⽣物和环境因⼦之间的关系
如图,物种垂直投影与环境因⼦延长线上,spc_2距离变量箭头的相对位置较spc_1近,就认为物种2在环境变量B较⼤时更适合,⽽物种1的最适值相对较低。
3
样品和环境因⼦之间的关系
如图,将样品投影与环境因⼦延长线上,投影的点的相对位置代表了样品中环境因⼦值的⼤⼩,上图2样品中的环境因⼦B的⼤⼩为:Sa1>Sa2。
⼦B的⼤⼩为:Sa1>Sa2。
下⾯举个栗⼦,来看⼀下如何解读CCA图。
上图的CCA分析结果图,图中箭头代表不同的环境因⼦,红⾊的代表不同的微⽣物,绿⾊的代表不同
的样本(当然这个图可以只展⽰样本和和环境因⼦2种)。
环境因⼦的箭头的长度代表相应的环境因⼦与研究对象(样品,微⽣物)相关程度的⼤⼩,越长代表其对所研究对象(样品,微⽣物)的分布影响越⼤。箭头连线之间的夹⾓的代表其相关性,为锐⾓是说明2个环境因⼦之间是正相关,钝⾓是负相关。xds
人事部三级笔译作图软件:CANOCO软件及R语⾔的Vegan软件包(详见《vegan+ggplot2:让你的CCA/RDA图形美起来》)。
今天就到这⾥啦~~