ancova(协⽅差分析)⾮参数和随机⽅法
第7章ANCOV A(协⽅差分析):⾮参数和随机⽅法
Peter S. Petraitis
Steven J. Beaupre
Arthur E. Dunham
7.1⽣态学问题
⽣态学参数往往不能满⾜参数假定的要求。当这种情况发⽣时,随机⽅法是更常⽤的参数⽅法,⽐如协⽅差分析(ANCOVA)和回归分析的⼀个很好的替代选择。使⽤随机⽅法很简单,并且由于标准参数ANCOVA为⽣态学家所熟知,我们⽤它来激发对⾮参数和随机⽅法的优点和存在问题的讨论。我们通过对检验随机和⾮参数⽅法分析性别和⽣境影响响尾蛇种群的个体⼤⼩来进⾏讨论,年龄在这⾥被作为⼀个混淆(confounding)因素考虑。
个体⼤⼩的变异常见于许多动物中(即, ⽆脊椎动物: Paine 1976; Lynch1977; Sebens 1982; Holomuzki 1989; 两栖动物: Nevo 1973; Berven1982;Bruce和Hairson 1990; 有鳞的爬⾏动物:Tinkle 1972;Dun
ham 1982; Schwaner 1985; Dunham等1989;哺乳动物:Boyce 1978;Melton 1982; Ralls和Harvey 1985), 并且由于其与许多繁殖特征, ⽐如成熟年龄,⼦代个体的数量和⼤⼩,和亲代对⼦代的投⼊, 有协变关系,从⽽引起进化⽣态学家的极⼤兴趣,(Stearns 1992; Roff 180, 1992)。对个体⼤⼩变异的解释包括资源的季节性,质量和可利⽤性(如,Ca 1978; Palmer 1984; Schwaner和Sarre 1988), 基于个体⼤⼩的捕⾷性(Paine 1976), 种群密度(Sigurjonsdottir 1984), 特性替代(Huey 和Pianka 1974; Huey 等 1974)和⽣长速率的渐变变异(Roff 1980)。然⽽个体⼤⼩的地理变异可能常由于个体⼤⼩决定的⽣长速率和种群年龄结构的相互作⽤所致。⽐如,King (1989)建议种群不同的年龄结构是⽔蛇(Nerodia sipedon insularm)个体⼤⼩变异的⼀个重要⽅⾯。因此,懂得个体⼤⼩时间和地理格局和最终⽣长率需要对动物年龄的了解和修正以便同龄动物间的⽐较。
爬⾏动物的⽣长和性别个体⼆态性的格局传统上是利⽤⾮线性⽣长模型技术来分析的(Andrews 1982;Stamps1995)。对⾮线性模型精确的拟合需要⼤量的观察样本,这些样本要求很好地分布在所有体态⼤⼩范围内,这在野外研究中常是难以实现的要求(第10章)。此外,由于每⼀条线都有不同的模型拟合,最佳拟合模型形式(如,von Bertalanffy⽐之于⽤长度,或其它,拟合的逻辑斯蒂模型)会发⽣变化,⽽⽐较⼯作复杂化。同样的,当拟合参数
在⼏个组间进⾏⽐较时,第I类错误的概率增加,就如同多元成对t检验的情形。
对于多组⼩到中等⽤于⽐较的数据集,⽤年龄作协变量的ANCOVA看来对于⽐较多组个体⼤⼩是最佳替代⽅法。然⽽个体⼤⼩和年龄的野外数据常常杂乱。分析常需对⼀个或多个协变量进⾏校正,拟合模型的残值也很少符合独⽴,同正态分布的假定(Sokal和Rohlf 1995; Zar 1996)。
大摆钟传统的基于秩(rank)或其它随机类型检验的⾮参数统计能为参数分析提供好的替代选择。参数分析假定误差呈正态分布,该假定在基于秩或其它随机类型检验的⾮参数检验中被放松。另⼀⽅⾯,参数过程,随机过程,和基于秩的⾮参数检验都要求误差独⽴同分布。随机⽅法和传统的⾮参数检验对⽅差的⾮奇性(heterogeneity-异质性)敏感,并常有这样的误解:⽅差的⾮奇性问题可以通过使⽤⾮参数检验来解决(Hayes 1996)。
典型的⾮参数检验⽤原始数据的秩;零假设要求秩在处理⽔平上是随机分配的。对于⼩样本,由于所有可能的排列都能列出,因⽽可以计算出观测秩排列的准确概率。因此,⼀个常规的⾮参数检验是对原始观测数据秩的随机检验。对于⼤样本,计算⼤多数常⽤⾮参数检验的显著⽔平是通过χ2分布来估计。检验统计量的χ2分布判定是以假定每个处理⽔平的取样秩数据之间区别只在分布位置(如,均值和中值)为基础做出的,且假定基本分布形态相同(即所有其它分布动差-⽅差,偏斜度等都相同)。这些关于⾮参数检验的假定常常不能满⾜,并且,⽣态学家常常假定这样的检验是不要求数据有任何分布的。
其它类型的随机检验是以重洗原始数据排列为基础的(第14章)。这些检验也要求关于总体分布的假定。⼈们常混淆哪些过程构成随机检验和哪些过程构成置换排列(permutation)检验。Kempthorne和Doerfler(1969)利⽤“置换排列”(permutation)这个词来称呼那些以数据所有可能的顺序为基础的检验。随机检验⼀般只⽤在所有可能排列中⼀个随机选取的⼦集。在严格意义上,常规⾮参数检验就是置换排列检验。
下⼀部分,我们探讨⽤参数,⾮参数和随机⽅法解决常⽤ANCOVA解决的问题时的优点和缺点。我们利⽤斑纹⽯响尾蛇(Crotalus lepidus)的个体⼤⼩在性别和地理上差别的数据来说明这个问题。蛇的性别⼆态性的数据很少。Beaupre(1995)研究了在德克萨斯两个地点的斑纹⽯响尾蛇的性别⼆态性问题。在调整了年龄参数以后,他发现在两个地点,雌性个体都明显⼩于雄性个体,并且低海拔的蛇的个体⼤⼩明显⼩于⾼海拔较的蛇(Beaupre 1995)。他还发现性别和海拔的相互作⽤。他⽤⾮参数⽅法是因为他发现了与正态分布的显著偏差。
冬去春来
7.2统计学问题
7.2.1 数据
标记-重捕法观察得到的雄性和雌性响尾蛇年龄和⼤⼩的数据序列来⾃于6年来收集的德克萨斯州Big Bend 国家公园不同海拔的
两个种群。我们的数据和Beaupre(1995)使⽤的数据不完全⼀致,我们的数据包括 87个雄性和雌性个体,其中重捕的33个。Beaupre (1995)有99个雌雄个体,其中重捕的31个。对数据更详细的描述可见Beaupre(1995)。每个捕到的蛇的相对年龄根据蛇尾鸣响部分形态估算(即⽤鸣响节段的数⽬调整为蜕⽪频数; 见Beaupre 1995),并且,头体长度(SVL)⽤来估计个体⼤⼩。有四个变量分别是⽣境(Boquillas和Grapevine Hill),性别,相对年龄和个体⼤⼩(SVL)。⽣境和性别为固定影响,年龄为协变量。⽣境作为固定影响是因为我们对这两个特殊地点不同海拔对微⽓候的影响感兴趣(Dunham et al. 1989)。
7.2.2 常规协⽅差分析
对于主要影响(此例中,性别,⽣境)和他们之间相互作⽤的显著性可由双因⼦ANCOVA 检验,个体⼤⼩作为因变量,年龄作为协变量。在⽤ANCOVA前,进⾏对斜率奇性(homogeneity-同质性)假定的检验。这是个体⼤⼩对年龄在处理⽔平上的线性依赖的相似性检验。如果达到了斜率奇性的标准,ANCOVA过程有效。ANCOVA在数据对模型假定⼩有违反时的稳健性众所周知,尤其在对固定因⼦显著性的检验。在多数情况下,ANCOVA是喜⽤的参数⽅法。然⽽,严重违反假定常见于野外捕获的动物数据中。
⾸先,因变量, 个体⼤⼩, 可能不符合参数统计的假定。爬⾏动物种群中个体⼤⼩分布常呈很⾼的偏峰
态。并且,雌雄个体⼤⼩的分布⽅差可有很⼤差异(如Beaupre et al. 1998)。因此,误差极不可能符合参数分析的要求呈正态分布。第⼆,协变量每条蛇的年龄并不准确,然⽽采⽤ANCOVA,就像其它回归模型I⽅法⼀样, 假定协变量量测误差很⼩。对于野外捕获动物的年龄估计,即使在最好的条件下,也是有问题的。在多数情况下,⽣态学家采⽤年龄的替代,并假设它与年龄成线性,或⾄少是单调的关系。回归模型I,甚⾄当⾃变量(或在ANCOVA中的协变量)有量测误差时也可以使⽤,只要⾃变量误差分布⼤⼤窄于因变量的误差分布(LaBarbara 1989)。这是常有的,然⽽野外捕获的动物的年龄的估计可能与个体⼤⼩的不确定性相当或更⼤,因此,我们予期年龄的测量误差⽐个体⼤⼩
的测量误差更⼤。第三,有野外捕获动物的析因(factorial)设计极少平衡。在每⼀点,⼏乎不可能捕获到相同数量的雄性和雌性个体。⾮平衡的ANOVA和ANCOVA对⽅差⾮奇性很敏感,这在⽐较雄性和雌性时可能是个问题。
实验⽣态学家常试图修正这些难题,这包括修正参数模型本⾝的假定。最常⽤的⽅法是转换因变量使误差⽅差奇性并将类型III 平⽅和⽤于⾮平衡设计。⼤多数⼈希望协变量的误差分布变得⾜够窄。⼀些例⼦中,为减低⽅差,协变量⾃⾝被错误转换;然⽽,这种协变量的转换应该只在有线性关系时应⽤。
尽管它修正了⼀个问题,转换因变量却能产⽣另⼀个问题。⽐如,个体⼤⼩可能通过转换,减⼩不同
处理⽔平上的误差⽅差的⾮奇性,但转换可能使误差呈⾮正态分布。转换也会改变⾃变量和因变量的关系。个体⼤⼩的对数转换可减⼩误差⾮奇性,使误差分布正态,但转换使模型的累加效应变为乘数效应。这可能是个严重问题,特别是当⽣态学家在实验中⽤ANOVA和ANCOVA检验相互作⽤来推论⾮累加⽣态效应,如⾼阶相互作⽤时(Wootton 1994)。
⾮平衡设计的难点可以通过剔除数据的⽅法得以解决。平衡设计降低⾮奇性⽅差的影响。然⽽,多数⽣态学家不喜欢放弃⾟苦得到的数据。放弃数据的⼀个潜在缺陷是缩减了的数据可能导致统计效⼒的显著丧失。通过剔除数据得到的平衡设计的优点极少会超过缺点。
7.2.3 ⾮参数⽅法
有两种⾮参数协⽅差分析的⼀般⽅法。第⼀种⽅法称作“配对”, 包括将数据限制于与协变量值匹配的数据对和产⽣基于数据对之差的转换数据(Quade 1982)。配对⽅法在判定由哪些数据值构成配对⼦集时存有某种随意性,并且显然,它还没有超出单元分析。
第⼆种由Shirley(1981)正规化的⽅法,是⼀种基于因变量秩化的⾮参数ANCOVA⽅法。Shirley的⽅法是在Benette(1968)⼯作的基础上完成的,Benette开发了对秩化后数据的⼀般线性假设的⾮参数检验。对双因⼦ANOVA,Bennett检验最熟悉的例⼦是Scheirer-Ray-Hare检验(Scheirer et al. 1976),这是Kruskal-Wallis检验的扩展。秩化后数据的常规⾮参数检验对数据的正态分布假定是不严
格的。还没有多少⼈认识到类似Kruskal-Wallis检验的⾮参数检验当⽐较中的各组在尺度(如,⽅差)或形状不同时,可能不会发现位置间的真正差异(如,不同组均秩间的差异)(Lehmann 1975)。极端例⼦中,协变量也可能需要秩化(Shirley 1981)。
除了将秩化观测数据⽤于因变量,⾮参数ANCOVA与其它ANCOVA没什么两样。如同往常,数值相同的观测数据被赋予所占秩距的平均秩值。与标准ANCOVA(第五章)⼀样,使⽤两个模型:(1)包括协变量和处理影响相互作⽤的完整模型,⽤于斜率奇性检验(在SAS中成为斜率奇性模式,见公式5.2)和(2)不包括上述相互作⽤的模型,⽤于检验这种调整后的平均数(SAS中称协⽅差分析模型,见公式5.3)。
固定影响模型检验统计量由适当主要效应或相互作⽤效应的平⽅和除以总均⽅得到(即,总平⽅和SS除以总⾃由度)。检验值与临界值进⾏⽐较,该临界值来⾃于给定α⽔平和所考虑影响因素⾃由度的χ2分布。基于以中⼼极限定理应⽤于秩化数据的假定,⽤χ2分布判断显著性⽔平给出理论近似值(Lehmann 1975)。⽽这个假定仅当样本很⼤,且⼏乎没有具相同秩值的数据时才安全。描述了调整后均秩追溯⽐较过程见Shirley(1981,1987)。
检验统计量服从χ2分布⽽不是F分布,因为参数⽅差已知是来⾃秩化数据(Mood和Graybill 1963; Lehmann 1975; Sokal和Rohlf 1995)。参数⽅差的公式是N(N+1)/12, 其中N是实验观察总数。如果没
沉默的反义词有同秩值数据,秩化数据ANCOVA的总SS除以总⾃由度等于参数⽅差(见Sokal and Rohlf 1995对Scheirer-Ray-Hare检验的讨论)。如果有同秩值数据,参数⽅差⼀定要修
正;修正后的参数⽅差是[N(N+1)/12]-C,其中,C=(t i3-t i)/12(N-1),其中i是指从1到s的所有数,s是同秩值数据的组数,t i是第i同秩值数据组的同秩数据数⽬。总SS/总df=[N(N+1)/12]-C。注意:C与Sokal and Rohlf (1995, box 13.6)的修正值D不同,但显然,DN(N+1)/12=[N(N+1)/12]-C。这两个公式的结果⼀致。
7.2.4 随机⽅法
随机检验是对观察结果多次随机化并重新计算适当检验统计量,从⽽产⽣所有可能结果的分布。如果所有可能结果可数,随机检验就是⼀个排列检验。假设检验可从以观察数据所计算出分布的概率直接估计(Manly 1997)。如果数据符合参数模型的假定,参数检验和随机检验的结果是渐进等式。其他随机检验的例⼦见14,16章。
⽤于随机检验的统计量不必需是类似t或F统计量的常规统计量(Manly 1997),例如,在ANOVA和ANCOVA中,处理均⽅,或平⽅和可能与F统计量⼀样适⽤。在单元ANOVA中,F 统计量的分布和以随机化后的平⽅和之间有⼀个常量差。但在更复杂的设计中这是不对的。Edgington(1995)倾向于采⽤平⽅和,⽽Manly(1997)喜欢⽤F⽐值,因为他所进⾏的模拟显⽰基于平⽅和的随机化倾向于低
效⼒。我们下⾯要表明的是平⽅和和F⽐值常给出不同的结果,因为他们检验不同的假设。这不是简单效⼒差异的问题了。
⼀个⽐选择统计量更难的问题是如何随机化观察数据。依零假设的不同,有两个不同的析因设计⽅法(Manly 1997)。⼀⽅⾯,假设关于由于性别和⽣境不同形成差异的零假设是以⼀个假定为基础的,该假定是:对于任何性别x⽣境组合,对任何⼀条蛇个体⼤⼩的观察都是从⼀个种群中得到的。若该假定为真,我们期望任何观测都取⾃于性别x⽣境的任意组合,因⽽对观测数据的随机化可在所有单元进⾏。这种⽅法为Manly(1997)所倡导,因为计算简便,⽽且其模拟结果显⽰与⽅法⼆相似。另⼀⽅⾯,我们假定性别和⽣境应该受到独⽴检验。因此,我们控制⽣境不变检验雌雄个体⼤⼩的差异。在每个⽣境的两个性别中随机取观测值,但是⽣境不混淆。这种⽅法称作限制随机化,由Edgington(1995)提倡。
可以⽤两种⽅法对残值⽽不是对原始数据随机化。Ter Braak(1992)建议计算整个模型所有观测值的残值并将其随机化。在我们的例⼦中,体重残值将依性别,⽣境,性别x⽣境相互作⽤和协变量年龄的影响进⾏整理。完全或有限随机⽅法都可以⽤。Still和Write (1981)建议可以采⽤综合⽅法:⽤完全随机化检验主要效应,⽽相互作⽤影响⽤Ter Braak 的⽅法检验,即将全部主因⼦模型残值随机化的⽅法。
夫概
7.3统计精度:多种⽅法⽐较
7.3.1 参数协⽅差
护眼显示器
回到德克萨斯州两个⽣境得到的雌雄响尾蛇的SVL(头体长度)数据,协变量是年龄,是从响尾蛇的鸣响节数估计⽽来,零假设如下:
1.调整过的个体⼤⼩(即依鸣响节数调整的SVL)不依性别,⽣境的差异⽽存在差异,
和
2.没有性别x⽣境相互作⽤, 性别和⽣境被认为是固定影响。
全部数据包括87个观测值,其中33个是重捕得到的,所以为了避免⾮独⽴性,每个动物的数据在分析中只⽤⼀次。对每⼀个体的单独观测值在全部数据中随机抽取。这给出⼀个54条响尾蛇的⾮平衡设计。(图7.1)
初步的研究分析表明不同⽣境具显著的坡度异质性(表7.1). ANCOVA显⽰性别,⽣境,年龄的显著影响。性别,⽣境间没有发现有相互作⽤。这些结果由于⼀些原因必须看作是偶然现象。⾸先,
斜率⾮奇性违反ANCOVA的假定,并隐⽰两个不同⽣境-Boquillas和Grapevine Hill-间的个体⼤⼩差异依赖于蛇的年龄。第⼆,协变量,鸣响节段的数⽬作为年龄的替代,可能存在很⼤误差。第三,残值
表现出⼀些⽅差⾮奇性和⾮正态性的迹象。随着SVL的增加,残值图表现出系统性增长(图7.2A),表明⽅差⾮奇性。对残值⽅差⾮奇性的检验不显著(Levene’s 检
验,P=0.201;Bartlettt’s 检验,P=0.087),但缺乏显著性可能是由于检验的低效⼒。更重要的是残值分布相对于协变量的值呈峰状(图7.2B),说明残值不符合正态假设。SVL的log10转换也没有改善残值图的形状。
这些观察表明数据不符合参数ANCOVA的假定,显然,有必要采⽤另⼀种⽅法分析这些数据。
7.3.2 ⾮参数协⽅差
我们重复了Beaupre’s(1995)的分析,并应⽤Shirley的技术对秩化SVL序列进⾏⾮参数ANCOVA。⾸先,我们注意到有3组同秩值数据,每个同秩值数据有两个观测值。参数⽅差的修正值等于0.028(见表7.2)。显然,修正值⾮常⼩,对于分析结果⼏乎没有影响,同秩值数据的重要性在同秩值数据的数⽬多和⼩样本时加⼤。
⾮参数分析检验出不同组的斜率⾮奇性(表7.2)。ANCOVA揭⽰了年龄和性别的显著影响。并没有检测到⽣境的影响。⽣境x性别间没有相互作⽤(表7.2)。值得注意的是,Beaupre (1995)⽤Shirley的⽅法进⾏的原始分析(Beaupre 1995)检测到年龄,⽣境,性别,⽣境x性别的相互作⽤的
显著影响。结果的差异最有可能是因为⽤了原数据的两个不同的再抽样数据;我们没有⽤与Beaupre(1995)⽤过的相同数据。这样,差异问题还是没有解决,还提出这样⼀个问题:我们和
Beaupre(1995)采⽤的数据⼦集是否对种群整体具有代表性。我们将在本章后⾯说明怎样采⽤随机过程来解决这个问题。
图7.1以性别和⽣境不同划分的⼏组响尾蛇头体长和年龄的关系,括号中的值指取样的⼤⼩表7.1 斜率均匀性和协⽅差分析的检验结果。
检验df SS MS F P
斜率同质性
年龄×性别 1 13.07 13.07 0.77 0.384
年龄×⽣境 1 109.79 109.79 6.48 0.014
年龄×性别×⽣境 1 <0.01 <0.01 <0.01 0.989
误差46 779.46 16.94
协⽅差分析
性别 1 218.13 218.13 11.53 0.001
⽣境 1 87.61 87.61 4.63 0.036
性别×⽣境 1 48.98 48.98 2.59 0.114
年龄 1 2101.08 2101.08 111.06 <0.001
误差49 927.01 18.19
图7.2 参数协⽅差分析的残差点分布图,上⾯的图表(A)明随头体长的增加,模型残差的变异发⽣系统性改变。下图(B)显⽰,超过协变量的值的残差分析呈现清晰的⾮正态分布。表7.2 头体长序列的⾮参数协⽅差分析的结果a。
检验df SS MSb x2 Pc
斜率同质性
年龄×性别 1 72.79 72.79 0.294 0.588
年龄×⽣境 1 293.4 293.41 1.186 0.276
年龄×性别×⽣境 1 0.6 0.6 0.002 0.961
误差53 13116 247.47
六年级上册单词协⽅差分析
性别 1 1070.21 1070.21 4.325 0.038
⽣境 1 525.62 525.62 2.124 0.145
⽣境×T\性别 1 95.86 95.86 0.387 0.534
年龄 1 4852.34 4852.34 19.608 <0.001
画七星瓢虫总计53 13116 247.47
a Test的值等于⼀个影响因⼦的标准差除以总的MS。⽐如检验年龄的性别相互作⽤的共同影响的异质性,就是
72.79/247.47=0.294.
睚眦的意思b总的MS等于未经修正的参数⽅差减去修正值。未经修正的参数⽅差等于[N(N+1)/12]=54(55)/12=247.500。有三种双向的关联,所以C=18/12(54-1)=0.028。因此。247.5-0.028=247.475,就是总的MS。
c概率⽔平在SAS中⽤PROBCHI函数计算(如P=1-PROBCHI(0.294,1))得到P=0.587。
7.3.3 随机检验