关于显著性检验,你想要的都在这⼉了!!(基础篇)
材料会计工作内容
这⾥有必要提⼀下anova1函数中的参数displayopt 的作⽤。在⼤规模的anova1调⽤中(例如把anova1放在for循环中反复调⽤),需要把displayopt设置为'off',否则anova1每调⽤⼀次就会绘制两幅图,这样会迅速的耗费计算机的内存,容易造成程序崩溃。
除了上⽂中介绍的第⼀种调⽤anova1的⽅式,还有⼀种⽅式⽤于均衡的⽅差分析。所谓均衡就是要求
不同的组别内的统计数据个数必须相同。在上例中出现的各个组的统计个数分别为{8,6,6}就属于⾮均衡。在均衡状态下,每个组的数据单独构成X中的⼀列,这样便可以省略参数Group,调⽤⽅式就可以简化为anova1(X)
在上⽂中,我们提到过。⽅差分析必须满⾜两条假设,分别是正态性假定和⽅差齐性假定。因此,在⼀个完整的统计⼯程中,必须⾸先检测数据的正态性假定和⽅差齐性假定,这就涉及到另外两个函数lillietest正态检验函数(这正是我们上⽂提到的分布假设检验⽽不是参数检验,它检验的⽬标是数据集服从何种分布)和vartestn⽅差齐性检验(这正是我们上⽂提到的参数检验⽽不是分布假设检验 ,它检测的⽬标是数据集的分布服从什么样的参数,这⾥就是⽅差)
函数⼆:lillietest(X)
>> [h,p] = lillietest (strength(1:8))
h =
p =
0.5000
解释:h = 0可以认为数据服从正态分布,h=1则认为不服从正态分布
手机卡补卡
p >0.05可以认为接受原假设h = 0,则数据服从正态分布
>> [h,p] = lillietest (strength(9:14))
h =
p =
0.5000
>> [h,p] = lillietest (strength(15:20))
h =
p =
风雨交加0.5000
可以得出结论,strength中三组数都服从正态分布
函数三:vartestn(X, Group)
播放碟片
>> p = vartestn(strength,alloy,'off')
p
=0.5142
注意:X和Group必须是列向量,否则会报错
p>0.05则说明X中的不同Group是齐次的,也就是⽅差性齐。
②双因素⼀元⽅差分析的⽅法和案例:
正如上⽂所述,既然是双因素,那便是有多个标签了。因此双因素⼀元⽅差分析可以理解成“单特征双标签机器学习技术”。由于双因素⼀元⽅差分析要求数据是均衡的,所以它的标签可以省略,就如同上⽂中介绍的anova1的第⼆种使⽤⽅法⼀样。这⾥的例⼦引⽤于MATLAB 的anova2的help⽂档,⽤于说明anova2的使⽤⽅法。
七下数学思维导图这⾥有⼀批爆⽶花数据,现在我们知道这些爆⽶花的质量打分同两个因素相关,⼀个是爆⽶花的品牌(有三个品牌:
Gourmet,National,Generic)另⼀个是爆⽶花的制作⼯艺(油炸,⽓压)。这些数据如下所述:
brand Gourmet National Generic
methods城市道路绿化
油炸 5.5000 4.5000 3.5000
油炸 5.5000 4.5000 4.0000
油炸 6.0000 4.0000 3.0000抢红包软件
一本二本三本是什么意思⽓压 6.5000 5.0000 4.0000
⽓压 7.0000 5.5000 5.0000
⽓压 7.0000 5.0000 4.5000
现在需要了解的⽬标有三个,第⼀:列和列之间是否有显著性差异(品牌间的显著性差异),原假设是显著性差异不存在;第⼆:⾏与⾏之间是否存在显著性差异,原假设是显著性差异不存在 ;第三:品牌和⽅法之间的交互作⽤是否明显,原假设是交互作⽤不明显
为了完成以上三个问题,所以特别引⼊anova2函数,anova2函数的参数如下:
p = anova2( X, reps, displayopt)
X即为待检验数组。其中,X的每列⼀代表⼀种因素,X的每若⼲⾏代表另⼀种因素,这⾥的若⼲使⽤reps指明。displayopt同anova1⼀样,这⾥不再详述。anova2的返回是⼀值⼀幅图。下⾯是具体的MATLAB⽅法:
>> popcorn =[
5.5000 4.5000 3.5000
5.5000 4.5000 4.0000
6.0000 4.0000 3.0000
6.5000 5.0000 4.0000
7.0000 5.5000 5.0000
7.0000 5.0000 4.5000];
>> [p,table,stats] = anova2(popcorn,3)
p =
0.0000 0.0001 0.7462