非参数统计
—期末九题汇总
目录
1.单样本Wilcoxon符号秩检验(SAS)……………………2
2.Wald-Wolfowitz游程检验法………………………………4
3.两样本的Kolmogorov-Smirnov检验………………………5
4.两个独立样本的M-W-W检验(SAS)………………………6
5.k个样本的检验……………………………………………9
6.k个独立样本的Kruskal-Wallis检验(R)…………………10
7.k个相关样本的Friedman检验(R)………………………11
8.k个相关样本的Cochran Q检验……………………………12
9.完全秩评定的Kendall协和系数(R)……………………14
1.单样本Wilcoxon符号秩检验(SAS)
设是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下:
98 160 136 128 130 114 123 134 129 107
试用Wilcoxon符号检验法检验假设: =130,: 130,显著性水平为=0.05。
解
手算:
i)秩次和计算表
编号 | 血压(x) | D=x-130 | | 的秩 | D的符号 |
1 | 98 | -32 | 32 | 9 | - |
2 | 160 | 30 | 30 | 8 | + |
3 | 136 | 6 | 6 | 4 | + |
4 | 128 | -2 | 2 | 2 | - |
5 | 130 | 0 | 0 | | |
6 | 114 | -16 | 16 | 6 | - |
7 | 123 | -7 | 7 | 5 | - |
8 | 134 | 4 | 4 | 3 | + |
9 | 129 | -1 | 1 | 1 | - |
10 | 107 | -23 | 23 | 7 | - |
| | | | | |
ii)根据表中D的符号和的秩,可以计算得到
=9+2+6+5+1+7=30
=8+4+3=15
径山茶根据n=9, =15, =30,查表得的右尾概率为0.213,P=0.2132=0.426,P值相对于显著性水平=0.05已足够大,因此抽查数据不拒绝,即认为=130。
机算:SPSS
输出结果
表1 Ranks |
| | N | Mean Rank | Sum of Ranks |
y - x | Negative Ranks | 6a | 5.00 | 30.00 |
Positive Ranks | 3b | 5.00 | 15.00 |
Ties | 1c | | |
Total | 10 | 爱情电影大全 | |
表2 Test Statisticsb |
| y – x |
Z | -.889a |
Asymp. Sig. (2-tailed) | .374 |
Exact Sig. (2-tailed) | .426 |
Exact Sig. (1-tailed) | .213 |
Point Probability | .033 |
a. Bad on positive ranks. |
b. Wilcoxon Signed Ranks Test |
| | | | | |
表1显示:y-x的负秩即满足y<x的为6,而y-x的正秩即满足y-x>3的为3,同分的既满足x=y的为1,总共10。并且负秩和30,正秩和15。
表2显示:Z=-0.889,是以负秩为基础计算的结果,其相应的双侧渐进显著性概率为0.426>0.05,因此在=0.05的显著性水平下没有理由拒绝原假设,即认为=130。
SAS托业听力:
程序:
data work.wilcoxon ;
input m1 m2;
d=m1-m2;
cards;
98 130
160 130
136 130
128 130
130 130
114 130
123 130
134 130
129 130
107 130
;
proc univariate data=work.wilcoxon normal;
var d;
run;
结果:
机算结果与手算结果一致。
2. Wald-Wolfowitz游程检验法
有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的
影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量X,Y(单位:g)的表如下:
饲料 | 增重量 |
低蛋白X | 64 | 71 | 72 | 75 | 82 | 83 | 84 | 90 | 91 | 96 |
高蛋白Y | 42 | 52 | 61 | 65 | 69 | 75 | 78 | 78 | 78 | 81 |
| | | | | | | | | | |
给定显著性水平=0.05,试用游程检验法检验两种饲料的影响有无显著差异。
解
手算:
设喂养低蛋白、高蛋白的大白鼠体重增加量为X,Y,其分布函数为F(x),G(x),若饲料对增加重量无影响,即F(x)与G(x)应一致,故
i)提出假设:F(x)=G(x),: F(x) G(x);
ii) =0.05,m=10,n=10;
iii)将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列:
Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X
故得游程总数U=3+3=6,查表,m=10,n=10,U=6的概率为0.019,这对于显著性水平0.025(给定显著性水平=0.05,该问题为双侧检验,故取=0.025比较)已足够大,因此数据不拒绝,认为两种饲料的影响无显著差异。
机算:
步骤:
1)选项为Analyze-Nonparametric Tests-2 Independent Samples。
2)把变量(x)选入Test Variable List;再把用1和2分类的变量y输入到Grouping Variable,在Define Groups输入1和2。
3)在Test Type选中Wald-Wolfowitz runs。
在点Exact时打开的对话框中可以选择ASYMTOTIC ONLY,最后OK即可。
输出结果:
Frequencies |
| y | N |
x | 1 | 10 |
2 | 10 |
Total | 20 |
Test Statisticsb,c |
| | Number of Runs | Z | Exact Sig. (1-tailed) |
x | Minimum Possible | 6a | -2.068 | .019 |
Maximum Possible | 8a | -1.149 | .128 |
a. There are 1 inter-group ties involving 2 cas. | |
英国阿富汗战争b. Wald-Wolfowitz Test | | | |
c. Grouping Variable: y | | | |
| | | | | | |
机算得出的P值与手算结果一致。
3.两样本的Kolmogorov-Smirnov检验
甲乙两台机床加工相同规格的主轴,从这两台机床所加工的主轴中分别随机的抽取7个,然后测量他们的外径(单位:mm)得数据如下:
机床 | 主轴外径尺寸 |
甲(X) | 20.5 | 19.8 | 19.7 | 20.4 | 20.1 | 20.0 | 19.0 |
乙(Y) | 19.7 | 20.8 | 20.5 | 19.8 | 19.4 | 20.6 | 19.2 |
| | | | | | | |
试用Kolmogorov-Smirnov检验法来判断两台机床加工的主轴外径是否有显著差异。
解
手算:
假设组为::F(x)=G(x),:F(x) G(x),F(x),G(x)分别为甲,乙两台机床加工的主轴外径尺寸X与Y的分布函数。
检验统计量D的计算表
机床分组(x) | 绝对频数 | 累积频数 | 经验分布函数 | |
| | | | | |
19 | 1 | 0 | 1 | 0 | 1/7 | 0 | 1/7 |
19.2 | 0 | 1 | 1 | 1 | 1/7 | 1/7 | 0 |
19.4 | 0 | 1 | 1 | 2 | 1/7 | 2/7 | 1/7 |
19.7 | 1 | 1 | 2 | 措组词语2 | 2/7 | 2/7 | 0 |
19.8 | 1 | 1 | 3 | 4 | 3/7 | 4/7 | 1/7 |
20 | 1 | 0 | 4 | 4 | 4/7 | 4/7 | 0 |
20.1 | 1 逍遥游节选 | 0 | 5 | 4 | 5/7 | 4/7 | 1/7 |
20.4 | 1 | 0 | 6 | 4 | 6/7 | 4/7 | 2/7 |
20.5 | 1 | 1 | 7 | 5 | 1 | 5/7 | 2/7 |
20.6 | 0 | 1 | 7 | 6 | 1 | 6/7 | 1/7 |
20.8 | 0 | 1 | 7 | 7 | 1 | 1 | 0 |
| | | | | | | |
检验统计量D=max。m=7,n=7,的拒绝域为D>==0.7269,由表知D=2/7=0.286<0.7269,所以不拒绝,认为两台机床加工的主轴外径无显著差异。
机算:
步骤:
1)选项为Analyze-Nonparametric Tests-2 Independent Samples。
2)把变量(x)选入Test Variable List;再把用1和2分类的变量y输入到Grouping Variable,在Define Groups输入1和2。
3)在Test Type选中Kolmogorov-Smirnov。
在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。
输出结果:
Frequencies |
| Y | N |
x | 1 | 7 |
2 | 7 |
Total | 14 |
Test Statisticsa |
| | x |
Most Extreme Differences | Absolute | .286 |
Positive | .286 |
Negative | -.143 |
Kolmogorov-Smirnov Z | .535 |
Asymp. Sig. (2-tailed) | .938 |
怎么做茄子 Exact Sig. (2-tailed) | .916 |
Point Probability | .388 |
a. Grouping Variable: y | |
机算结果与手算结果一致。 | |
| | | | |
4.两个独立样本的M-W-W检验(SAS)
某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表中的第2列和第4列所示。(=0.05)
次数 | 放弃人数 | 秩 | 放弃人数 | 秩 |
1 | 51 | 13 | 40 | 4 |
2 | 42 | 6 | 47 | 11 |
3 | 45 | 9 | 36 | 1 |
4 | 48 | 12 | 39 | 3 |
5 | 52 | 14 | 37 | 2 |
6 | 44 | 8 | 46 | 10 |
7 | 58 | 16 | 43 | 7 |
8 | 41 | 5 | 55 | 15 |
9 | 61 | 17 | | |
秩和 | | 100 | | 53 |
| | | | |
解
手算
如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t检验。但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验。
:两组放弃预定座位旅客人数的分布是相同的。
m=8,n=9, =53, =100;查表知P=0.037
给定显著性水平=0.05,由于是双边检验,P=0.037>=0.025,所以不能拒绝原假设。
机算(SPSS):
Ranks |
| y | N | Mean Rank | Sum of Ranks |
x | 1 | 9 | 11.11 | 100.00 |
2 | 8 | 6.62 | 53.00 |
Total | 17 | | |
Test Statisticsb |
| x |
Mann-Whitney U | 17.000 |
Wilcoxon W | 53.000 |
Z | -1.828 |
Asymp. Sig. (2-tailed) | .068 |
Exact Sig. [2*(1-tailed Sig.)] | .074a |
Exact Sig. (2-tailed) | .074 |
Exact Sig. (1-tailed) | .037 |
Point Probability | .008 |
a. Not corrected for ties. |
b. Grouping Variable: y |
| | | | | |
机算结果与手算一致。
(SAS):
data temp;
do group=1 to 2;
input n;
do i=1 to n;
生物必修一知识点总结input x @@;
output;
end;
end;
cards;
9
51 42 45 48 52 44 58 41 61
8
40 47 36 39 37 46 43 55
;
proc npar1way data=temp wilcoxon;
class group;
var x;
run;
程序说明:建立输入数据集temp,先输入本组数据的总数,然后输入组中每个数据。分组变量为group,共有两组取值为1和2。输入变量为x,存放每组中的数据。过程步调用npar1way过程,后面用选择项wilcoxon要求进行wilcoxon秩和检验。如果两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息。class语句后给出分组变量名group,var语句后给出要分析的变量x。主要结果见下表。