R语言各种假设检验实例整理(常用)

更新时间:2023-07-14 12:10:10 阅读: 评论:0

R语⾔各种假设检验实例整理(常⽤)版权声明:本⽂为博主原创⽂章,转载请注明出处
⼀、正态分布参数检验
例1. 某种原件的寿命X(以⼩时计)服从正态分布N(µ, σ)其中µ, σ2均未知。现测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命⼤于255⼩时?
解:按题意,需检验
H0: µ ≤ 225H1: µ >225
此问题属于单边检验问题
可以使⽤R语⾔t.test
alternative=c("two.sided","less","greater"),
mu=0,paired=FALSE,var.equal=FALSE,
副教授翻译conf.level=0.95)
其中x,y是⼜数据构成e向量,(如果只提供x,则作单个正态总体的均值检验,如果提供x,y则作两个总体的均值检验),alternative表⽰被则假设,two.sided(缺省),双边检验(H1:µ≠H0),less表⽰单边检验(H1:µ<µ0),greater表⽰单边检验(H1:µ>µ0),mu表⽰原假设µ0,conf.level置信⽔平,即1-α,通常是0.95,var.equal是逻辑变量,var.equal=TRUE表⽰两样品⽅差相同,var.equal=FALSE(缺省)表⽰两样本⽅差不同。
R代码:
X<-c(159, 280, 101, 212, 224, 379, 179, 264,
222, 362, 168, 250, 149, 260, 485, 170)
结果:
可见P值为0.257 > 0.05 ,不能拒绝原假设,接受H0,即平均寿命不⼤于225⼩时。
例2.在平炉上进⾏的⼀项试验以确定改变操作⽅法的建议是否会增加刚的得率,试验时在同⼀个平炉上进⾏的,每炼⼀炉刚时除操作⽅法外,其它条件都尽可能做到相同,先⽤标准⽅法炼⼀炉,然后⽤新⽅法炼⼀炉,以后交替进⾏,各炼了10炉,其得率分别为标准⽅法    78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3
新⽅法        79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1pc是什么意思
设这两个样本相互独⽴,且分别来⾃正态总体N(µ1, σ2)和N(µ2, σ2),其中µ1,µ2和σ2未知。问新的操作能否提⾼得率?(取α=0.05)
解1:根据题意,需要假设
H0: µ1 ≥  µ2    H1: µ1 <  µ2
这⾥假定σ12=σ22=σ2,因此选择t.test,var.equal=TRUE
午夜巴塞罗那原声R代码:
X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
结果:
可见P值<0.05,接受备择假设,即新的操作能够提⾼得率。
解2:
因为数据是成对出现的,所以采⽤成对数据t检验⽐上述的双样本均值检验更准确。所谓成对t检验就是Z i=X i-Y i,再对Z进⾏单样本均值检验
R代码:
X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)kaiba
结果:
可见P值<0.05,接受备择假设,即新的操作能够提⾼得率。并且P值更⼩可见⽐双样本均值检验更准确
例3.对例2进⾏⽅差检验,⽅差是否相同
解:根据题意,需检验
H0:σ12 =  σ22H1: σ12 ≠  σ22
⽅差检验可以⽤st
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, ...)
x,y是来⾃两样本数据构成的向量,ratio是⽅差⽐的原假设,缺省值为1.alternative是备择假设,two.sided表⽰双边检验
(H1:σ12/σ22<ratio),greater表⽰单边检验(H1:σ12)
R代码:
X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
结果:
可见P值为0.559>0.05,接受原假设,认为两者⽅差相同
⼆、⼆项分布参数检验
例4.有⼀批蔬菜种⼦的平均发芽率p0=0.85,现随即抽取500粒,⽤种⾐剂进⾏浸种处理,结果有445粒发芽。试检验种⾐剂对种⼦发芽率有⽆效果。
解:根据题意,所检验的问题为
H0:p=p0=0.85, H1:p≠p0
可以⽤R语⾔的st
alternative = c("two.sided", "less", "greater"),herborist
conf.level = 0.95)
其中x是成功的次数;或是⼀个由成功数和失败数组成的⼆维向量。n是试验总数,当x是⼆维向量时,此值⽆效。P是原假设的概率。
R语⾔代码:
结果:
可知P值0.01207<0.05,拒绝原假设,说明种⾐剂对种⼦的发芽率有显著效果。
三、其它重要的⾮参数检验法
3.1.理论分布完全已知的情况下
3.1.1.⽪尔森拟合优度检验
例5.某消费者协会为了确定市场上消费者对5种品牌啤酒的喜好情况,随即抽取了1000名啤酒爱好者作为样品进⾏试验:每个⼈得到5种品牌的啤酒各⼀瓶,但未标明牌⼦。这5种啤酒分别按着A、B、C、D、E字母的5张纸⽚随即的顺序送给每⼀个⼈。下表是根据样本资料整理的各种品牌啤酒爱好者
的频数分布。试根据这些数据判断消费者对这5种品牌啤酒的爱好有⽆明显差异?
最喜欢的牌⼦    A          B          C          D          E
⼈数X              210      312      170      85        223
解:如果消费者对5种品牌的啤酒⽆显著差异,那么,就可以认为喜好这5种拍品啤酒的⼈呈均匀分布,即5种品牌啤酒爱好者⼈数各占20%。据此假设
H0:喜好5种啤酒的⼈数分布均匀
可以使⽤Pearson χ2拟合优度检验,R语⾔中调⽤st(X)
p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000)
其中x是由观测数据构成的向量或者矩阵,y是数据向量(当x为矩阵时,y⽆效)。correct是逻辑变量,标明是否⽤于连续修正,TRUE(缺省值)表⽰修正,FALSE表⽰不修正。p是原假设落在⼩区间的理论
概率,缺省值表⽰均匀分布,rescale.p是逻辑变量,选择FALSE(缺省值)时,要求输⼊的p满⾜和等于1;选择TRUE时,并不要求这⼀点,程序将重新计算p值。simulate.p.value逻辑变量(缺省值为FALSE),当为TRUE,将⽤仿真的⽅法计算p值,此时,B表⽰仿真的此值。
R语⾔代码:
X<-c(210, 312, 170, 85, 223)
结果:
例6.为研究电话总机在某段时间内接到的呼叫次数是否服从Poisson分布,现收集了42个数据,如下表所⽰,通过对数据的分析,问能否确认在某段时间内接到的呼叫次数服从Poisson分布(α = 0.1)?
解:R语⾔代码:
#输⼊数据
X<-0:6; Y<-c(7, 10, 12, 8, 3, 2, 0)
#计算理论分布,其中mean(rep(X,Y))为样本均值
q<-ppois(X, mean(rep(X,Y))); n<-length(Y)
p=rep(0,n)
p[1]<-q[1]; p[n]<-1-q[n-1]
for (i in 2:(n-1))
p[i]<-q[i]-q[i-1]
#作检验
提⽰结果可能不准确,因为⽪尔森卡⽅拟合由度检验要求分组后每组的频数⾄少要⼤于等于5,⽽后三组中出现的频率分别为3,2,0,均⼩于5,解决问题的⽅法是将后三组合成⼀组,此时的频数为5,满⾜要求,重写R语⾔代码
R语⾔代码:
#输⼊数据
X<-0:6; Y<-c(7, 10, 12, 8, 3, 2, 0)
怎样挽留女友#计算理论分布,其中mean(rep(X,Y))为样本均值
q<-ppois(X, mean(rep(X,Y))); n<-length(Y)
p<-rep(0,n)
p[1]<-q[1]; p[n]<-1-q[n-1]
for (i in 2:(n-1))
p[i]<-q[i]-q[i-1]
#重新分组
Z<-c(7, 10, 12, 8, 5)
#重新计算理论分布
n<-length(Z); p<-p[1:n-1]; p[n]<-1-q[n-1]
#作检验
可见P值>>0.1,可以确认在某段时间之内接到的电话次数服从Poisson 分布
3.1.2.正态W检验
例7.已知15名学⽣体重如下,问是否服从正态分布
解:
R语⾔代码:
w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,
66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)
P值>0.05,接受原假设,认为来⾃正态分布总体。
3.2.理论分布依赖于若⼲个未知参数的情况
3.2.1Kolmogorov-Smirnov 检验
例8.对⼀台设备进⾏寿命检验,记录10次⽆故障⼯作时间,并按从⼩到⼤的次序排列如下:(单位)
420  500 920  1380  1510  1650  1760 2100 2300 2350
如何培养幽默感
试⽤Kolmogorov-Smirnov K 检验⽅法检验此设备⽆故障⼯作时间分布是否服从λ = 1/1500的指数分布?
解: R语⾔进⾏Kolmogorov-Smirnov K 检验使⽤ks.test( )
contain和include的区别
alternative = c("two.sided", "less", "greater"),
exact = NULL)    # x是待检测的样品构成的向量,y是原假设的数据向量或是原假设的字符串。
R语⾔代码:
X<-c(420, 500, 920, 1380, 1510, 1650, 1760, 2100, 2300, 2350)
P值⼤于0.05,⽆法拒绝原假设,因此认为此设备⽆故障⼯作时间的分布服从λ = 1/1500的指数分布。
gid例9.假定从分布函数未知的F(x)和G(x)的总体中分别抽出25个和20个观察值的随即样品,其数据由下表所⽰。现检验F(x)和G(x)是否相同。
R语⾔代码:
stingerX<-scan( )
0.61 0.29 0.06 0.59 -1.73 -0.74 0.51 -0.56
1.64 0.05 -0.06 0.64 -0.82 0.37 1.77
2.36 1.31 1.05 -0.32 -0.40 1.06 -2.47
0.39 1.09 -1.28

本文发布于:2023-07-14 12:10:10,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/1096107.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检验   分布   假设   数据
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图