二项分布参数的p-值检验
吕佳;任芳玲;赵子墨
【摘要】Firstly,theregularizedincompleteBetafunctionwasudto
revealtherelationshipbetweenbinomialdistributionandbetadistribution.
r,we
derivatedthemethodandtheformulaforcomputingthep-valueinthe
,anexamplewas
giventoshowtheapplicationofthemethod.%首先利用正则不完全贝塔函数
揭示二项分布与贝塔分布的关系,并利用相关结论获得了检验统计量。进一步给出
二项分布参数的单侧显著性检验p-值的计算方法和计算公式。最后,结合实例对
所给方法进行了演示。
【期刊名称】《河南科学》
【年(卷),期】2015(000)003
【总页数】3页(P324-326)
【关键词】二项分布;单侧检验;p-值;Matlab
【作者】吕佳;任芳玲;赵子墨
【作者单位】延安大学数学与计算机科学学院,陕西延安716000;延安大学数学
与计算机科学学院,陕西延安716000;陕西咸阳乾县教育局,陕西咸阳712000
【正文语种】中文
【中图分类】O211
二项分布是数理统计中应用最广泛的离散型分布之一.其应用领域涉及工业实验、
质量控制、生物医学研究等,此外,二项分布在非参数统计中也扮演着非常重要的
角色.
然而,由于经典统计学主要在决策论的框架下利用Neyman-Pearson的方法理论
来处理假设检验问题,因此,即使是对一些具体分布的参数检验也很少给出p-值
的计算公式.另一方面,假设检验分为固定显著性水平的检验和p-值检验.在固定显
著性水平α时,利用经典检验理论对离散型分布的参数做检验时,如果不采用随
机化检验,则往往无法实现.二项分布是一种离散型分布,自然也存在这样的问题.
所幸的是,准确的p-值和固定显著性水平的随机化检验却是可以获得的.对相关的
随机化检验有兴趣的学者可参看文献[1].虽然随机化检验方法在理论上是有意义
的,但在实际应用中却是缺乏吸引力的.因此,本文主要研究二项分布参数的p-值
检验,旨在给出单侧检验时二项分布参数检验的p-值.
p-值通常被学者们定义为在原假设成立的条件下,出现与样本观察值同样或更为
极端的结果的概率.文献[2-3]都讨论过p-值的深刻含义,p-值在学术研究中也
被称为观察到的显著性水平.事实上,要恰当地定义好p-值,需要说清楚什么是基
于观测数据的极端区域.而极端区域较典型的表现是被样本观察值所界定出的某个
分布的尾部.关于极端区域的适当定义需要按照位置参数的大小对样本空间给定一
个随机序.这可以通过检验统计量来完成.因此,p-值的计算涉及合理选择检验统计
量.
下面我们给出在p-值检验中所使用的检验统计量的定义:
定义1[4]一个统计量T(x)是样本x的实值函数,如果它同时满足下述两个性质:
①T(x)的分布与厌恶参数无关;
②T(x)的分布函数FT(t)=P{T≤t}在任意给定t时是参数θ的单调函数.
则称T(x)为参数θ的检验统计量.
如果一个假设检验问题中没有厌恶参数,即分布族中只有感兴趣的参数θ是未知
的,除此之外别无其他未知参数,则只需考虑一个统计量T(x)是否满足性质b.性
质b要求T(x)的分布函数是参数θ的单调函数,这使定义极端区域成为可能.为完
善起见,在给出p-值定义式之前再引入下述定义.
定义2[4]对于检验统计量T(x),如果P{T>t}是θ的非降(增)函数,则称T
关于θ是随机递增(减)的.到此为止,我们可以给出单侧检验的情形下p-值的定
义式,下面分两种情况来陈述.
①对左侧检验:
当检验统计量关于θ随机递增时,其p-值定义式为:
当检验统计量关于θ随机递减时,其p-值定义式为:
②对右侧检验:
当检验统计量关于θ随机递增时,其p-值定义式为:
当检验统计量关于θ随机递减时,其p-值定义式为:
设随机变量,其中n已知,θ表示成功概率.由二项分布的定义易知其概率函数为:
利用分布函数与概率函数的关系,以及不完全贝塔函数的性质,X的分布函数可写
为:
其中是随机变量B的分布函数,而.二项分布的分布函数的上述形式在实际中非常
有用,下文也将用到.
设随机变量,其中n为已知整数,参数θ表示成功概率,x为X的样本观察值,
现要对其参数θ进行假设检验,本文只考虑单侧检验的情形.首先证明一个定理.
定理设随机变量X~B(n,θ),则对任意x∈ℝ有:
其中FY是随机变量Y~Beta(,n-x+1)x的分布函数.
证明由随机变量,可得:
由贝塔分布的定义,其中,于是定理得证.
为了获得计算p-值所需的检验统计量,现在注意若取T(X)=X,即统计量取为X自
身,则T的分布为二项分布,满足定义1中的性质a;再由(5)式,根据分布函
数的单调性立刻得知定义1中的性质b也是满足的.进一步,由定理1给出的(6)
式及定义2可知,此时T关于参数θ是随机增的.这样就可以进行假设检验了,下
面依然分两种情形给出p-值的计算公式.
3.1对左侧检验
其p-值的计算公式可推导如下:
即:
其中FY是随机变量Y~Beta(x,n-x+1)的分布函数.
3.2对右侧检验
其p-值的计算公式可推导如下:
即:
其中FB是随机变量B的分布函数,而B~Beta(x+1,n-x).
应用(7)、(8)两式对二项分布的参数进行检验时没有难度上的差别,因此我
们仅就左侧检验的情形给出一个实例.
例:一项调查显示某城市老年人口比重不超过14.7%,该市老年协会为了检验该
项调查是否可靠,随机抽选了400名居民,发现其中有57人是老年人.问调查结
果是否支持该市老年人口比重为14.7%的看法.
解:为回答这一问题,令θ表示该市老年人口的比重,考虑下面的假设:
设X表示抽选400名居民中出现的老年人数,则显然有X~B()n,θ,而现在知道
X的样本观察值为x=57.检验该假设的p-值为:
其中FY是随机变量Y~Beta()57,344的分布函数,它在0.147处的函数值可方
便地用MATLAB中的函数命令“betacdf”进行计算.对于本例,由于p=0.6216
是一个很大的概率,所以不能拒绝原假设,即可以认为本市老年人口比重不超过
14.7%.
【相关文献】
[1]aticalstatistics[M].NewYork:AcademicPress,1967.
[2]吕佳,乔克林.关于假设检验中的P-值[J].统计与决策,2011(16):165-169.
[3]朱新玲.假设检验:从P值到贝叶斯因子[J].统计新论,2008(5):17-18.
[4]tatisticalmethodsfordataanalysis[M].NewYork:
Springer-Verlag,1995:27.
本文发布于:2022-12-10 16:15:59,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/80173.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |