以t检验为例说明影响假设检验功效和P值的因素
秦国友;赵耐青
【摘要】以单样本t检验为例,对医学统计教学重点和难点“假设检验中的重要
概念功效和P值的影响因素”进行讨论,为进行假设检验的课堂教学提供参考。
【期刊名称】《卫生职业教育》
【年(卷),期】2016(034)012
【总页数】2页(P153-154)
【关键词】假设检验;t检验;功效;P值
【作者】秦国友;赵耐青
【作者单位】复旦大学公共卫生学院,上海200032;复旦大学公共卫生学院,上
海200032
【正文语种】中文
【中图分类】G420
假设检验是统计推断的一个重要内容,也是医学统计课堂教学的重点和难点之一,
其中涉及统计的重要思想和众多概念。在讲授这部分内容时,很多学生即使是对相
关的知识点有很好的记忆,但是在理解和实际应用上也可能会出现较多问题和偏差。
对于假设检验问题,有很多文献从不同的角度进行了讨论[1-9]。本文将从基本
的t检验入手,借助t分布统计量和t检验统计量之间的联系对影响假设检验功效
(Power)和P值大小的因素进行讨论,这有助于对功效和P值的含义做出清晰
的解释。
假设检验是用来判断样本与总体或样本与样本间的差异是由抽样误差引起还是由总
体差别所造成的统计推断方法。假设检验中有两个非常重要的概念——功效与P
值。功效的定义是在备择假设H1成立的条件下拒绝原假设H0的概率,而P值的
含义为在原假设成立的总体中抽样出现比当前样本还要极端情况的概率[1-4]。
一个检验方法功效的高低说明该方法区分原假设与备择假设能力的强弱。通常我们
通过P值来做出拒绝还是不拒绝原假设的结论。在第一类错误给定0.05时,P<
0.05,则拒绝;否则,不拒绝。当拒绝原假设时,我们通常说差异有统计学意义。
但是学生在学习这些概念后,包括很多科研工作者在实际使用中,对功效和P值
的理解还存在一些误区。比如:认为P值越小总体间差别越大,这个理解一般是
不正确的。如何清晰地说明这些问题并且让学生能够理解对于假设检验的教学和实
际中的应用都是非常重要的。在本文中我们将结合课堂教学经验,以单样本的t检
验为例,结合t分布统计量和t检验统计量来阐述这些问题。
假设检验的基本步骤在很多教科书和文献中都有论述,在这里就不再阐述了。我们
直接以单样本的单侧t检验为例来说明我们在课堂教学中如何简单阐明功效和P值
的影响因素。对影响因素的分析将有助于更加清晰地理解这两个概念。单样本的单
侧t检验是用来检验某个样本来自一个未知总体的总体均数μ是否等于一个给定
已知总体的总体均数μ0。研究问题是样本所在的总体均数是否大于一个已知总体
的总体均数。我们可以基于研究问题归结为下列检验假设:建立原假设
H0∶μ=μ0,备择假设H2∶μ≥μ0。
对于上述一个单样本均数比较问题,在满足样本来自正态总体的前提下,可以采用
单样本的t检验来分析。检验统计量为其中x表示样本均数,s表示样本标准差,
n表示样本量。我们可以把检验统计量进一步写成
其中μ表示样本所来自总体的均值。根据t分布的定义,显然服从自由度为(n-1)
的t分布。所以T检验统计量可以表示为一个T分布统计量与一项偏离部分之和。
通过把检验统计量写成这样的形式,结合统计量t在μ=μ0和μ>μ0时的分布情
况(见图1),我们就可以比较清晰地说明影响功效(图1中的阴影面积)和P
值大小的因素了。我们用t0表示T的观察值。
首先,我们通过图1说明影响假设检验功效的因素,然后可以讨论出影响P值的
因素。显然,图1中所有阴影部分的面积表示对应备择假设下检验的功效。
当原假设成立时,即μ=μ0,则上式中的第二项为0,检验统计量T自然服从自由
度为n-1的t分布。
当备择假设成立时,即μ>μ0,显然检验统计量不再服从t分布。我们分3种情
况来讨论对检验功效的影响。
(1)由于标准差s是总体σ的点估计,与总体均数μ取值无关,因此在同样的样
本量n和同样的样本标准差s的情况下,μ偏离μ0越远,则备择假设成立下检验
统计量分布的中心偏离零点越远,于是图1中所有阴影部分的面积增加,即检验
功效越大。
(2)在样本量n和样本所来自的总体均数μ不变的条件下,样本标准差s与σ的
差异是随机抽样误差,总体标准差越小,样本标准差s可能越小,则偏离零点的距
离可能越远,同样造成检验功效越大。
(3)在样本所来自的总体均数μ和总体标准差σ不变的条件下,样本标准差s与
σ的差异是随机抽样误差,因此可以认为s应该变化不大,当样本量n越大,则偏
离零点越远的可能性越大,也会造成检验功效越大。
根据上述讨论,通过对T检验统计量做一个简单的分解,我们可以清晰地分析出
造成总体均数假设检验问题功效变化的3个原因分别是样本所来自总体的均数、
标准差以及样本量。注意到图1中深色阴影部分面积为假设检验的P值。通过分
析,我们可以发现这3个因素也是影响总体均数比较的假设检验问题中P值变化
的3个原因,假设检验的P值越小,说明差异之间越有可能存在统计学意义,但
是无法说明是差异之间的绝对大小,因为这只是造成P值小的原因之一。样本数
据的波动性和样本量同样会影响P值大小。如果我们想确切地了解差异的大小,
区间估计是一个有效的方法。
假设检验中的相关概念,特别是检验功效和P值一直是医学统计教学中的重点和
难点。本文以单样本t检验为例,把t检验统计量分解为一个t分布统计量与之和
的形式,通过对的分析,清晰地说明了影响检验功效和P值大小的因素,从而可
以避免对检验功效与P值理解和认识上的偏差,科学合理地利用P值对实际问题
进行解释。在卫生统计学的课堂教学上,我们广泛采用这种方式讲授,取得了良好
的教学效果。学生普遍反映,通过这种方式更加容易理解和掌握相关的知识点。
【相关文献】
[1]颜虹.医学统计学[M].2版.北京:人民卫生出版社,2010.
[2]赵耐青,陈峰.卫生统计学[M].北京:高等教育出版社,2008.
[3]李康,贺佳,杨土保.医学统计学[M].6版.北京:人民卫生出版社,2013.
[4]方积乾,徐勇勇,陈峰.卫生统计学[M].7版.北京:人民卫生出版社,2013.
[5]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.
[6]郑捷.如何在假设检验中设立原假设[J].统计教育,2005(12):30-31.
[7]吴启富,张玉春.统计假设检验中小概率原理的辨析[J].统计与决策,2012(17):70-71.
[8]陈秀虎,杨敏,白厚义.单尾假设检验假设设置的探讨[J].统计教育,2007(2):8-9.
[9]李福民.论卫生统计学中的假设检验[J].卫生职业教育,2003,21(3):48.■
本文发布于:2022-12-08 09:20:44,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/65161.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |