不拒绝零假设意味着什么

更新时间:2023-06-20 20:58:51 阅读：评论：0

不拒绝零假设意味着什么

常规引用方式
郑冰. 不拒绝零假设意味着什么. 统计之都, 2009.03. URL: cos.name/2009/03/meaning-of-failure-to-reject-h0/.
BibTeX引用

@ARTICLE{,
AUTHOR = {郑冰},
TITLE = {不拒绝零假设意味着什么},
JOURNAL = {统计之都},
YEAR = {2009},
month = {03},
URL = {cos.name/2009/03/meaning-of-failure-to-reject-h0/},
}

由一道试题引发的一点思考

2008年统计学考研真题第四题“食品厂家说：净含量是每袋不低于250g。但有消费者向消协反映不是250g，消协据此要求厂家自检，同时消协也从中随机抽取20袋检验”

研究生网上预报名（1）如果厂家自己检验，你认为提出什么样的原假设和备则假设？并说明理由。
（2）如果从消费者利益出发，你认为应该提出什么样的原假设和备则假设？并说明理由。

高考地理答题技巧作为统计专业的学生来说，熟悉得不能再熟悉了。但是，通过做上面的题目，我发现自己在理解假设检验的问题上犯了一个十分严重的错误。这个问题主要是由于我们学的教材上面写着：“假设检验要么P-value小于a拒绝原假设，P-value大于a接受原假设……”。后来再看看其他教材，发现绝大多数都是这样写的。其实“P-value大于a接受原假设”这种说法是错误的。

P-value大于a的时候，结论到底是什么呢？最早提出这个问题的是：

E·皮尔逊问耶日·奈曼，在检验一组数据是否为正态分布时，如果没能得到一个显著性的 P值，那么怎样才能看这组数据是正态分布的呢？

费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的 P 值（代表没有找到显著性证据）解释为：根据该组数据不能做出充分的判断。依据费歇尔的解释，我们绝对不会得出这样的推理，即没有找到显著性的证据，就意味着待检验的假设为真。这里
引用费歇尔的原话：祝贺英文

“相信一个假设已经被证明是真的，仅仅是由于该假设与已知的事实没有发生相互矛盾，这种逻辑上的误解，在统计推断上是缺乏坚实根基的，在其它类型的科学推理中也是如此。当显著性检验被准确使用时，只要显著性检验与数据相矛盾，这个显著性检验就能够拒绝或否定这些假设，但该显著性检验永远不能确认这些假设一定是真的，……”

所以假设检验的目的在于试图找到证据拒绝原假设，而不在于证明什么是正确的。当没有足够证据拒绝原假设时，不采用“接受原假设”的表述，而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论，我们没有说原假设正确，也没有说它不正确。

举个例子来说：比如原假设为H0: m =10，从该总体中抽出一个随机样本，得到`x=9.8，在a=0.05的水平上，样本提供的证据没有推翻这一假设，我们说“接受”原假设，这意味着样本提供的证据已经证明m=10是正确的。如果我们将原假设改为H0: m =10.5，同样，在a=0.05的水平上，样本提供的证据也没有推翻这一假设，我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢？我们不知道。

总之，假设检验的主要目的是为了拒绝而不是接受。

由一道试题引发的另一道试题

这让我想到2007年统计学考研真题第一题问：“正态分布的假定能不能用数据证明？”

其实也是关于假设检验的问题，具体内容可以参看：

决策与风险

under age10 years old常规引用方式
胡江堂. 决策与风险. 统计之都, 2008.12. URL: cos.name/2008/12/decision-and-risk/.
BibTeX引用

@ARTICLE{,
AUTHOR = {胡江堂},
TITLE = {决策与风险},
JOURNAL = {统计之都},
YEAR = {2008},
month = {12},
URL = {cos.name/2008/12/decision-and-risk/},
}

1、假设与决策：场景

原假设：硬币是均匀的。备择假设：硬币是有偏的。

/*当我们难以拒绝原假设时，只能得到结论：原假设也许是真的，现在不能拒绝它。而当我们能够拒绝它时，结论是：它肯定不真。以下的口语表述不如这里明确（和拗口）的，以这里的表述为准。*/

试验：在平坦的地方，独立地投掷硬币100次，每次投掷的结果都做记录。最后，正反面出现的次数分别是：

正面：55 反面：45

提问：根据你所看到的结果，判断一下，你接受还是拒绝”硬币是均匀的“这一假设？

-R博士回答：“拒绝这个假设，因为所得到的正面数超过了反面数的允许界限，这表明硬币是有偏的。”-A博士回答：“接受硬币是均匀的这一假设。我们不能非难硬币掷出55个正面，45个反面，一个均匀的硬币也能掷出这个比率。”
-R博士：“那什么样的结果才能使你拒绝那假设呢？我的意思是，正面数和反面数应该有多大的差异，才能使你认为硬币是有偏的？“

-A博士：“至少90个正面对10个反面，或者90个反面对10个正面。如果我们的决策是拒绝一个掷出55对45这个比率，或者更高一些比率的硬币，那么这个决策将使我们把许多由于偶然掷出上述比率的均匀硬币都宣判为有偏的。你的看法使得非难一个均匀的硬币太容易了。”
-R博士：“太过分了!至少要掷出90对10的比率你才说硬币是有偏的。你过度的轻信，将几乎不可能拒绝关于硬币是均匀的假设。诚然，你很少拒绝一个均匀的硬币，但对一个有偏的硬币，你也很难拒绝。”

上面的对话应该让大伙体会到了一些假设检验的意思。可以总结一下，对照下面的表格，思路会清晰一些：

判定手机同声翻译软件 \ 假设	真	假
拒绝	第I类错误α	没有错误1-β
接受	没有错误	第II类错误β

A博士（Accept，接受）的法则是，除非试验得到的比率超过90比10，否则就接受硬币是均匀的这一假设。A博士厌恶犯否定均匀硬币的错误（”弃真“，第I类错误），他的法则使

得犯这种错误的概率最小。由于均匀的硬币几乎不会出现超过90比10的比率，他很少冒把一个均匀的硬币说成有偏的风险。然而，他付出的代价是，大大降低了试验的检测能力（power，见下），他的法则使得拒绝假设是极端困难的。大量有偏的硬币也不会出现如90对10这样大的差异，因此它们也会被当成均匀的硬币而没有被检测出来。可以说，A博士对接受假设有偏爱，当假设为真时，他很少犯拒绝它的错误；但当假设不真时，他会常犯接受它的错误。

R博士（在家可做的兼职Reject，拒绝）的法则是，除非比率低于55对45，否则就不能接受硬币是均匀的这一假设，也即，仅当硬币的正反面数差异在一个狭窄的界限之内，她才接受假设。她把试验看成类似9.11时美国进行的安全检查（”宁可错杀三千，不可错过一个“），重要的是检测出有偏的硬币。R博士的法则在接受错误的假设方面所冒的风险极小（”取伪“，第II类错误），代价是增加了把一个均匀硬币判成有偏的风险。可以说，R博士对拒绝假设有偏爱，当假设碰巧不真时，她很少犯接受它的错误；但当假设碰巧为真时，她常犯拒绝它的错误。2011年高考试题及答案

冲刺2-1、决策与风险（用均匀的硬币做试验，第I类错误）

一次试验，不足以判断两位博士谁的法则是正确的。现在，用一个均匀的硬币（我们知道，两位博士不知道，这里的原假设是硬币是均匀的），把上面提到的投硬币试验，重复100次（每个试验由100次投掷构成），那么，记录下的正面数X，将构成一个二项分布，X~B(n,p)，其中，n=100，p=0.5。根据某个中心极限定理，正态分布是二项分布的极限分布，上面的二项分布可以由均值为np=50，方差为np(1-p)=25的正态分布来近似。又因为二项分布只取整数值，在近似它的正态曲线下会出现很多空隙，为了校正这种情况，可以把整数的两头各扩大0.5个单位，以这个区间表示正态曲线下的那个数。

对R博士来说，仅当掷出的正面数多于45，少于55时，她才接受假设。在正态曲线下，这两个端点可以写成45.5和54.5。

——|-/////-|———
45.5 54.5

标准化，（45.5-50）/5=-0.9,(54.5-50)/5=0.9，根据标准正态表，可知45.5-54.5这个接受区域包括了总面积的63%。也即，投掷均匀硬币所产生的样本中，有63%的样本，其正面数落在接受区域，相应地，其正面数落在R博士提出的否定域的概率为37%。也就是说，

当硬币是均匀的时，R博士犯第I类错误的概率为37%。对A博士来说，他的接受区域在10-90之间，他几乎不会犯第I类错误。

2-2、决策与风险（用有偏的硬币做试验，第II类错误，功效）

现在取一个有偏的硬币（我们知道，两位博士不知道，这里的原假设还是硬币是均匀的），即投出正面的概率不等于二分之一（注意，说硬币是有偏的，并不必对p的值作出指定，因为硬币有偏可以有无限多种方式）。为了评价两位博士的法则在拒绝假设方面有多大的成功，我们需要对硬币指定一个偏度，比如是掷出正面的概率是0.6，做上面同样的100次试验（每次试验有100次投掷），近似成一个正态分布，均值np=60，方差是np(1-p)=24。

对A博士来说，他的判定法则是，只要得到的正面数在10到90之间就接受假设。显然，即使一个有偏的硬币所得到的正面数，也位于A博士的接受区域里。即，当硬币出现正面的概率为0.6时，A博士还是经常要接受均匀硬币的假设，他几乎总要犯第II类错误。

对R博士来说，她的判定法则是，仅当所得到的正面数位于45-55之间时，才接受假设。可

以算出45.5-54.5的面积占整个正态曲线区域的13%，也就是说，在使用偏度为0.6的硬币做试验时，R博士错误地接受了硬币是均匀的这一假设的概率是13%（第II类错误），相应地，她正确地拒绝均匀硬币假设的概率为87%。

在这里描述的备择假设（在硬币是有偏的，偏度是0.6）下，A博士实际上没有能力检测出原假设（硬币是均匀）的错误，而R博士则有相当大的能力实现（87%）.这里1-β=87%也被定义为功效(power)oldboy，即，当特别的原假设出现时，正确地拒绝原假设的概率。

3、假设检验

以上不厌其烦地强调了犯两类错误之间的tradeoff。在我们的假设检验中，采取的是类似A博士的法则，尽量减少犯第I类错误的概率（尽量不要”弃真“），尽管这将提高犯第II类错误（”取伪“）的机会。这是一个保守的策略，大概是因为犯第I类错误的风险更大，类似于法庭上”无罪推定“的法则：

原假设：被告无罪。漂泊的意思备择假设：被告有罪

本文发布于:2023-06-20 20:58:51，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/90/151826.html

上一篇：本来想干的事，被人一说就不想做了——是你吗？

下一篇：大学考试试卷《公共政策导论》及参考答案

标签：假设硬币拒绝接受错误

留言与评论（共有 0 条评论）