非参数检验(非参数检验的适用范围)

更新时间:2023-03-01 14:37:39 阅读：评论：0

文章来源：微信公众号【我看人看我】

一、非参数检验的基本介绍

在统计学中，假设检验方法可分为两大类：参数检验和非参数检验。

参数检验即是基于样本的观测数据对总体参数（比如总体均值、方差）及总体参数差异性的检验。在前面的文章中介绍的Z检验、t检验、F检验（方差分析），都属于参数检验方法。参数检验要求总体具备某些条件方可适用，比如总体需呈正态分布、涉及两个总体时两总体必须满足方差同质性（即方差相等）。

但在实际的研究中，会经常碰见不满足参数检验的前提条件的情况，比如总体不服从正态分布，或者总体分布未知，这时就不能使用参数检验方法，不然得到的检验结果会不准确。在参数检验方法不适用的情况，我们就需要选择非参数检验方法进行统计检验。

非参数检验是在总体分布未知或者知之甚少的情况下，通过样本数据对总体分布形态等特征进行推断的统计检验方法。由于此种检验方法在由样本数据推断总体的过程中不涉及总体分布的参数，不要求总体分布满足某些条件，使用条件较为宽松，因此被称为非参数检验，也叫分布自由检验法（distribution-free test）。

二、非参数检验的优劣势

非参数检验和参数检验作为统计推论的两类，都有其适应范围和优劣势，具体情况如下表1。

表1 非参数检验的优劣势

由于参数检验比非参数检验的统计检验力更好，所以在条件满足的情况下，要首先考虑参数检验。至于是否应该采用非参数检验方法，则要根据对总体分布的了解程度和变量层次来决定。

三、统计检验力

上述提到的统计检验力应该如何理解呢？

统计检验力（又称为假设检验的效力，power of a statistical test），是指该检验方法能够准确地拒绝一个错误的原假设的概率，是衡量检验方法的准确程度的指标。

要理解统计检验力，首先要理解假设检验的两类错误。我们知道，假设检验是基于小概率原理由样本统计值来推论总体特征的过程（详细介绍可阅读《统计推论（二）：假设检验的基本介绍》），由于样本不可能完全代表总体，因此这种推断过程难以完全避免错误的产生，即无论最后是否定还是接受原假设，都可能犯错误。具体来说，假设检验会产生四种结果（如下表2），其中两种情况是正确的，另外两种是在推论过程中可能会犯的错误。

表2 假设检验的四种情况

第一类错误（Ⅰ类错误）也叫 α 错误、甲种误差，是指原假设（H0）本身是正确的，但我们拒绝了它所犯的错误。这意味着，我们得到的结论是存在显著性差异，但实际上并不存在这样的差异。而犯第一类错误的可能性，即是我们所确定的显著度。例如，我们确定了0.05的显著度，当p<0.05时，拒绝原假设，当p>0.05时，接受原假设。也就是说，0.05是拒绝或接受原假设的分界值，若我们拒绝原假设，但实际情况是原假设是正确的，那我们犯错的可能性最多只有5%。

第一类错误的产生原因，主要有以下因素：

（1）样本数据自身的误导性，即样本中包含了某些极端数据，导致样本与总体存在较大差异；

（2）研究人员采用的决策标准比较宽松，比如更大的显著度。

第二类错误（Ⅱ类错误）也叫 β 错误、乙种误差，是指原假设（H0）本来是错误的，但我们接受了它所犯的错误。这意味着，我们的得到的结论是不存在显著性差异，但实际上是存在差异的，其后果是我们可能会一项新的发现失之交臂。不像第一类错误可以用明确的概率值来衡量其产生的可能性，犯第二类错误的可能性受到许多因素的影响，比较难确定，需要经过复杂的函数计算，一般用 β 来表示。

虽然第二类错误没有明确的概率值，但我们可以确定的是，在样本量和统计方法固定的前提下，第一类错误和第二类错误存在反比关系。要降低犯第一类错误的可能性，即将显著度下调，那势必会增加犯第二类错误的可能性，即接受错误的原假设的可能性。两类错误的这种矛盾关系是不可避免的，但我们可以通过增大样本容量来在一定程度上同时减少两类错误发生的可能性，因为样本容量越大，样本的代表性就越好，那么由样本推论总体的误差就会越小，自然两类错误的发生可能性也就降低了。

理解了假设检验的两类错误，我们再回来看统计检验力的概念，即检验方法能够准确地拒绝一个错误的原假设的概率，换言之，统计检验力衡量了该检验方法能够正确地识别到真实存在的差异性的能力。结合假设检验的四种结果矩阵我们可以发现，实际上表2矩阵左下角部分所代表的概率即是统计检验力，因此我们可以有表达式：

检验力=1-β

由此我们可以知道，检验力与第二类错误的可能性存在反比关系，统计推论时所犯的第二类错误越小，则检验力就越大。

有哪些因素会影响统计检验力呢？总的来说，主要有三个因素：

（1）实际的影响效果或差异大小

若自变量对因变量的实际影响效果很大，或者两个总体的实际差异较大，都那么影响效果或差异（心理学称为处理效应）就会越容易被识别出来，这意味着统计检验力越强。

（2）显著性标准

显著性标准会影响我们拒绝原假设的概率，比如显著度由0.01变为了0.05，这意味着我们更有可能拒绝原假设，因为否定域的范围变大了，统计检验力因此增大了。

（3）样本容量

在前面我们讲到，样本容量越大，样本的代表性就越好，那么由样本推论总体的误差就会越小从而降低了两类错误的发生可能性。由统计检验力和第二类错误的反比关系可以知道，当犯第二类错误的可能性降低时，统计检验力随之增加。由此可以得出，统计检验力实际上与样本容量成正比关系，样本容量越大，其检验能力越强。

在社会学研究中，虽然非参数检验存在一定的不足，但仍然被频繁应用于统计推论中，这除了非参数检验的使用要求低外，还在于假设检验的检验力与样本容量存在的正比关系。只要样本容量足够大，非参数检验也可以获得比较好的结果。而社会学研究的样本通常都比较大，一次调查中抽取几千上万的样本是常有的事情，这就很好地保证了非参数检验的效力。

四、有哪些常用的非参数检验方法

SPSS提供了多种非参数检验方法，以适用不同的分析场景，具体如下表3。

表3 常用的非参数检验方法

对于这些非参数检验方法的适用场景、如何使用SPSS进行操作以及分析结果如何解读，后续将一一做详细介绍。

注：各方法的英文术语

曼-惠特尼U检验：Mann-Whitney U Test

K-S检验：Kolmogorov-Smirnov 检验

符号检验法：the sign test

维尔克松(Wilcoxon)T检验，也翻译为威尔科克森符合秩次检验：Wilcoxon signed-rank test

克瓦氏（Kruskal-Wallis）单向等级方差分析，简称为H检验

中位值（Median）检验

弗里德曼（Friedman）双向等级方差分析