数据的统计处理和解释:重复性限和再现性限
@智慧的弟弟
2012年08月
(微博:/201292986博客:/wisdomtang)
摘要:本文简要说明重复性限和再现性限的定义以及它们在方法验证中的应用。
进行关键词:重复性限,再现性限,精密度,标准差,临界极差
Abstract:The definitions and their application in the method validation of repeatability limit and reproducibility limit were briefly described in this paper.
Key word:Repeatability limit,Reproducibility limit,Precision,Standard deviation,Critical difference
在日常分析与测试中,我们会经常接触到精密度试验,即在重复性和再现性(复现性)条件下对同一被测物质重复测试,并对测试(或测量)结果进行估算,最后以标准差(或变异系数)来度量测试(或测量)结果的分散性。
然而在通常的实验室工作中往往要求对两个(或多个)测试(或测量)结果观测值的差进行检查,为此需要确定一些类似临界差之类的度量,而不仅仅是标准差(或变异系数)。
一、术语和定义
1.接受参照值
用作比较的经协商同意的标准值。
2.准确度
测试结果或测量结果与真值间的一致程度。
注:准确度是正确度和精密度的组合,在过去一段时间只用来表示现在称为正确度的部分,在很多标准及文献中此情况如今依旧普遍存在。在实际情中,真值用接受参照值代替。
3.正确度
测试结果或测量结果的期望与真值间的一致程度。
4.精密度
在规定条件下,所获得独立测试/测量结果间的一致程度。
5.重复性条件
为获得独立测试/测量结果,由同一操作员按相同的方法、使用相同的测试或测量设施、
在短时间间隔内对同一测试/测量对象进行测试/测量的观测条件。
6.再现性条件
缓解工作压力的方法由不同的操作员按相同的方法,使用不同的测试或测量设施,对同一测试/测量对象进行观测以获得独立测试/测量结果的观察条件。
7.重复性临界差
一个数值,在重复性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。
注:最终值的例子包括结果序列的平均值或中位数,而序列本身可能含有一个或多个结果。
8.再现性临界差(复现性临界差)
一个数值,在再现性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。
9.重复性限
指定概率为95%的重复性临界差。
10.再现性限(复现性限)
指定概率为95%的再现性临界差。
technique以上术语和定义引自GB/T3358.2-2009《统计学词汇及符号第2部分:应用统计》,更多术语和定义见GB/T3358.2-2009,以上术语的定义与GB/T6379.1-2004中存在部分差异。
二、临界差的来源
如果一个估计量是n个独立估计量的和或差,每个估计量的标准差均为σ,则和或差σ。重复性限r和再现性限R均为两个测试结果之间的差,因而相应的标准的标准差为n
我们和地球英文σ。
差为2
在常规的统计工作中,为了检查两个测试(或测量)结果之间的差异,往往用这个标准差的Z倍作为临界差。临界差系数Z的值依赖于与临界差相应的概率水平及测量结果所服从的分布。对于重复性限和再现性限,概率水平规定为95%。在准确度(正确度与精密度)的分析中,我们一般假定基本分布是近似正态的。对于标准正态分布,95%的概率水平
下,Z =1.96,因此77.22=Z 。对于一般的统计使用,将2Z 修约为2.8。
注:标准正态分布N (0,1),查标准正态分布表)(x Φ可知,对概率
975
.0)96.1()96.1(=Φ=≤Z P 那么95.01)96.1(2)96.1()96.1()96.196.1(=−Φ=−Φ−Φ=≤≤
−Z P ,即表示落在区间
μ±1.96σ范围内的概率为95%。Z 被称为是标准正态分布N (0,1)的0.975分位数。
在对重复性条件或再现性条件下得到的两个单一测试(或测量)结果进行检验时,应与重复性限r r σ8.2=或再现性限R R σ8.2=进行比较。也就是说,在进行精密度试验得到的两个测试(或测量)结果(这两个结果可能是的多个结果平均值或中位数)的差值与重复性限r r σ8.2=或再现性限R R σ8.2=进行比较,小于等于重复性限r r σ8.2=或再现性限
R R σ8.2=则表示这两个测试(或测量)结果是可接受的。
注:在实际中,当标准差的真值σ未知时(我们不能进行完全精密度实验,只能基于有限次的测试(或测量)),用标准差的估计值s 替代真值σ。
由GB/T 6379.1-2004和GB/T 6379.2-2004可知重复性限和再现性限是通过实验室间比对试验的测试(或测量)结果来确定。对于标准中的重复性限和再现性限也就是标准起草单位组织多个实验室进行比对试验来确定的。所以,一般情况我们不需要深入的了解标准中重复性限和再现性限是怎么得来的,只需要利用它来验证标准方法及其他证明实验室有能力控制精密度的证据。
如有兴趣深入了解重复性限和再现性限,可参见GB/T 6379.1-2004和GB/T 6379.2-2004等相关标准。
三、重复性限(再现性限)在方法验证中的应用
1.以《水质氨氮的测定纳氏试剂分光光度法》(HJ 535-2009)为例,这份标准里面出现了
两个新术语——重复性限和再现性限(至少对于我来说,这两个是新术语),标准中表述如下:
you are good enough对于我们这类非研究级别的实验室来说,可以不去追究重复性限和再现性限来源,但是我们需要对方法进行验证,就必须弄清以下问题:
1)重复性限和再现性限的定义
2)如果按标准所述,怎么进行精密度试验?跟以往用标准差(或变异系数)来评价
herpes b的精密度试验又有何区别?
从字面上理解,标准中确定的重复性限和再现性限的数据应该类似于一个限值,也就是如果需要验证此方法,我们得到相关数据就应该小于或等于重复性限和再现性限。
2.HJ535-2009中精密度试验的验证方法如下:
1)首先,分别配制氨氮浓度为1.21mg/L和1.47mg/L的标准溶液(如果能购买,最好
是购买有证标准溶液/样品)。
2)每种浓度进行两组测定(在重复性条件和再现性条件下),每组可以仅测定一次,
即每组仅测定得出一个数据(此为极端情况)。
3)对每组测定结果进行统计处理,剔除错误值和离群值(如利用格拉布斯(Grubbs)
2014高考试卷检验法检验离群值),求得每组数据的平均值或中位数,所得的平均值或中位数即
为我们最终所需要的数据。
4)将两组所得的平均值或中位数相减(大减小)的差与重复性限或再现性限进行比
较,如差值小于等于重复性限或再现性限即为合格。
表1HJ535-2009中精密度试验结果表
测试条件重复性再现性
氨氮标准溶液 1.21 1.47 1.21 1.47序号平行1平行2平行1平行2平行1平行2平行1平行2
1 1.200 1.223 1.450 1.459 1.140 1.234 1.450 1.495
2 1.195 1.231 1.467 1.471 1.238 1.190 1.405 1.423
3 1.188 1.201 1.469 1.485 1.231 1.139 1.499 1.520
4 1.234 1.238 1.474 1.487 1.276 1.280 1.411 1.4565
1.215
1.227
1.473
1.477
1.201
1.159
1.472
1.487
注:假设测试结果中无异常和离群数据5)
统计检验
nudge
1.21
2.80.028r r σ==1.47 2.80.024
r r σ==1.21
1.238 1.1880.050.028R ′=−=>1.47
1.487 1.4500.0370.024R ′=−=>可以看出在重复性条件下的试验,结果的极差(两组平均值相减)均大于标准中的重复性限,由此可证明该重复性试验是不可接受的,需要重新或追加试验。
同理求证复现性试验(这里不一一列出)。6)
重复性条件下结果可接受性检验
表2重复性条件下测试结果可接受性检验规则
结果数(n )
情形种类
是否接受
最终报告补救办法
1
不可取2
极差≤r
是
两者均值
极差>r 否不报告再取2个结果
2+2
极差≤r
是
四者平均值
极差>r 否四者中位数2+1
极差≤r
是
三者平均值
极差>r 否
三者中位数(无第4个结果)
不报告
再取1个结果(如可以)
2+1+1
极差≤r
是怎样学习高中数学
四者平均值
极差>r 否四者中位数
n >2
极差≤r
是
n 者平均值
极差>r
否
A :不报告
再取n 个结果
B :n 者中位数
英文手写字体C :不报告
再取m 个结果
注:1)“2+2”为测试过程费用较低的情况,“2+1”、“2+1+1”为测试过程费用较高的