1
标准偏差
相对标准方差的计算公式
准确度:测定值与真实值符合的程度
绝对误差:测量值(或多次测定的平均值)与真(实)值之差称为绝
对误差,用δ表示。
相对误差:绝对误差与真值的比值称为相对误差。常用百分数表示。
绝对误差可正可负,可以表明测量仪器的准确度,但不能反映误
差在测量值中所占比例,相对误差反映测量误差在测量结果中所占的
比例,衡量相对误差更有意义。
2
例:用刻度0.5cm的尺测量长度,可以读准到0.1cm,该尺测量
的绝对误差为0.1cm;用刻度1mm的尺测量长度,可以读准到0.1mm,
该尺测量的绝对误差为0.1mm。
例:分析天平称量误差为0.1mg,减重法需称2次,可能的最大
误差为0.2mg,为使称量相对误差小于0.1%,至少应称量多少样品?
答:称量样品量应不小于0.2g。
真值(μ):真值是客观存在的,但任何测量都存在误差,故真值只
能逼近而不可测知,实际工作中,往往用“标准值”代替“真值”。
标准值:采用多种可靠的分析方法、由具有丰富经验的分析人员经过
反复多次测定得出的结果平均值。
精密度:几次平行测定结果相互接近的程度。
各次测定结果越接近,精密度越高,用偏差衡量精密度。
偏差:单次测量值与样本平均值之差:
平均偏差:各次测量偏差绝对值的平均值。
相对平均偏差:平均偏差与平均值的比值。
标准偏差:各次测量偏差的平方和平均值再开方,比平均偏差更灵敏
的反映较大偏差的存在,在统计学上更有意义。
相对标准偏差(变异系数)
例:分析铁矿石中铁的质量分数,得到如下数据:37.45,37.20,
3
37.50,37.30,37.25(%),计算测结果的平均值、平均偏差、相对
平均偏差、标准偏差、变异系数。
准确度与精密度的关系:
1)精密度是保证准确度的先决条件:精密度不符合要求,表示
所测结果不可靠,失去衡量准确度的前提。
2)精密度高不能保证准确度高。
换言之,准确的实验一定是精密的,精密的实验不一定是准确的。
重复性试验按拟定的含量测定方法,对同一批样品进行多次测定(平
行试验至少5次以上,即n>5),计算相对标准偏差(RSD),一般
要求低于5%
4
数学表达式:
S-标准偏差(%)
n-试样总数或测量次数,一般n值不应少于20-30个
i-物料中某成分的各次测量值,1~n;
标准偏差的使用方法
六个计算标准偏差的公式[1]
标准偏差的理论计算公式
设对真值为X的某量进行一组等精度测量,其测得值为l
1、l2、……ln。令测得值l与该量真
值X之差为真差占σ,则有σ
1=li−X
σ2=l2−X
……
σn=ln−X
我们定义标准偏差(也称标准差)σ为
5
(1)
由于真值X都是不可知的,因此真差σ占也就无法求得,故式只有理论意义而无实用价值。
标准偏差σ的常用估计—贝塞尔公式
由于真值是不可知的,在实际应用中,我们常用n次测量的算术平均值
来代表真值。理论上也证明,随着测量次数的增多,算
术平均值最接近真值,当时,算术平均值就是真值。
于是我们用测得值l
i与算术平均值之差——剩余误差(也叫残差)Vi来代替真差σ,即
设一组等精度测量值为l
1、l2、……ln
则
……
通过数学推导可得真差σ与剩余误差V的关系为
将上式代入式(1)有
6
(2)
式(2)就是著名的贝塞尔公式(Besl)。
它用于有限次测量次数时标准偏差的计算。由于当时,
,可见贝塞尔公式与σ的定义式(1)是完全一致的。
应该指出,在n有限时,用贝塞尔公式所得到的是标准偏差σ的一个估计值。它不是总体标
准偏差σ。因此,我们称式(2)为标准偏差σ的常用估计。为了强调这一点,我们将σ的估计值用“S”
表示。于是,将式(2)改写为
(2')
在求S时,为免去求算术平均值的麻烦,经数学推导(过程从略)有
于是,式(2')可写为
(2")
按式(2")求S时,只需求出各测得值的平方和和各测得值之和的平方艺,即
可。
标准偏差σ的无偏估计
7
数理统计中定义S2为样本方差
数学上已经证明S2是总体方差σ2的无偏估计。即在大量重复试验中,S2围绕σ2散布,它们之
间没有系统误差。而式(2')在n有限时,S并不是总体标准偏差σ的无偏估计,也就是说S和σ之间
存在系统误差。概率统计告诉我们,对于服从正态分布的正态总体,总体标准偏差σ的无偏估计
值为
(3)
令
则
即S
1和S仅相差一个系数Kσ,Kσ是与样本个数测量次数有关的一个系数,Kσ值见表。
计算K
σ时用到
Γ(n+1)=nΓ(n)
Γ(1)=1
8
由表1知,当n>30时,。因此,当n>30时,式(3')和式(2')之间的
差异可略而不计。在n=30~50时,最宜用贝塞尔公式求标准偏差。当n<10时,由于K
σ值的影
响已不可忽略,宜用式(3'),求标准偏差。这时再用贝塞尔公式显然是不妥的。
标准偏差的最大似然估计
将σ的定义式(1)中的真值X用算术平均值代替且当n有限时就得到
(4)
式(4)适用于n>50时的情况,当n>50时,n和(n-1)对计算结果的影响就很小了。
2.5标准偏差σ的极差估计由于以上几个标准偏差的计算公式计算量较大,不宜现场采用,
而极差估计的方法则有运算简便,计算量小宜于现场采用的特点。
极差用"R"表示。所谓极差就是从正态总体中随机抽取的n个样本测得值中的最大值与最小
值之差。
若对某量作次等精度测量测得l
1、,且它们服从正态分布,则
R=lmax−lmin
概率统计告诉我们用极差来估计总体标准偏差的计算公式为
(5)
S3称为标准偏差σ的无偏极差估计,d2为与样本个数n(测得值个数)有关的无偏极差系数,其
值见表2
9
由表2知,当n≤15时,,因此,标准偏差σ更粗略的估计值为
(5')
还可以看出,当200≤n≤1000时,因而又有
(5")
显然,不需查表利用式(5')和(5")了即可对标准偏差值作出快速估计,用以对用贝塞尔公式
及其他公式的计算结果进行校核。
应指出,式(5)的准确度比用其他公式的准确度要低,但当5≤n≤15时,式(5)不仅大大提高了计
算速度,而且还颇为准确。当n>10时,由于舍去数据信息较多,因此误差较大,为了提高准确度,
10
这时应将测得值分成四个或五个一组,先求出各组的极差R
1、,再由各组极差求出
极差平均值。
极差平均值和总体标准偏差的关系为
需指出,此时d
2大小要用每组的数据个数n而不是用数据总数N(=nK)去查表2。再则,分组
时一定要按测得值的先后顺序排列,不能打乱或颠倒。
标准偏差σ的平均误差估计
平均误差的定义为
误差理论给出
(A)
可以证明与的关系为
(证明从略)
11
于是(B)
由式(A)和式(B)得
从而有
式(6)就是佩特斯(.1856)公式。用该公式估计δ值,由于right|Vright|不需平方,
故计算较为简便。但该式的准确度不如贝塞尔公式。该式使用条件与贝塞尔公式相似。
标准偏差的应用实例[1]
对标称值Ra=0.160
数据:1.45,1.65,1.60,1.67,1.52,1.46,1.72,1.69,1.77,1.64,4.56,1.50,1.64,1.74和1.63μm,试求该
样块Rn的平均值和标准偏差并判断其合格否。
解:1)先求平均值
12
2)再求标准偏差S
若用无偏极差估计公式式(5)计算,首先将测得的,15个数据按原顺序分为三组,每组五个,
见表3。
表3
组号l_1l_5R
11.481.651.601.671.520.19
21.461.721.691.771.640.31
31.561.501.641.741.630.24
因每组为5个数据,按n=5由表2查得
故
若按常用估计即贝塞尔公式式(2'),则
若按无偏估计公式即式(3')计算,因n=15,由表1查得K
δ=1.018,则
若按最大似然估计公式即式(4')计算,则
13
=0.09296(
若按平均误差估计公式即式(6),则
现在用式(5')对以上计算进行校核
可见以上算得的S、S
1、S2、S3和S4没有粗大误差。
由以上计算结果可知0.09296<0.0962<0.0979<0.1017<0.1062
即S
2
可见,最大似然估计值最小,常用估计值S稍大,无偏估计值S
1又大,平均误差估计值S4再
大,极差估计值S
3最大。纵观这几个值,它们相当接近,最大差值仅为0.01324μm。从理论上讲,
用无偏估计值和常用估计比较合适,在本例中,它们仅相差0.0017μm。可以相信,随着的增大,
S、S1、S2、S3和S4之间的差别会越来越小。
就本例而言,无偏极差估计值S
3和无偏估计值S1仅相差0.0083μm,这说明无偏极差估计是
既可以保证一定准确度计算又简便的一种好方法。
JJG102-89《表面粗糙度比较样块》规定Ra的平均值对其标称值的偏离不应超过+12%~17%,
标准偏差应在标称值的4%~12%之间。已得本样块二
产,产均在规定范围之内,故该样块合格。
标准偏差与标准差的区别
14
标准差(StandardDeviation)各数据偏离平均数的距离(离均差)的平均数,它是离差平方
和平均后的方根。用σ表示。因此,标准差也是一种平均数。标准差是方差的算术平方根。标
准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、
45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.08
分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。
标准偏差(StdDev,StandardDeviation)-统计学名词。一种量度数据分布的分散程度之标
准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦
然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。
有人经常混用均方根误差(
RMSE
)与标准差(
StandardDeviation
),实际上
二者并不是一回事。
1.
均方根误差
均方根误差为了说明样本的离散程度。
均方根误差(
root-mean-squareerror
)亦称标准误差,其定义为,
i
=
1
,
2
,
3
,
…n
。在有限测量次数中,均方根误差常用下式表示:,
式中,
n
为测量次数;
d
i为一组测量值与平均值的偏差。如果误差统计分布是正
态分布,那么随机误差落在土
σ
以内的概率为
68
%。
2.
标准差
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。
标准差也被称为标准偏差,或者实验标准差。
均方根值也称作为效值,它的计算方法是先平方、再平均、然后开方。比如幅度为100V而
占空比为0.5的方波信号,如果按平均值计算,它的电压只有50V,而按均方根值计算则有
70.71V。这是为什么呢?举一个例子,有一组100伏的电池组,每次供电10分钟之后停
10分钟,也就是说占空比为一半。如果这组电池带动的是10Ω电阻,供电的10分钟产生
10A的电流和1000W的功率,停电时电流和功率为零。
那么在20分钟的一个周期内其平均功率为500W,这相当于70.71V的直流电向10Ω电阻
供电所产生的功率。而50V直流电压向10Ω电阻供电只能产生的250W的功率。对于电机
与变压器而言,只要均方根电流不超过额定电流,即使在一定时间内过载,也不会烧坏。
PMTS1.0抽油机电能图测试仪对电流、电压与功率的测试计算都是按有效值进行的,不会
因为电流电压波形畸变而测不准。这一点对于测试变频器拖动的电机特别有用。
均方根误差为了说明样本的离散程度。
15
对于N1,....Nm,设N=(N1+...+Nm)/m;则均方根误差记作:
t=sqrt(((N^2-N1^2)+...+(N^2-Nm^2))/(m(m-1)));
比如两组样本:
第一组有以下三个样本:3,4,5
第二组有一下三个样本:2,4,6
这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值,也就是离散程度小,均
方差就是表示这个的。
同样,方差、标准差(方差开根,因为单位不统一)都是表示数据的离散程度的。
几种典型平均值的求法
(1)算术平均值这种平均值最常用。设x1、x2、…、xn为各次的测量值,n代表测
量次数,则算术平均值为
(2)均方根平均值
(3)几何平均值
(4)对数平均值
(5)加权平均值
16
本文发布于:2022-11-12 05:19:55,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/2566.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |