一致估计(consistent estimator)亦称相合估计和相容估计。是一种优良点估计。设总体ξ的概率分布函数为,为未知参数,若可估函数g(θ)估计量当n趋于无穷时,在某种意义下收敛于g(θ),则称是在这种收敛意义下的一致估计。它要求作为估计量的统计量,当样本容量无限增大时,在某种意义下,收敛于待估计参数的真值。按收敛的意义不同将一致估计分为两种:若当样本容量时,对任意给定的,有:
则称为的弱一致估计;若有:
则称为的强一致估计。一致估计是点估计中最基本的大样本准则。例如,正态总体的样本均值ξ就是的一致估计,因为根据大数定律,对任给,当时,有:
成立。这就表明ξ是E(ξ)的弱一致估计。
根据观测值来推测母体参数的值或范围的过程称为估计。估计分为点估计和区间估 计。点估计,是根据观测值估计出对母体参数θ的估计值 的过程。例如,在进行灯泡寿命测定时,根据几个灯泡寿命 来推测一批灯泡寿命的过程,就为点估计。其过程是:先抽取若干个灯泡做样本来测取寿命值 (以小时为单位) ,样本的寿命分别是,求出平均值和方差:
此时就用平均寿命去估计母体寿命μ,用方差S去估计母体 σ,即是点估计。
点估计又称定值估计,是指直接用样本平均数或样本成数代替总体平均数或成数,而不考虑误差的一种估计方法。例如对100名大学生进行收视率调查,调查结果是每天收看电视新闻,从而推断,在全体大学生中每天收看电视新闻。
一般说来,用抽样指标估计总体指标,总会存在一定差异,但如果满足下面3个要求,就可认为是合理估计或优良估计。1.无偏性。用抽样指标估计总体指标时,个别样本指标与总体指标间会有偏差,而用很多样本指标的平均值估计总体指标,平均说来是无偏差的。2.一致性。用抽样指标估计总体指标,当样本单位数充分大时,抽样指标将充分接近总体指标。3.有效性。用抽样平均数和总体某一变量来估计总体平均数时,虽然两者都是无偏估计量,但样本平均数更靠近总体平均数,平均说来,它的离差较小,因此,是更优良的估计量。
设总体或总体分布的某个参数为θ,从该总体抽取含量为n的样本,按一定概率估计总体参数θ在哪个范围,即由样本观测值求θ的可信区间,称可信度,通常取95%可信度,即,求θ的可信区间。如求总体均数μ的可信区间,求总体率π的可信区间,求总体回归系数β的可信区间等。θ的区间估计常和其点估计θ相结合。一般当样本含量较大时(如),θ近似服从正态分布,可用正态近似法求总体参数的可信区间:
或简写成。为θ的标准误。通常求总体参数θ的可信区间:
或简写成。可信区间的含义为:固定样本含量n,从总体中作随机抽样,每个样本可以算得一个可信区间,如可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确),只有5个可信区间不包括总体参数(估计错误)。是小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体参数在算得的一个可信区间内,冒5%犯错误的风险。可信区间的两个要素:一是准确度,反映在可信度的大小,越接近1越准确,如可信度比准确;二是精密度,反映在区间的长度,越小越精密。二者是矛盾的,需要兼顾。
样本的已知函数,其作用是把样本中有关总体的信息汇集起来,是数理统计学中一个重要的基本概念。常用统计量有样本矩、次序统计量、U统计量和秩统计量等。其中U统计量是W.霍夫丁于1948年引进的。统计量的充分性和完全性是两个重要概念,充分性是费希尔在1925年引进的,内曼和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫做因子分解定理。统计量的分布叫做抽样分布,它的研究是数理统计中的重要课题。对一维正态总体,有三个重要的抽样分布,即χ分布、t分布和F分布。其中χ分布是F.赫尔梅特于1875年在研究正态总体的样本方差时得到的;t分布是英国统计学家W.S.戈塞特(笔名“学生”)于1908年提出的;F分布是费希尔在20世纪20年代提出的。
本文发布于:2022-10-20 19:01:12,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/83/331665.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |