信度与效度的比较表.pdf
更新时间:2022-09-28 02:34:57 阅读: 评论:0
信度与效度的比较表
信度(rxx)效度(rxy)
信度是指同一被试者在不同时间
在心理测验中,效度是指所测量的与所要
内用同一测验(或用另一套相等的
定义测量的心理特点之间符合的程度,或者简
测验)重复测量,所得结果的一致
单地说是指一个心理测验的准确性。
程度。
信度的指标
1.信度系数。大部分情况下,信度效度的性质
是以信度系数为指标,它是一种相1.效度具有相对性
关系数。信度指数的平方是信度系任何测验的效度是对一定的目标来说的,
数。或者说测验只有用于与测验目标一致的
指标或性质2.信度指数:真分数标准差与实得目的和场合才会有效。
分数的标准差的比值。2.效度具有连续性
3.测量标准误:测量标准误与信度测验效度通常用相关系数表示,它只有程
之间有互为消长的关系:信度越度上的不同,而没有“全有”或“全无”的区
高,标准误越小,信度越低,标准别。效度是针对测验结果的。
误越大。
1.内容效度:内容效度指的是测验题目对
有关内容或行为取样的适用性,从而确定
测验是否是所欲测量的行为领域的代表
性取样。
内容效度经常与表面效度(facevalidity)
混淆。表面效度是由外行对测验作表面上
的检查确定的,它不反映测验实际测量的
东西,只是指测验表面上看来好像是测量
所要测的东西;内容效度是由够资格的判
断者(专家)详尽地、系统地对测验作评
1.重测信度价而建立的。
2.复本信度编制测验时,要考虑表面效度。
分类
3.内部一致性信度最高行为的测验要求有较高的表面效度,
4.评分者信度以使被试者有较强的动机,尽最大努力去
完成,否则,被试可能会产生不配合、马
虎了事,而影响了测验的效度。
典型行为测验则要求较低的表面效度,以
防被试产生反应偏差(如掩饰等)
2.构想效度:指测验能够测量到理论上的
构想或特质的程度,即测验的结果是否能
证实或解释某一理论的假设、术语或构
想,解释的程度如何。
3.效标效度:效标效度又称实证效度,反
映的是测验预测个体在某种情境下行为
表现的有效性程度。
根据效标资料是否与测验分数同时获得,
又可分为同时效度和预测效度两类。
一个好的效标必须具备以下条件:
①效标必须能最有效地反映测验的目标,
即效标测量本身必须有效;
②效标必须具有较高的信度,稳定可靠,
不随时间等因素而变化;
③效标可以客观地加以测量,可用数据或
等级来表示;
④效标测量的方法简单,省时省力,经济
实用。
一、重测信度
1.又称稳定性系数。它的计算方法
是采用重测法,即使用同一测验,
在同样条件下对同一组被试者前
后施测两次测验,求两次得分间的
相关系数。一、内容效度的评估方法
2.一般是两周到四周较宜,间隔时1.专家判断法2.统计分析法3.经验
间最好不超过六个月。推测法
二、本信度复二、构想效度的估计方法
1.又称等值性系数。它是以两个等1.对测验本身的分析:证据包括有测验
值但题目不同的测验(复本)来测的内容效度、内部一致性指标、被试对题
量同一群体,然后求得被试者在两目的反应特点
个测验上得分的相关系数。2.测验间的相互比较:相容效度、区分
2.本信度复也要考虑两个本实复效度、因素分析法
施的时间间隔。如果两个本复几乎3.效标效度的研究证明
是在同一时间内施测的,相关系数4.实验法和观察法证实
评估方法反映的才是不同本的关系,复而不三、效标效度的评估方法
掺有时间的影响。如果两个本的复1.相关法:相关法是评估效标效度最常
施测相隔一段时间,则称稳定与等用的方法,它是求测验分数与效标资料间
值系数。的相关,这一相关系数称为效度系数。
三、内部一致性信度2.区分法:区分法是检验测验分数能否
1.分半信度:分半信度指采用分半有效地区分由效标所定义的团体的一种
法估计所得的信度系数。修正公方法。
式是斯皮尔曼-布朗公式:3.命中率法:命中率法是当测验用来做
2.同质性信度:同质性主要代表测取舍的依据时,用其正确决定的比例作为
验内部所有题目间的一致性。效度指标的一种方法。
几个计算同质性信度的公式如下:
1.库德-理查逊公式2.克伦巴赫
α系数
注意事项
?斯皮尔曼-布朗公式为校正分半
信度的经验公式,它的假设是两半
测验分数的变异数相等。当假设不
成立时,可以采用弗朗那根
(Flanagan)公式或卢伦(kulon)
公式之一,直接求得测验的信度系
数。
?对于一些复杂的、异质的心理学
变量,采用单一的同质性测验是不
行的,因而常常采用若干个相对异
质的分测验。
四、评分者信度:用于测量不同评
分者之间所产生的误差
一、解释真实分数与实得分数的相
关
信度系数可以解释为总的方差中
有多少比例是由真实分数的方差
决定的,也就是测验的总变异中真
分数造成的变异占百分之几。
一、预测误差
二、确定信度可以接受的水平
效度系数的实际意义常常以决定性系数
当rxx﹤0.70时,测验不能用于对
来表示,意旨相关系数的平方,它表示测
个人作出评价或预测,而且不能做
验正确预测或解释的效标的方差占总方
团体比较;
差的比例。
当0.70≤rxx<0.85时,可用于团体
功能二、预测效标分数
比较;
如果X与Y两变量呈直线相关,只要确定
当rxx≥0.85时,才能用来鉴别或
出二者间的回归方程,就可以从一个变量
预测个人成就或作为。
推估出另一个变量。
三、解释个人分数的意义
三、预测效率指数
作用:其一是估计真实分数的范
E=100(1-K)
;围其二是了解实得分数再测时可
能的变化情形。
一般采用95%的或然水平,其置信
区间为:
X―1.96SE<XT≤X+1.96SE
四、比较不同测验分数的差异
一、样本特征一、测验本身的因素
(一)样本团体异质性的影响测验取材的代表性、测验长度、试题类型、
(二)样本团体平均能力水平的影难度、区分度以及编排方式等都会影响效
响度。
二、测验长度二、测验实施中的干扰因素
影响因素(一)测验越长测题取样或内容取㈠主试的影响因素
样越有代表性㈡被试的影响因素
(二)测验越长被试的猜测因素影三、样本团体的性质
响就越小。㈠样本团体的异质性
三、测验难度㈡干涉变量
洛德(Lord)提出在学绩测验中,四、效标的性质
为了保证其可靠性,各类选择题的
理想平均难度为:五择一测题,
0.70;四择一测题,0.74;三择一
测题,0.77;是非题,0.85。
四、时间间隔
两次测验相隔时间越短,其信度系
数越大
1、可信的测验未必有效,而有效的测验必定可信
信度(rxx)
2、信度是效度的必要非充分条件
与效度(rxy)
3、测验的效度总是受它的信度所制约
的关系
4、信芳秘效度的差别在于所涉及的误差不同
解释个人分数的意义
例:在一个智力测验中,某个被试的iQ为100,这是否反映了他的真实水平?如果再测
一次,他的分数将改变多少?95%的或然水平,其置信区间为X―1.96SE<XT≤X+1.96SE,
即真实IQ有95%的可能性落在X―1.96SE与X+1.96SE之间。
已知该智力测验的标准差为15,信度系数为0.84,测量标准误SE=6,则其IQ的测量标
准误和可能范围为:
IQ=100±1.96*6=100±11.76≈88~112
比较不同测验分数的差异
例;某被试在韦氏***智力测验中言语智商为102,操作智商为110。已知两个分数都
是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分
别为0.87和0.88,SEd=7.5。问其操作智商是否显著高于言语智商呢?
SEd=7.5
(1)计出两个分数要达到0.05的显著水平的差异程度的分值:Sed*1.96(考试时为2,
以方便计算)=14.7(15)
(2)计算两个比较分数之间的差异分数:110-102=8
(3)用(1)与(2)比较,如果(1)大于(2),则两分数差异不显著,存在误差的
影响,是误差导致的差异;否则,差异显著,不是误差导致的差异。