验证性因子分析
验证性因子分析:对量表进行效度验证的一种方法。需要注意验证性因子分析适用于经典量表,探索性因子分析适用于非经典量表
(1)聚合效度(收敛效度):依据AVE(平均提取方差值>0,5)和CR(组合信度>0.7)判断其是否达标
(2)区分效度:就是说你找的这个四个维度,是否可以很好的区分开呢?
(1)将同一维度的概念放入量表-选择开始分析
(2)CFA分析基本汇总
(1)样本量>200
(2)经典量表
(3)如一个维度(因子A),至少对应2个或2个以上的内容(A1/A2/A3/A4/A5)
(4)调整方法:结合MI指标
链接1 :数据分析实战教学之验证性因子分析-SPSSAU实现 https://www.bilibili.com/video/av69372013
链接2 :验证性因子分析(CFA)-SPSSAU帮助手册 https://spssau.com/helps/questionnaire/cfa.html
验证性因子分析
验证性因子分析(confirmatory factor analysis, CFA)是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。
验证性因子分析CFA 的主要目的在于进行 效度验证 ,同时还可以进行 共同方法偏差CMV 的分析。
结合实际应用情况,验证性因子分析通常有三个用途:
聚合效度,又称收敛效度,强调那些应属于同一因子(指标)下的测量项,测量时确实落在同一因子下面。
如果目的在于进行聚合(收敛)效度分析,则可使用 AVE 和 CR 这两个指标进行分析,如果每个因子的AVE值大于0.5,并且CR值大于0.7,则说明具有良好的聚合效度,同时一般还要求每个测量项对应的因子载荷系数(factor loading)值大于0.7。有时候还可能会结合模型拟合指标,以及进行模型MI值修正,以达到更好的结论。
由上表可知,AVE值全部均大于0.5,而且CR值全部均大于0.7,因而说明本次测量量表数据具有优秀的聚合效度。
区分效度,强调本不应该在同一因子(指标)下的测量项,测量时确实不在同一因子下面。
如果目的在于进行区分效度分析,则可使用AVE根号值和相关分析结果进行对比,如果每个因子的AVE根号值均大于“该因子与其它因子的相关系数最大值”,此时则具有良好的区分效度,为更好表述,使用下图展示:
上图的斜对角线为AVE的根号值,,比如因子对应的AVE根号值为0.843,该值大于因子1与另外3个因子的相关系数(分别是0.700,0.646和0.777),类似因子2,因子3,因子4也这样进行分析。最终发现因子的AVE根号值,全部均大于该因子与其它因子的相关系数值,因而说明具有很好的区分效度。
操作步骤:
分析时首先完成验证性因子分析的模型构建, 通过' 生成变量 '功能将题项合并为一个整体(因子)进行 相关分析 。
共同方法偏差,是指由于测量外部的某些因素导致数据出现集中的偏差。换句话说,测量的差异是由于研究本身(或其他),如测量工具、问题构成或测量环境等导致的。
如果目的在于进行共同方法偏差(CMV)分析,常见的做法为: 将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面,然后进行分析。
如果测量出来显示模型的拟合指标,比如卡方自由度比,RMSEA,RMR,CFI等无法达标,则说明模型拟合不佳,即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好),因而说明数据通过共同方法偏差CMV检验,数据无共同方法偏差问题。
上图显示卡方自由度值为11.137,明显高于标准(>3),并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7,明显偏差标准值(大于0.9),RMSEA和RMR值均大于0.15,也严重偏差标准值。因而说明模型拟合质量非常糟糕,也即说明不能本次研究量表数据无法聚焦成一个因子,说明无共同方法偏差问题。
针对CMV检验,上种思路同样也适用于使用探索性因子分析EFA方法进行检验CMV问题(也称作Harman单因子检验方法),即查看把所有量表项进行探索性因子分析EFA时,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,通常以50%为界,此时可判定存在同源方差(共同方法偏差),反之则说明没有共同方法偏差问题。
针对共同方法偏差(CMV)分析,还有其它的一些做法,建议用户以文献为准。
(1)进行聚合(收敛)效度,或区分效度分析,建议首先进行探索性因子分析(EFA),然后再进行CFA分析。
原因在于CFA对于数据质量要求高,如果探索性因子分析就发现因子与测量项对应关系出现偏差,需要首先进行处理,确认好因子与测量项对应关系后,再进行CFA分析。
(2)如果使用CFA进行分析,建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。
(3)一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。
登录 SPSSAU官网 体验在线数据分析
快速掌握验证性因子分析
验证性因子分析(confirmatory factor analysis, CFA)是结构方程模型的一种最常见的应用。
验证性因子分析(confirmatory factor analysis, CFA)通常可用于四种用途:
一是针对成熟量表进行 效度分析 ,包括结构效度,聚合(收敛效度)和区分效度;
二是验证性因子分析可用于 组合信度 的分析;
三是验证性因子分析还可用于进行 共同方法偏差CMV检验 ;
四是使用验证性因子分析进行 权重计算 。
使用SPSSAU进行验证性因子分析是一件轻松的事情。但在实际分析过程中,容易出现各种问题,解决问题才是关键。其实质是对于分析的掌握能力。一般情况下,验证性因子分析的分析流程如下:
在进行CFA分析前,一定需要清楚的知道,通常情况下量表数据才能进行CFA分析,而其它的一些数据一般不能进行CFA分析。所以数据准备需要按照CFA的思路进行,包括每个因子对应4~7个题(为什么是4~7个呢?因为如果个别不达标后面可以删除掉);如果不是这样,就很有可能出现各种问题而且没有缓冲;在进行验证性因子分析之前,一般需要先进行探索性因子分析,首先因子与项之间有着较好的对应关系,如果探索性因子分析已经发现各种对应关系有问题,那么验证性因子分析时结果一般都不理想,这一步骤非常重要,也是减少各种问题的关键。
在进行验证性因子分析时,重要的指标是factor loading值,一般标准化的factor loading值需要大于0.7,如果该值较小,就说明对应项与因子之间对应关系弱,因此可考虑删除该项,也或者移动该项到别的因子里面。重复几次直至标准化factor loading值都大于0.7即可。这样对应的其它指标,比如AVE值,CR值等才可能达标,因此这些指标都是基于标准化Factor loading值计算得到。
关于利用SPSSAU进行验证性因子分析的操作上,如下:
本例子中共有4个因子,每个因子对应着一些项。所以分别放在4个因子框里面。默认SPSSAU会以Factor 1,Factor 2等这样的名字进行,当然可以自主地对因子进行命名。一般情况下不会使用二阶模型,如果确实是二阶模型则选中即可。
除此之外,在进行验证性因子分析时,有时候会对模型进行MI指标调整,此时也可进行设置。在实际分析时,如果使用验证性因子分析进行效度分析(包括结构效度,聚合效度,区分效度),也或者组合信度时,对于模型的拟合指标关注度较低,因此MI指标调整使用较少。
在使用SPSSAU进行CFA分析后,SPSSAU默认会输出上述中涉及到的分析的各类表格。SPSSAU输出相关表格说明如下:
当然,上述表格中有一些基本无意义,比如残差项估计值,因子协方差,显变量协方差表格等,意义均较小,可能对于分析建模有一定帮助,通常无实质性价值。
以及SPSSAU默认都会输出智能分析和分析建议等,如下各图:
进行验证性因子分析时,很容易出现一些问题,比如效度不达标、factor loading值过小或者过大,也或者各种指标拟合不达标等。
接下来从3个角度去剖析数据不达标的处理。
第1点:效度不达标
如果对验证性因子分析进行效度验证出现问题。分别说明如下:
第2点:factor loading值过大或过小
如果说标准化的Factor loading值过大,比如大于1,说明有着很强的共线性问题,建议可分别针对每个因子对应的项,分别做相关分析,将相关关系过强(比如相关系数值大于0.8甚至0.9)的项删除后重新分析,减少共线性问题;
如果说标准化factor loading值过小,比如0.4,那么说明该项应该直接进行删除掉。
第3点:拟合指标不达标
如果研究目的是进行效度验证或者组合信度等,一般对于模型拟合指标的关注度较低,可直接忽略即可。
如果是使用验证性因子分析进行共同方差偏差CMV检查,那么其检查原理就是查看拟合指标不好,用于说明没有CMV问题;如果说使用验证性因子分析做权重计算时指标拟合不好,可考虑删除项,或者进行MI调整等。
特别提示: 在进行验证性因子分析之前,最好是先进行探索性因子分析,如果探索性因子分析已经发现问题,比如因子与项之间的对应关系有问题,那么数据继续进行验证性因子分析,一般都会有各种问题。
验证性因子分析的方法
背景:自制了一份问卷,如何验证问卷结构的有效性?该用什么方法?学生时代用万能的spss进行探索性因子分析?工作后又见识到了同事使用聚类分析的方法?有幸学习过几次结构方程模型,印象中通过结构方程模型进行验证性因子分析,方法简单又有效,但因为学艺不精,没法完整的述说出这个方法的好与不足,于是又看了遍侯杰泰的《结构方程模型及其应用》。将这段时间脑内的困惑作一个自我答疑,也期待通过这次整理,能对结构方程模型有一个深刻的印象,下次不至于再面对“我懂,但说不出”的尴尬窘境。
1.什么时候用探索性因子分析,什么时候用验证性因子分析?
当你有一个预设模型时(即你有一个假设:问卷中哪些题目属于哪个维度),可以直接用验证性因子分析,验证预设模型是否成立。当你没有预设模型时(即你不清楚问卷中哪些题目属于哪个维度)
2.探索性因子分析和验证性因子分析方法上的区别?
在做探索性因子分析的时候,第一个因子会捕获最大的变异量,从属它的题目通常也比较多。
有时候验证性因子分析能区分多个因子,即一个多因子模型拟合不错,但探索性因子分析只产生1个或2个主要因子而已。
3.结构方程模型具有哪些能力?
4.如何通过结构方程模型进行验证性因子分析?
在查看结果时,一般关注以下几个拟合指数:
•Χ2:minimum fit function Chi-square,主要用于比较多个模型,值越小,拟合越好
•df:degree of freedom,主要用于比较多个模型,自由度越大,模型越简单
•RMSEA:在0.08以下(越小越好)
•NNFI:在0.9以上(越大越好)
•CFI:在0.9以上(越大越好)
指标和因子关系的调整:
(1)Q4在因子A中的完全标准化负荷很小(LX=0.05),但它在其他因子中的修正指数也不高,显然这一题不从属A因子,但也不归属其他因子;
(2)Q8在因子B的负荷不高(0.28),但在因子A中的MI是41.4,显然它可能归属于因子A;
调整后,需要重新进行验证性因子分析,查看指标变化。
需要注意的是:如果仅仅看修正指数或因子负荷,但缺乏其他实质理论依据(如题目含义)的支持,随便将题目增删转移,并不合适。
验证性因子分析步骤(详细)
上一篇文章中,初步介绍了验证性因子分析的功能及应用场景。下面通过一个实例来具体了解一下,验证性因子分析的操作步骤以及过程中需要注意的内容。
当前有一份215份的研究量表数据,共由四个因子表示,第一个因子共5项,分别是A1~A5;第二项因子共5项,分别是B1~B5;第三个因子共4项,分别是C1~C4;第4个因子共6项,分别是D1~D6。现希望验证此量表的 聚合效度 和 区分效度 ,并且希望进行 共同方法偏差分析 。
验证性因子分析的步骤大致可分为四步,分别是:模型构建、删除不合理测量项、模型MI指标修正和模型分析。
(1)模型构建
即将因子与测量项对应关系放置规范;在进行CFA分析前一般需要进行EFA,清理掉对应关系出现严重偏差的测量项
(2)删除不合理测量项
如果因子与测量项间的对应关系出现严重偏差,此时可考虑删除某测量项;也或者某测量项与因子间的载荷系数值过低(比如小于0.5),说明该测量项与因子间关系较弱,需要删除掉该测量项
(3)模型MI指标修正
如果说模型拟合指标不佳,可考虑进行模型MI指标修正【SPSSAU默认提供MI大于20,MI大于10,MI大于5,和MI大于3共四种模型修正方式】
(4)最终模型分析
本例子中的量表共分为四个因子,暂不进行模型MI修正,放置如下:
SPSSAU共输出6个表格,各表格对应解释说明如下:
从上表可知,本次针对共4个因子,以及20个分析项进行验证性因子分析(CFA)分析。本次分析有效样本量为215,超出分析项数量的10倍,样本量适中。
CFA分析建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。
因子载荷系数表格展示 因子和测量项之间的关联关系 ,通常使用标准载荷系数值表示因子与分析项间的相关关系。分析时主要看标准载荷系数值和P值。
如果呈现出显著性,且标准载荷系数值大于0.70,则说明有着较强的相关关系。反之,如果没有呈现出显著性,也或者标准载荷系数值较低(比如低于0.4),则说明该分析项与因子间相关关系较弱。
上表格显示,B1与Factor2之间的因子载荷系数值为0.562 < 0.7,说明对应关系较弱,可考虑将此项从Factor2中移除出去。从整体上看,各个测量项全部均呈现出0.001水平的显著性(P< 0.001),而且标准化载荷系数值均大于0.7(除B1外),因而说明整体上看,因子与测量项之间有着良好的对应关系,聚合效度较好。
此表格主要查看指标的 聚合效度 和区分效度 情况,输出指标包括AVE和CR值。通常AVE值>0.5,CR值>0.7,说明数据聚合效度较好。
从上格可知:本研究涉及的4个因子(SPSSAU默认给定名字为Factor 1, Factor 2, Factor 3, Factor 4),它们的AVE值全部均大于0.5,而且CR值全部均大于0.7,因而说明本次测量量表数据具有优秀的聚合效度。
此表格展示 模型拟合指标 ,共分为常用指标和其它指标。表中提供各指标相应的建议判断标准,可直接对比判断标准值。一些其它指标通常使用较少,研究人员可结合实际情况进行选择。如果模型拟合不好需要,需要根据相关专业知识和模型修正指标对模型进行修正。
上表来看:卡方自由度值为3.389,大于3,而且GFI小于0.9,RMSEA为0.105接近于0.1这一标准,RMR值为0.091不在标准范围内。综合来看,模型构建欠佳,需要进行模型修正。比如这里将MI>10作为修正标准然后重新进行模型拟合,得到结果如下
上表格展示 因子与测量项的对应关系MI值 ,因子与其下属测量项的关系可通过因子载荷系数表格进行查看。MI值并不固定标准大小,一般情况下,该值如果大于20则说明关联性很强。
从上表格可以看到,C2与Factor2,Factor4这两个因子间的MI指标均大于15,说明C2与Factor2,Factor4之间可能有着较强的关联性;同时,D5与Factor3之间的MI值为18.121,说明二者有较强的关联性。
综合可知:可考虑将C2,D6这两个指标进行删除,同时上述因子载荷表格分析还发现B1也可以进行删除。因而将此三项进行删除后可再次进行模型(限于篇幅限制,SPSSAU并不继续进行分析)。
上表格展示因子与因子之间的关联性,可通过标准系数进行分析。从上表可知,在进行因子协方差表格分析时,本研究共4个因子,他们两两之间的标准系数值均介于0.6~0.85之间,说明因子之间具有较强的关联性。
聚合效度通常是针对 AVE,CR,因子载荷系数 这三个指标进行分析,并且均是在模型最终确认后的指标进行分析。
分析结果表明:本研究量表数据具有优秀的聚合效度
区分效度的测量是使用 AVE的平方根值 ,然后与4个因子的相关系数进行对比。
如果AVE平方根值大于“该因子与其它因子间的相关系数”,此时说明具有良好的区分效度。
区分效度首先需要进行相关分析(以及每个因子对应多项,需要使用‘生成变量’功能将其概括成一个整体后再进行两两相关分析)。如下:
常见的区分效度分析时,会将上表格中斜对角线的1,换成AVE值的平方根,然后再进行对比分析。最终如下表格式:
上图可知,因子1的AVE根号值为0.843,大于因子1与另外3个因子之间的相关系数值(最大为0.777);因子2的AVE根号值为0.84,大于因子2与另外3个因子之间的相关系数值(最大为0.753);类似地,因子3的AVE根号值,因子4的AVE根号值均大于它们与其它因子的相关系数值。因而说明研究量表数据的区分效度良好。
特别提示:
常见的区分效度分析是将AVE根号值与‘相关系数值’进行对比;有时候区分效度的验证方法为:“比较多个CFA模型进行分析说明”,建议研究人员以参考文献为准;
区分效度进行时,需要先进行相关分析,以及取AVE均方根,然后将手工表格合并处理好后进行分析说明。
共同方法偏差(CMV)常见有两种验证方式,一种是使用探索性因子分析EFA方法进行检验 (也称作Harman单因子检验方法),即查看把所有量表项进行探索性因子分析EFA时,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,通常以50%为界,此时可判定存在同源方差(共同方法偏差),反之说明没有共同方法偏差问题。
如果是使用CFA进行验证;则将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面,然后进行分析,如果测量出来显示模型的拟合指标,比如卡方自由度比,RMSEA,RMR,CFI等无法达标,则说明模型拟合不佳,即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好),因而说明数据通过共同方法偏差CMV检验,数据无共同方法偏差问题。
本次共有4个因子对应20个测量项,将此20个测量项全部放在一个因子里面进行CFA分析并且得到模型拟合指标,如下图:
上图显示卡方自由度值为11.137,明显高于标准(>3),并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7,明显偏差标准值(大于0.9),RMSEA和RMR值均大于0.15,也严重偏差标准值。其它指标比如AGFI,IFI,PGFI,PNFI等也均低于0.7,严重偏差大于0.9这一标准,因而说明模型拟合质量非常糟糕,也即说明不能本次研究量表数据无法聚焦成一个因子,即说明无共同方法偏差问题。
特别提示:
上述为两种常见的共同方法偏差验证方法,还有其它验证方法,建议研究人员以参考文献为准;
研究人员需要在事前注意共同方法偏差问题,而不能等到事后发现共同方法偏差才能处理。
登录 SPSSAU官网 体验在线数据分析
验证性因子分析的定义
在社会调查研究构成中,研究者首先开发调查问卷。对应于每一个研究者所感兴趣的理论变量,问卷中往往有多个问题。比如,研究者对顾客的忠诚度感兴趣,忠诚度可能用购买频率、主观评估、消费比例等多个问题来衡量。这个理论变量就是因子,这些个别问题是测度项。验证性因子分析就是要检验购买频率、主观评估、消费比例是否真的可以反映忠诚度。
与验证性因子分析相对的是探索性因子分析。在探索性因子分析中,比如,因为我们想让数据“自己说话”,我们即不知道测度项与因子之间的关系,也不知道因子的值,所以我们只好按一定的标准(比如一个因子的解释能力) 凑出一些因子来,再来求解测度项与因子关系。探索性因子分析的一个主要目的是为了得到因子的个数。
探索的因子分析有一些。第一,它假定。在实际研究中,我们往往会假定一个因子之间没有因果关系,所以可能不会影响另外一个因子的测度项。第二,探索性因子分析假定测度项残差之间是相互独立的。实际上,测度项的残差之间可以因为共同方法偏差、子因子等因素而相关。第三,探索性因子分析强制所有的因子为独立的。这虽然是求解因子个数时不得不采用的机宜之计,却与大部分的研究模型不符。最明显的是,自变量与因变量之间是应该相关的,而不是独立的。这些局限性就要求有一种更加灵活的建模方法,使研究者不但可以更细致地描述测度项与因子之间的关系,而且并对这个关系直接进行测试。而在探索性因子分析中,一个被测试的模型(比如正交的因子) 往往不是研究者理论中的确切的模型。
验证性因子分析 (confirmatory factor analysis) 的强项正是在于它允许研究者明确描述一个理论模型中的细节。那么一个研究者想描述什么呢?因为测量误差的存在,研究者需要使用多个测度项。当使用多个测度项之后,我们就有测度项的“质量”问题,即效度检验。而效度检验就是要看一个测度项是否与其所设计的因子有显著的载荷,并与其不相干的因子没有显著的载荷。当然,我们可能进一步检验一个测度项工具中是否存在共同方法偏差,一些测度项之间是否存在“子因子”。这些测试都要求研究者明确描述测度项、因子、残差之间的关系。对这种关系的描述又叫测度模型 (measurement model)。对测度模型的检验就是验证性测度模型。对测度模型的质量检验是假设检验之前的必要步骤。