什么是探索性因子分析法?
探索性因子分析法(Exploratory Factor Analysis, EFA)是一项用来找出多元观测变量的 本质结构、并进行处理降维的技术。因而,EFA能够将具有错综复杂关系的变量综合为少数几 个核心因子。
探索性因子分析法的起源
因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学 家 Charles Spearman 在 1904 年的时候 提出单一化的智能因子(A Single Intellectual Factor)。 随着试验的深入大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。 同时,人们认识到有必要考虑多元因子。20世纪30年代,瑞典心理学家Thurstone打破了流 行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。44444Thurstone在 他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑 基础。
[编辑]
探索性因子分析和验证性因子分析的异同[1]
探索性因子分析和验证性因子分析相同之处
两种因子分析都是以普通因子分析模型作为理论基础,其主要目的都是浓缩数据,通过对诸 多变量的相关性研究,可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的 主要信息。图1所示即为最简单、也最为常见的因子模型,每个观测变量(指标)只在一个因子(潜 变量)上负荷不为零,西湖美景作文X、X、X是潜变量&的指标,X、X是潜变量&的指标。
1 2 3 1 4 5 2
将图1所示的因子模型推广至一般意义上的因子模型后,各观测变量x_i与m个公共因子
%%,..,匕之间的关系可以用数学模型表示如下:
x —人 & + 星座配对查询表人 & + ... + 人 E + 8
1 11 1 12 2 1m m 1
x — A g + A g + ... + 人 & + 8 k k1 1 k2 2 km m k
其中:x为各观测变量;g是公共因子;8是x,的特殊因子,有时也称误差项,包括x的唯
i i i i i
一性因子和误差因子两部分;A是公共因子的负载;m是公共因子g,g,...,g的个数,k是各观测 什么前什么后ij 1 2 m
变量气,...,气的个数,m<k。上式也可以简单地用矩阵表示如下:x — Axg + 8
其中:
x = (x ,x,…,x )t , g = (g,g,...,g ),8 — (8 ,8 ,...,8 )t
12 k 12 m 12 k
探索性因子分析和验证性因子分析的差异之处
1.基本思想不同
因子分析的基本思想是要寻找公共因子,以达到降维的目的。探索性因子分析主要是为了找 出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相 对比较大的变量的内在结构。研究者的假定是每个指标变量都与某个因子匹配,而且只能通过因 子载荷凭知觉推断数据的因子结构。而验证性因子分析的主要目的是决定事前定义因子的模型拟 合实际数据的能力,以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预 期一致。指标变量是基于先验理论选出的,而因子分析是用
来看它们是否如预期的一样。其先验 假设是每个因子都与一个具体的指示变量子集对应,并且至少要求预先假设模型中因子的数目, 但有时也预期哪些变量依赖哪个因子。
2.应用前提不同
探索性因子分析没有先验信息,而验证性因子分析有先验信息。探索性因子分析是在事先不 知道影响因子的基础上,完全依据样本数据,利用统计软件以一定的原则进行因子分析,最后得 出因子的过程。
在进行探索性因子分析之前,不必知道要用几个因子,以及各因子和观测变量之间的关系。 在进行探索性因子分析时,由于没有先验理论,只能通过因子载荷凭知觉推断数据的因子结构。 上述数学模型中的公共因子数m在分析前并未确定,而是在分析过程中视中间结果而决定,各 个公共因子g统一地规定为均影响每个观测变量气。在管理研究中,如仅仅从数据出发,很难得 到科学的结果,甚至可能与已有的理论或经验相悖。因此,探索性因子分析更适合于在没有理论 支持的情况下对数据的试探性分析。这就需要用验证性因子分析来做进一步检验。而验证性因子 分析则是基于预先建立的理论,要求事先假设因子结构,其先验假设是每个因子都与一个具体的 指示变量子集对应,以检验这种结构是否与观
测数据一致。也就是在上述数学模型中,首先要根 据先验信息判定公共因子数m,同时还要根据实际情况将模型中某些参数设定为某一定值。这 样,验证性因子分析也就充分利用了先验信息,在已知因子的情况下检验所搜集的数据资料是否 按事先预定的结构方式产生作用。
3.理论假设不同
探索性因子分析的假设主要包括:①所有的公共因子都相关(或都不相关);②所有的公共因 子都直接影响所有的观测变量;③特殊(唯一性)因子之间相互独立;④所有观测变量只受一个 特殊(唯一性)因子的影响;⑤公共因子与特殊因子(唯一性)相互独立。验证性因子分析克服了探 索性因子分析假设条件约束太强的缺陷,其假设主要包括:① 公共因子之间可以相关,也可以 无关;②观测变量可以只受一个或几个公共因子的影响,而不必受所有公共因子的影响;③特 殊因子之间可以相关,还可以出现不存在误差因素的观测变量;④公共因子与特殊因子之间相 互独立。
4.分析步骤不同
探索性因子分析主要有以下七个步骤:①收集观测变量:通常采用抽样的方法,按照实际 情况收集观测变量数据。②构造相关矩阵:根据相关矩阵可以确定是否适合进行因子分析。③ 确定因子个数:可根据实际情况事先假定因子个数也可以按照特征根大于1的准则或碎石准则 来确定因子个数。④ 提取因子:可以根据需要选择合适的因子提取方法,如主成分方法、加权 最小平方法、极大似然法等。⑤ 因子旋转:由于初始因子综合性太强,难以找出实际意义,因 此一般都需要对因子进行旋转(常用的旋转方法有正交旋转、斜交旋转等),以便于对因子结构进 行合理解释。⑥解释因子结构:可以根据实际情况及负载大小对因子进行具体解释。⑦计算因子 得分:可以利用公共因子来做进一步的研究,如聚类分析、评价等。
而验证性因子分析主要有以下六个步骤:① 定义因子模型:包括选择因子个数和定义因子 载荷。因子载荷可以事先定为0、或者其它自由变化的常数,或者在一定的约束条件下变化的数 (比如与另一载荷相等)。②收集观测值:根据研究目的收集观测值。③获得相关系数矩阵:根 据原始资料数据获得变量协方差阵。④拟合模型:这里需要选择一种方法(如极大似然估计、渐 进分布自由估计等)来估计自由变化的因子载荷。⑤评价模型:当因子模型能够拟合数据时,因 子载荷的选择要使模型暗含的相关矩阵与实际观测矩阵之间的差异
最小。常用的统计参数有:卡 方拟合指数(粉、比较拟合指数(CFI)、拟合优度指数(GFI)和估计误差均方根(RMSEA)。根据 Bentler(1990)的建议标准,X2/DF<3.0> CFI20.90、GFI20.85、RMSE<0.05,则表明该模型的拟 合程度是可接受的。⑥修正模型:如果模型拟合效果不佳,应根据理论分析修正或重新限定约束 关系,对模型进行修正,以得到最优模型。
5.主要应用范围不同
探索性因子分析主要应用于三个方面:①寻求基本结构,解决多元统计分析中的变量间强相 关问题;② 数据化简;③发展测量量表。验证性因子分析允许研究者将观察变量依据理论或先 前假设构成测量模式,然后评价此因子结构和该理论界定的样本资料间符合的程度。因此,主要 应用于以下三个方面:①验证量表的维度或面向性(dimensionality),或者称因子结构,决定最 有效因子结构;②验证因子的阶层关系;③评估量表的信度和效度
6.探索性因子分析和验证性因子分析的正确用法
从上述分析可以看出,探索性因子分析和验证性因子分析是因子分析的两个不可分割的重
要组成部分,在管理研究的实际应用中,两者不能截然分开,只有结合运用,才能相得益彰,使 研究更有深度。An-derson,J. C.,Gerbin,D. W建议,在发展理论的过程中,首先应通过 探索性因子分析建立模型,再用验证提供了发析现模型以验证和修正的概念和计算工具,其提供 的结果为验证性因子分析建立假设提供了重要的基础和保证。两种因子分析缺少任何一个,因子 分析都将是不完整的。一般来说,如果研究者没有坚实的理论基础支撑,有关观测变量内部结 构一般先用探索性因子分析,产生一个关于内部结构的理论,再在此基础上用验证性因子分析, 这样的做法是比较科学的,但这必须要用两组分开的数据来做。如果研究者直接把探索性因子分 析的结果放到统一数据的验证性因子分析中,研究者就仅仅是拟合数据,而不是检验理论结构。 如果样本容量足够大的话,可以将数据样本随机分成两半,合理的做法就是先用一半数据做探索 性因子分析,然后把分析取得的因子用在剩下的一半数据中做验证性因子分析。如果验证性因子 分析的拟合效果非常差,那么还必须用探索性因子分析来找出数据与模型之间的不一致。
探索性因子分析法的计算
在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行 数据分析。
探索性因子分析法的运用幽闭恐惧症的症状
1、 顾客满意度调查
2、 服务质量调查
3、 个性测试
4、形象调查
5、 市场划分识别
6、 顾客、产品及行为分类。
探索性因子分析法的步骤
一个典型的EFA流程如下:
1、 辨认、收集观测变量。
2、 获得协方差矩阵(或Bravais-Pearson的相似系数矩阵
3、 验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett球型测验、反图 像协方差矩阵、KMO测度
4、 选择提取因子法(主成分分析法、主因子分析法)。
5、 发现因素和因素装货。因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表 里)溃疡的原因。
6、 确定提取因子的个数(以Kair准则和Scree测试作为提取因子数目的准则)。
等级观念7、 解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。
探索性因子分析法的优点
1、 EFA法便于操作。
2、 当调查问卷含有很多问题时,EFA法显得非常有用。
3、 EFA法既是其他因子分析工具的基础(如计算因子得分的回归分析),也方便与其他工 具结合使用(如验证性因子分析法)。
探索性因子分析法的缺点
1、 变量必须有区间尺度。
2、 沉降数值至少要要变量总量的3倍。
探索性因子分析法的假定
对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等情 况。
EFA在教育、心理领域存在的问题及建议
1.样本容量、观测变量数目不够
很多应用探索性因子分析的研究中,普遍存在的一个问题就是样本容量及观测变量数目太
小。探索性因子分析中,一般要求样本容量至少为100-200,当变量的公共方差较大时,则一定数目 的小样本也能确保因子负载的稳定性。国内学者曾做过一项调查,结果表明:1991-2000年国内两 种心理学期刊发表的运用因子分析的文章中,有近迎宾松10%的文章研究样本小于100,甚至有多达 50%的文章没有提供这一信息。而对于观测变量的数目,一般认为,观测变量与所提取的因子数目 之比至少为4。很多研究者认为观测变量的数目并不与被提取的因子数目相关联,因为研究者事 先并不知道会有多少个因子被提取出来,因此,无法依据被提取的因子个数对观测变量的数目进行 安排,但是,实际上很多研究者在因子分析前对所探讨的观测变量的因子结构已有了一定的预期。 教育、心理领域中,存在着相当数量的研究并未达到这些标准。这或许是由于研究者对因子分析 的要旨理解不深,但更有可能的是研究者对这类方法的细节重视不够。