什么是探索性因子分析法?
探索性因子分析法( Exploratory Factor Analysis , EFA)是一项用来找出多元观测变量的 本质结构、并进行处理降维的技术。 因而, EFA能够将具有错综复杂关系的变量综合为少数几
个核心因子。
探索性因子分析法的起源
因子分析法 是两种分析形式的统一体, 即验证性分析和纯粹的探索性分析。 英国的 心理学 家 Charles Spearman在 1904 年的时候, 提出 单一化的智能因子 (A Single Intellectual Factor ) 随着试验的深入,大量个体样本被分析研究, Spearman 的单一智能因子理论被证明是不充分的。 同时,人们认识到有必要考虑多元因子。 20 世纪 30 年代,瑞典心理学家 Thurstone 打破了流 行的单因理论假设,大胆提出了 多元因子分析 ( Multiple Factor Analysis )理论。 Thurstone 在他的《心智向量》( Vectors of Mind , 1935 )一书中,阐述了多元因子分析理论的数学和逻 辑基础。
[ 编辑 ] 探索性因子分析和验证性因子分析的异同 [1]
探索性因子分析和验证性因子分析相同之处
两种 因子分析 都是以普通因子分析模型作为理论基础, 其主要目的都是浓缩数据, 通过对诸 多变量的相关性研究,可以用假想的少数几个变量 ( 因子、潜变量 ) 来表示原来变量 ( 观测变量 ) 的主要信息。 图 1所示即为最简单、 也最为常见的因子模型, 每个观测变量 (指标 )只在一个因子 ( 潜变量 ) 上负荷不为零, x1、x2 中华成语典故、 x3是潜变量 ξ1的指标, x4、x5 马复兴是潜变量 ξ 2的指标。
将图 1 所示的因子模型推广至一般意义上的因子模型后,各观测变量
x_i 諲与 m个公共因子
ξ1, ξ 2,...,
ξ m 之间的关系可以用
数学模型 表示如下:
x 1 = λ 11 ξ 1 + λ 12 ξ 2 + ... +
λ 1mξ m + δ 1
xk
λ k1ξ 1 + λ k2ξ 2 +
λ kmξ m +
δk
其中: 的唯一性因子和误差因子两部分; k 是各观测变量 x1,..., xk 的个数,
xi 为各观测变量;ξ
δ i 是 xi ,的特殊因子,有时也称误差项,包括 xi
ξ1, ξ2,..., ξ m的个数,
x = Λ x ξ + δ
i 是公共因子;
ij 是公共因子的负载; m是公共因子
m<k。上式也可以简单地用矩阵表示如下:
x = ( x1, x2,..., | xk)T , | ξ = ( ξ 1 |
| | | |
| | |
| | | |
| | | |
其中:
,是负载矩阵
, ξ 2 ,..., ξ m) ,δ = ( δ 1与看有关的词语, δ 2,...,
δ k) 淮南子人间训T
探索性因子分析和验证性因子分析的差异之处
吃药能喝茶吗
1.基本思想不同
因子分析的基本思想是要寻找公共因子, 以达到降维的目的。 探索性因子分析主要是为了找 出影响观测变量的因子个数, 以及各个因子和各个观测变量之间的相关程度, 以试图揭示一套相 对比较大的变量的内在结构。 研究者的假定是每个指标变量都与某个因子匹配, 而且只能通过因 子载荷凭知觉推断数据的因子结构。 而验证性因子分析的主要目的是决定事前定义因子的模型拟 合实际数据的能力, 以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预 期一致。 指标变量是基于先验理论选出的, 而因子分析是用来看它们是否如预期的一样。 其先验 假设是每个因子都与一个具体的指示变量子集对应,并且至少要求预先假设模型中因子的数目, 但有时也预期哪些变量依赖哪个因子。
2.应用前提不同
探索性因子分析没有先验信息, 而验证性因子分析有先验信息。 探索性因子分析是在事先
不 知道影响因子的基础上, 完全依据样本数据, 利用统计软件以一定的原则进行因子分析, 最后得 出因子的过程。
在进行探索性因子分析之前,不必知道要用几个因子,以及各因子和观测变量之间的关系。 在进行探索性因子分析时,由于没有先验理论,只能通过因子载荷凭知觉推断数据的因子结构。 上述数学模型中的公共因子数 m 在分析前并未确定,而是在分析过程中视中间结果而决定,各
个公共因子 ξi 统一地规定为均影响每个观测变量 xi。在管理研究中,如仅仅从数据出发,很难
得到科学的结果, 甚至可能与已有的理论或经验相悖。 因此, 探索性因子分析更适合于在没有理 论支持的情况下对数据的试探性分析。 这就需要用验证性因子分析来做进一步检验。 而验证性因 子分析则是基于预先建立的理论, 要求事先假设因子结构, 其先验假设是每个因子都与一个具体 的指示变量子集对应, 以检验这种结构是否与观测数据一致。 也就是在上述数学模型中, 首先要 根据先验信息判定公共因子数 m,同时还要根据实际情况将模型中某些参数设定为某一定值。这
样,验证性因子分析也就充分利用了先验信息, 在已知因子的情况下检验所搜集的数据资料是否 按事先预定的结构方式产生作用。
3.苹果6怎么开机理论假设不同
探索性因子分析的假设主要包括: ①所有的公共因子都相关 ( 或都不相关 ) ;②所有的公共因 子都直接影响所有的观测变量; ③ 特殊(唯一性 )因子之间相互独立; ④ 所有观测变量只受一个 特殊(唯一性)因子的影响;⑤ 公共因子与特殊因子 (唯一性 )相互独立。验证性因子分析克服了 探索性因子分析假设条件约束太强的缺陷,其假设主要包括:① 公共因子之间可以相关,也可
以无关;② 观测变量可以只受一个或几个公共因子的影响,而不必受所有公共因子的影响;③ 特殊因子之间可以相关,还可以出现不存在误差因素的观测变量;④ 公共因子与特殊因子之间 相互独立。
4.分析步骤不同
探索性因子分析主要有以下七个步骤:① 收集观测变量:通常采用抽样的方法,按照实际
情况收集观测变量数据。② 构造相关 矩阵 :根据相关矩阵可以确定是否适合进行因子分析。③ 确定因子个数: 可根据实际情况事先假定因子个数, 也可以按照特征根大于 1 的准则或碎石准则 来确定因子个数。④ 提取因子:可以根据需要选择合适的因子提取方法,如主成分方法、加权 最小平方法、极大似然法等。⑤ 因子旋转:由于初始因子综合性太强,难以找出实际意义,因 此一般都需要对因子进行旋转 ( 常用的旋转方法有正交旋转、 斜交旋转等 ) ,以便于对因子结构进 行合理解释。
⑦计算因子得分: 可以利
⑥解释因子结构: 可以根据实际情况及负载大小对因子进行具体解释。 用公共因子来做进一步的研究,如 聚类分析 、评价等。而验证性因子分析主要有以下六个步骤:① 定义因子模型:包括选择因子个数和定义因子 载荷。因子载荷可以事先定为 0、或者其它自由变化的常数,或者在一定的约束条件下变化的数
( 比如与另一载荷相等 ) 。② 收集观测值:根据研究目的收集观测值。③获得相关系数矩阵:根 据原始资料数据获得变量协方差阵。 ④ 拟合模型: 这里需要选择一种方法 ( 钱用英语如极
大似然估计、 渐 进分布自由估计等 ) 来估计自由变化的因子载荷。 ⑤ 评价模型: 当因子模型能够拟合数据时, 因 子载荷的选择要使模型暗含的相关矩阵与实际观测矩阵之间的差异最小。 常用的统计参数有: 卡 方拟合指数 (x2) 、比较拟合指数 (CFI) 、拟合优度指数 (GFI) 和估计误差均方根 (RMSEA)。根据 Bentler(1990) 的建议标准, x2/DF≤3.0、CFI≥0.90 、GFI≥0.85 、 RMSE≤0.05 ,则表明该模型 的拟合程度是可接受的。 ⑥修正模型: 如果模型拟合效果不佳, 应根据理论分析修正或重新限定 约束关系,对模型进行修正,以得到最优模型。
5.主要应用范围不同
探索性因子分析主要应用于三个方面: ①寻求基本结构, 解决多元统计分析中的变量间强相 关问题;② 数据化简;③发展测量量表。验证性因子分析允许研究者将观察变量依据理论或先 前假设构成测量模式, 然后评价此因子结构和该理论界定的样本资料间符合的程度。 因此, 主要 应用于以下三个方面:① 验证量表的维度或面向性 (dimensionality) ,或者称因子结构,决定 最有效因子结构;② 验证因子的阶层关系;③ 评估量表的 信度 和效度 。
6.探索性因子分析和验证性因子分析的正确用法 从上述分析可以看出,探索性因子分析和验证性 因子分析是因子分析的两个不可分割的重 要组成部分,在管理研究的实际应用中,两者不能截然分开,只有结合运用,才能相得益彰,使 研究更有深度。 An-derson ,J.C.,Gerbin ,D.W 建议,在发展理论的过程中,首先应通过探 索性因子分析建立模型, 再用验证提供了发析现模型以验证和修正的概念和计算工具, 其提供的 结果为验证性因子分析建立假设提供了重要的基础和保证。 两种因子分析缺少任何一个, 因子分 析都将是不完整的 。一般来说,如果研究者没有坚实的理论基础支撑,有关观测变量内部结构 一般先用探索性因子分析, 产生一个关于内部结构的理论, 再在此基础上用验证性因子分析, 这 样的做法是比较科学的, 但这必须要用两组分开的数据来做。 如果研究者直接把探索性因子分析 的结果放到统一数据的验证性因子分析中, 研究者就仅仅是拟合数据, 而不是检验理论结构。 如 果样本容量足够大的话, 可以将数据样本随机分成两半, 合理的做法就是先用一半数据做探索性 因子分析, 然后把分析取得的因子用在剩下的一半数据中做验证性因子分析。 如果验证性因子分 析的拟合效果非常差,那么还必须用探索性因子分析来找出数据与模型之间的不一致。
探索性因子分析法的计算
在运用 EFA法的时候,可以借助统计软件(如 SPSS统计软件 或 SAS 统计软件 )来进行 数据