-
-
-.
一、灰色关联分析
灰色关联分析是系统态势的一种量化比拟分析,其实质就是比拟假设
干数列所构成的曲线到理想数列所构成的曲线几何形状的接近程度,几何
形状越接近,其关联度就越大。可见,灰色关联分析是一种趋势分析,它
对样本的大小没有太高的要求,一般情况下比拟适合小样本,贫信息的数
据,并且样本数据不需要典型的分布规律,因而,具有广泛的适用性。
灰色关联分析模型的建立:
(1)确定比拟数列与参考数列;
设Xi={xi(1),xi〔2〕,…xi(n)}为创业板上市公司的财务指标形成的比
拟数据列,其中,i=1,2…17.同时,把每项指标中的最优值作为最优指标集
X0,可得到参考数列:X
0
={x
0
(1),x
0
(2),…x
0
(n)}
(2)无量纲化处理;无量纲化的处理方法通常有初值化、均值化、规化
三种方法,而本文采用的是不同指标的标准化处理方法,如前文所示。
(3)各个指标权重确实定w
〔k〕
;
(4)计算关联系数δ
i(k)
;
(5)计算关联度r
i
设参考数列为:X
0
={x
0
(1),x
0
(2),…x
0
(n)},关联分析中被比拟数列记为
X
i
={x
i
(1),x
i
〔2〕,…x
i
(n)},i=1,2,…28;n=1,2,3…12.
对于一个参考数列X
0
,比拟数列Xi,可用下述关系表示各比拟曲线与
参考曲线在各点的差:
|(k)x-(k)x|ρmaxmax|(k)x-(k)x|
|(k)x-(k)x|maxmaxρ|(k)x-(k)x|minmin
(k)δ
ioio
ioio
i
-
-
-.
式中,δi(k)是第k个时刻比拟曲线x
i
与参考曲线x
o
的相对差值,这种
形式的相对差值称为x
i
对x
0
在k时刻的关联系数。ρ为分辨系数,ρ∈(0,1),
引入它是为了减少极值对计算的影响。在实际计算使用时,一般取ρ=0.5.
假设记:Δmin=minmin|x
o
(k)-x
i
(k)|,Δmax=maxmax|x
o
(k)-x
i
(k)|,那么Δ
min与Δmax分别为各时刻x
o
与x
i
的最小绝对差值与最大绝对差值,从而有
ρΔmax|x-x|
ρΔmaxΔmin
δ
i(k)0(k)
)ki(
根据关联系数计算关联度,得到灰色关联模型为:
r
i
=
n
1i
)(*)(kwki
二、层次分析法构建经营绩效评价模型
层次分析法(AnalyticHierarchyProcess简称AHP)是美国运筹学家匹茨堡大学
教授Saaty于二十世纪70年代初期提出的。层次分析法〔AHP〕,它是系统工程
中对非定量事件作定量分析的一种简便方法,也是人们对主观判断进展客观描述
的一种有效方法。它将复杂问题分解成假设干个层次,逐步进展分析。这种做法,
首先要求把问题层次化,根据问题的性质和要得到的目标,将问题分解为不同的
组合因素,并将问题按不同的层次聚集组合,形成一个多层次的分析构造模型。
通过两两比拟的方法,确定层次中诸因素的相对重要性,然后组合人们的判断以
决定诸因素相对于总目标的相对重要性数值或相对优劣次序的排序。
层次分析法的核心思想可以归纳为“先分解后综合〞,应用层次分析法进展
上市公司经营绩效评价进,应包括如下根本步骤[27]:
〔1〕建立层次构造
应用层次分析法进展综合经营绩效评价时,首先建立评价问题的层次构造
(Hierarchy)。层次构造是应用层次分析法把复杂问题分解简化的关键,必须建立
在对决策问题深刻分析和对决策目标以及决策主体意图的充分理解之上。层次构
造的建立过程是首先确定决策目标,其次罗列出与该目标相关的各种因素,然后
-
-
-.
分析这些因素问的逻辑关系,最后绘制决策的层次构造图,简单的层次构造如图
4.1所示:
图4.1简单的层次构造图
这种层次构造分为目标层、准那么层和方案层,其中准那么层根据问题的复
杂程度又可以由多层构成。层次分析法的最终目标G是考虑所有相关因素,对
各方案综合评判比拟并选择最优方案。各方案对于总目标G的优越性评分,称
为方案的综合权重。求综合权重前,必须求解层次构造中的局部权重。局部权重
分为两类,一类是同层因素对于上一层父因素的相对重要性,称为因素权重,例
如上图中因素
1
A,
2
A,…,
n
A相对G的重要性;另一类是各方案就某因素而言的相
对优越性,称为方案权重,例如方案
1
B,
2
B,…,
n
B就因素
1
A的相对优越性。
权重反映了多个比拟变量间的相对重要性关系,采用归一化的向量来表示。权重
的大小反映了该比拟量相对其它比拟量重要性的上下。
〔2〕构造判断矩阵
建立递阶层次构造以后,就可以采用层次分析法中的相对评价方法对方案进
展两两比拟。长期的心理学研究说明,决策者对事物两两比拟的判断要比对多个
事物同时比拟的判断容易和准确得多。因此,层次分析法在确定权重时一般都采
用两两比拟的方式。假设有n个比拟量,那么让每一个量与其他量分别进展共
n-1次两两比拟,第i个量与第j个量的比拟结果记为
ij
a,再加上与自身的比拟
结果,可以形成一个nn的矩阵,称为判断矩阵。该矩阵中蕴含了比拟量之间的
权重关系,通过一些权重求解算法可求出权重向量。因此,要得到层次构造中的
局部权重,就必须首先逐层建立判断矩阵,对应方案权重的判断矩阵称为方案判
断矩阵,它是关于某个因素对各方案进展两两比拟而形成的。对应因素权重的判
断矩阵称为因素判断矩阵。例如要得到图4.2.1中因素
1
A,
2
A,…,
n
A相对G的因
素权重,就需要将
1
A,
2
A,…,
n
A对G的重要性进展两两比拟,比拟结果可以形成
一个nn的判断矩阵,再通过计算求得这n个因素相对于G的权重。
准那么层
i
A对目标层G的判断矩阵可以表示为表4.2。
-
-
-.
表4.2准那么层判断矩阵
1
A
2
A
…j
A
…n
A
1
A
11
A
12
A
…1j
A
…1n
A
2
A
21
A
22
A
…2j
A
…2n
A
…………………
i
A
1i
A
2i
A
…ij
A
…in
A
…………………
n
A
1n
A
2n
A
…nj
A
…nn
A
形成判断矩阵的过程也是数据标量化(或测度)的过程。标量化是指通过一定
的标度体系,将各种原始数据转换为可直接比拟的规化格式的过程。在决策表中
的数据还无法直接比拟,表中的定性描述必须通过标量化手段转换为规化的定量
数据;表中的定量数据虽己量化,但其量纲和数量级还不统一,仍需规化后才能
比拟。定量数据既可采用直接相比的方法进展处理,也可以让专家进展两两比拟
得到定性评价后按定性数据处理。定性数据可用点值打分来表示。决策者在用层
次分析法对各种因素进展测度过程中,提出了一系列标度。在传统的层次分析法
中,决策者通常都会选择正互反性1-9标度判断矩阵作为标量化方法[49]。正互反
性1-9标度打分规那么如表4.3所示:
表4.3层次分析法1-9标度打分规那么
等级等级定义1-9标度
1前者与后者具有同等重要性1
ij
a
2前者比后者稍微重要3
ij
a
3前者比后者明显重要5
ij
a
4前者比后者强烈重要7
ij
a
5前者比后者极端重要9
ij
a
注释
ij
a的取值也可以取上述各数的中值2,4,6,8及其倒数。
采用1-9标度的判断矩阵具有以下性质:
①当i=j时,1
ij
a;
②当i≠j时,1/
jiij
aa;
③当i,j=1,2,3…n时,
ij
a
>0。
判断矩阵具有的这一性质,对一个n个元素的判断矩阵仅需给出其上三角或
下三角的n(n-1)/2个判断就可以了。当判断矩阵具有传递性,即满足等
式:
ijjkik
aaa时,称判断矩阵A为一致性矩阵。如果成比照拟阵A不是一致性
矩阵时,但在不一致的围以,Saaty等人建议用对应于A最大特征根〔记作
max
〕
的特征向量〔归一化〕作为权向量w。
〔3〕计算权向量
-
-
-.
正反矩阵A的最大特征根
max
是正单根,对应正特征向量w,且:
(4.25)
其中:
(1,1,,1)TTe
可以通过Matlab软件中的eig命令求解特征向量和特征根。
也可以采用幂乘法、根法、和法等求解正互反判断矩阵的最大特征根和特征
向量的近似值。
〔4〕判断矩阵一致性检验
在计算单准那么下排序向量时,还需要进展一致性检验。因为在构造判断矩
阵时并不要求判断具有一致性的要求,但是判断矩阵既然是计算排序权向量的根
据,那么要求判断矩阵有大体上的一致性。从层析分析法的原理可知,如果A
矩阵具有唯一的特征值n,那么称所构造的矩阵具有完全一致性,但在判断
矩阵的构造中,并不严格要求判断具有传递性和一致性。在实际情况下,直观的
两两比拟和判断会有计算误差,这必然导致A矩阵不具备完全一致性。当判断
矩阵偏离一致性过大时,这种近似估计的可靠程度也就值得疑心了。因此需要对
判断矩阵的一致性进展检验。步骤如下:
①计算一致性的指标CI(ConsistencyIndex)
max
1
n
CI
n
(4.26)
其中,
max
是A的最大特征根,n为矩阵的阶数。
②依据表4.4查找相应的平均一致性指标RI(RandomIndex)
表4.4RI取值规那么
N3456789
RI0.580.91.121.241.321.411.45
③计算一致性比例CR(ConsistencyRatio)
CI
CR
RI
(4.27)
当CR<0.1时,认为判断矩阵的一致性是可以承受的。当CR>0.1时,
应该对判断矩阵作适当修正。对于一阶、二阶矩阵总是一致的,此时CR=O。
〔5〕计算组合权向量
组合权向量就是计算各层元素对目标层的合成权重。
经计算可得第2层对第1层的权向量,设为:
lim
k
Tk
x
Ae
w
eAe
-
-
-.
(2)(2)(2)
1
(,,)T
n
(4.28)
第3层对第2层各元素的权向量为:
(3)(3)(3)
1
(,,),1,2,,T
kkkm
kn
(4.29)
以3
k
为列向量,构造矩阵:
(4.30)
那么第三层对第一层的组合权向量为:
(3)(3)(2)W(4.31)
同理,第
s
层对第一层的组合权向量为:
()()(1)(3)(2)kssWWW
(4.32)
〔6〕整体一致性检验
在应用层次分析法作重大决策时,除了对每个判断矩阵进展一致性检验外,
还常需要进展组合一致性检验,以确定组合权向量是否可以作为最终的决策依
据。
组合一致性检验可逐层进展,假设第
p
层的一致性指标为()()
1
,pp
n
CICI〔n为
第1p层因素的数目〕,随机一致性指标为()()
1
,,pp
n
RIRI,那么:
()()()(1)
1
,,pppp
n
CICICI
(4.33)
()()()(1)
1
,,pppp
n
RIRIRI
(4.34)
可计算第p层的一致性比率为:
()
()
()
p
p
p
CI
CR
RI
,
3,4,,ps
(4.35)
如果()0.1pCR,那么第p层通过一致性检验。
最下层〔第s层〕对第1层的组合一致性比率为:
*()
2
s
p
p
CRCR
(4.36)
仅当*CR适当小时,才认为整个层次的判断通过一致性检验。
(3)(3)(3)
1
...
n
W
-
-
-.
三、熵权法进展综合经营绩效果评价的理论根底
熵最早是热力学中的一个重要概念,热力学第二定律说明,热现象有关的宏
观过程是不可逆的,热量总是从高温物体自动传递到低温物体。德国物理学家克
劳修斯〔us〕用entropy〔译为“熵〞〕来表示这种说明初始状态和终止
状态的变量,即熵等于工作物质吸收的热量Q与当时绝对温度T之比,熵仅与
研究对象的初始状态和终止状态有关,而与其经历的热力学过程无关。进一步研
究说明,系统状态一旦确定,其熵值就保持不变,在可逆过程中熵不变,
TQ/=0;系统部一切不可逆过程总是自发的向熵值增加的方向进展。
统计物理学用熵来度量系统的无序性的大小,系统的熵值为:
PkSln(4.1)
式中,k为玻尔兹曼常数;P为系统的状态发生的概率,又叫热力学概率。
在非平衡条件下,热力学系统中各微观状态出现的概率不相等,构成分布函数f,
那么系统的熵值为:
ffkSln(4.2)
式中,和号∑普及系统分布函数f的所有可能,当自变量连续时,和号变成
积分。
该式将熵与微观状态数目联系起来,对熵做出了微观解释,提醒了熵在不可
逆过程中增加的特性与本质。微观状态数目越多,其宏观系统的熵越大,系统越
混乱,熵是系统无序度和混乱度的度量。系统总是自动从有序到无序,熵值增加。
随着熵理论研究的不断扩展,熵应用到信息论。1948年,维纳〔Wiener〕和
申农(Shannon)提出了信息论,申农把通过过程息源的信号的不确定性称为信息
熵,把消除了多少不确定性称为信息[21]。
一条信息的信息量大小和它的不确定性有直接的关系。一个系统的有序程度
越高,那么熵就越小,信息量就越大;反之,无序程度越高,熵越大,信息量越
小。所以,从这个角度,我们可以认为,信息量的度量就等于被消除的不确定性
的多少,而随机事件不确定性的大小可以用概率分布函数来表示。信息不确定性
的度量,香农用“信息熵〞(Entropy)或叫Shannon熵来界定,一般用符号H表
示[20]。基于一个随机实验,假设有n种可能的〔独立的〕结局,各个结局可能出
现的概率分别为
n
ppp
21
,,它们满足以下条件:
1,2,1,10ii
pnip且(4.3)
那么用:
iinn
ppkpppHHln,
21(4.4)
表示概率集
n
ppp
21
,的熵,即实验结果的不确定程度,常数k取决于对
-
-
-.
数系统的底,这里为nln/1。
信息量的单位根据对数底的不同而不同,见表4.1。
表4.1信息量的单位表
对数的底2e103
信息量的单位Bit(比特)Nat(奈特)Hartley(哈特莱)Tet(铁特)
进制名称二进制单位自然单位十进制单位三进制单位
在随机实验的可能结局的发生概率分配中,如果任意一个发生概率为1,其
他结局均为0,那么该事件为确定事件,不存在不确定性。假设各个结局出现的
概率相等时,那么此时H值到达最大:
nkH
n
ln
max
(4.5)
当随机变量为连续型时,信息熵可以表示如下:
(4.6)
其中:H(x)为连续随机事件结局的不确定性。
f(x)为随机事件的概率密度函数。
信息熵有如下性质:
〔1〕仅当),,2,1(njp
j
之中的一个等于1时,即随机事件为确定事件
时,熵H=0,其他情况下,熵H>0。
〔2〕对于给定n,当所有的),,2,1(njp
j
都相等时,即np
j
/1时,熵
H最大,其值为nkln
〔3〕设X,Y为两个分别对应不同后果状态的风险行为,那么其联合风险
行为的不确定性小于等于二者单独的不确定性大小的和。即:
YHXHYXH,
(4.7)
当且仅当风险行为X和Y相互独立时,等号成立。
〔4〕对于概率
n
ppp
21
,的任何趋于相等化或均匀化的变化都使熵的值
增大。
在多目标决策中,经常需要考虑不同指标的相对重要程度,给不同指标赋予
不同的权重〔系数〕,而用熵来提醒所获取的数据所提供的有用决策信息的多少
与质量,用熵权作为指标的权重是一种行之有效的方法[44][48]。
假设一个评估问题,有m个评估指标,n个评估对象,按照定性与定量相结
合的原那么,取得n个对象对m个指标的评价矩阵R
mnmm
n
n
rrr
rrr
rrr
R
21
22221
11211
()ln()
R
Hxkfxfxdx
-
-
-.
(4.8)
对R
做标准化处理〔以收益性指标为例〕,得到:
(4.9)
其中:
(4.10)
对于m个评价指标,n个评价方案的评估问题中,第i个指标的熵为:
(mi,,2,1)
(4.11)
式中:
(4.12)
(4.13)
并假定,0
ij
f时,0ln
ijij
ff
那么,第i个指标的熵权为:
(4.14)
熵权有如下性质[20]:
〔1〕各被评价对象在指标i上的值完全一样,熵值到达最大值1,熵权为零。
该指标向决策未提供任何有用信息,该指标可以取消。
min
maxmin
ijij
ij
ijij
rr
r
rr
n
i
ij
ij
ij
r
r
f
1
n
k
ln
1
m
i
i
i
i
Hm
H
1
1
nm
ij
rR
ij
n
j
iji
ffkHln
1
-
-
-.
〔2〕当各被评价对象在指标i上的值相差较大、熵值较小、熵权较大时,
说明该指标为决策提供了有用信息,说明在该问题中,各对象在该指标上有明显
差异,应重点分析。
〔3〕指标的熵越大,其熵权越小,该指标越不重要,并且满足:
10
i
和
1
1
n
i
i
〔4〕作为权数的熵权,说明给定被评价对象集和各评价指标值确定的情况
下,各指标在竞争意义上的相对剧烈程度。
〔5〕从信息角度看,熵权代表该指标在该问题中,提供有用信息量的多寡
程度。
〔6〕熵权的大小与被评价对象有直接关系。
1.2基于熵权的经营绩效评价模型的建立
上市公司经营绩效的综合评价是以公司公开披露的财务数据为根底,对某一围的
公司进展综合评价,如某一行业、某一地区等等。利用熵权的根本原理,可以根
据上市公司公开披露的经营数据建立模型,进展经营绩效综合评价。模型的建立
及评价过程可以采用如下步骤:
〔1〕确定评价对象,选取评价指标,建立评价矩阵
假设选m个评估指标,n个评价公司,取得n个对象对m个指标的评价矩
阵R
(4.15)
〔2〕指标的标准化处理[13]
由于指标存在属性和数量级的差异,需要对原始数据进展标准化处理。标准
化处理主要解决不同属性数据的加总问题,使不同属指标变量在综合评价中发挥
一样方向的作用,并消除变量的量纲的影响。
在经营绩效评价中一般从盈利能力、偿债能力、营运能力、成长能力和资本
构造等方面选取指标,指标中有一些为收益性指标,数值越大越好;有一些为本
钱性指标,数值越小越好;同时,有一些为适度性指标,越接近某一个值越好,
或落入一个区间为好。针对不同的指标,可以采用不同的方法进展标准化处理。
具体方法如下:
mnmm
n
n
rrr
rrr
rrr
R
21
22221
11211
-
-
-.
对于收益性指标i,令:
(4.16)
对于本钱性指标i,令:
(4.17)
对于固定型适度指标i〔越接近
i
r越好〕,令:
(4.18)
对于区间型适度指标i〔适度区间为
ii
LL
21
,〕,令:
ij
r
<
i
L
1
iiji
LrL
21
(4.19)
ij
r
>
i
L
2
对于
nmnm
RR
标准化后得矩陈
(4.20)
〔3〕计算各公司指标i对于全部样本的比重
(4.21)
〔4〕计算各指标的熵值
第i个指标的熵值等于:
〔ni,,2,1〕
(4.22)
)min()max(
)min(
ijij
ijij
ijrr
rr
r
)min()max(
)max(
ijij
ijij
ijrr
rr
r
iij
iij
ijrr
rr
r
max
1
))max(),min(max(
1
1
))max(),min(max(
1
21
2
21
1
iijiji
iij
iijiji
iji
ij
LrrL
Lr
LrrL
rL
r
n
j
ijijij
rrf
1
/
mnmm
n
n
rrr
rrr
rrr
R
21
22221
11211
ij
n
j
iji
ffkHln
1
-
-
-.
〔5〕计算各指标的熵权
第i个指标的熵权等于:
(4.23)
〔6〕第j个企业熵权法综合经营绩效评价得分
(4.24)
计算各公司的综合得分,进展排序,比拟优劣。
四、基于TOPSIS模型的综合分析
4.1权重确实定方法
在运用TOPSIS模型对上市公司的业绩进展评价的过程中,指标权重的测
定是一项非常重要的步骤。通常我们对权重的测定方法分为主观赋权法和客观赋
权法。主观赋权法是指邀请专家进展打分,或者通过两两比拟得到判断矩阵,典
型的主观赋权法有层次分析法等。主观赋权法虽然简单且容易操作,但是主观因
素太多,准确性和准确度都不高。客观赋权法是指运用计算机对原始数据进展科
学处理后得到权重,常见的方法有熵权法,变异系数法等。客观赋权法既能防止
主观赋权法中的人为性因素,又能提高结论的准确性和科学性。
本文运用的是客观赋权法,即熵权法来确定权重。通过对47家公司进展权
系数的计算,并最终作为TOPSIS模型的权重系数。
4.2熵权法
熵权法是客观赋权的一种方法,它是通过观察指标值的变异程度中所包含的
信息量,以此来确定评价模型中的权重。熵来源于信息论,熵和信息是绝对值相
等,符号相反。信息熵的增加意味着信息的减少,也就是说,某项指标的变异程
度越小,那么该指标包含的信息量就越小,信息熵就越大,该指标在综合评价模
1
1
i
i
m
i
i
H
mH
1
()
m
jijij
i
sr
-
-
-.
型中起的作用越小,权重就越小。根据熵的定义与原理,系统的熵为:
1
ln
m
ii
i
hpp
公式〔1〕
公式〔1〕中:
i
p
满足
01
i
p
,
1
1
i
m
i
p
对于构成的原始评价矩阵X=
*
()
ijmn
X
中,某项指标
j
X
有信息熵为:
1
(1/ln())ln
m
jijij
i
hmpp
,其中:
1
/
m
ijijij
i
pxx
。
4.3TOPSIS模型的综合分析
TOPSIS(TechniqueforOrderPreferencebySimilaritytoIdealSolution)是距离
综合评价法,是一种逼近于理想解的排序方法。通过计算找到一个参考点,也就
是正理想值点和负理想值点,然后再计算每个方案的各指标值到正理想值点和负
理想值点的距离。
本文用熵权法来确定评价指标权重,客服了采用专家意见调查法或层次分析法来
确定TOPSIS法中评价指标的权重时造成的主观因素的影响。
4.3.1建模过程
以熵权法确定TOPSIS模型权重的步骤如下:
〔1〕对原始数据矩阵X
*
()
ijmn
X
做正向化和无纲量化处理:
当指标为正向指标时,对它进展以下处理:
min()
0.1
max()min()
ijij
i
ij
ijij
ii
xx
y
xx
i=1,2,…,m;j=1,2,…,n公式(2)
当指标为负向指标时,对它进展以下处理:
max()
0.1
max()min()
ijij
i
ij
ijij
ii
xx
y
xx
公式〔3〕
i=1,2,…m;j=1,2,…,n
当指标为适度指标时,对它进展以下处理:
010.1
max()min()
ij
ij
ijij
ii
xx
y
xx
-
-
-.
i=1,2…,m;j=1,2,…n公式(4)
(2)计算第j项指标的熵值
j
h
。
1
1
ln
ln()
m
jijij
i
hyy
m
公式(5)
(j=1,2,…,n)
(3)计算第j项指标的差异系数
i
g。
1
jj
Gh
公式(6)
(4)计算第j项指标的权重
j
w
。
1
j
j
n
j
j
g
w
g
公式(7)
1
01,1
n
jj
j
ww
(5)构成加权的数据矩阵Z,其中元素
ij
Z
为:
;
(1,2,...,;1,2,...,)
ijijij
zwy
imjn
公式(8)
(6)确定理想解和负理想解。
12
12
(,,,);
(,,,)
n
n
Zzzz
Zzzz
其中12
12
max(,,,);
min(,,,),1,2,...,.
jjjmj
jjjmj
Zzzz
Zzzzjn
(7)计算每个解到正理想解和负理想解的距离。
即:
2
1
(),1,2,...,
n
iiji
j
Dzzim
公式(9)
2
1
(),1,2,...,
n
iiji
j
Dzzim
公式(10)
(8)计算相对近似度
i
C:
i
i
i
i
D
C
DD
1,2,...im公式(11)
-
-
-.
(9)按接近大小的顺序进展排名,由于01
i
C,
i
C越接近1,那么说明该公司的
效益较好
五、因子分析和主成分分析的不同区别以及在综合评价中的应用
之前一直也搞不清楚因子分析和主成分分析的区别,于是不停的看相关
的教材,不停的琢磨,发现找的一些文献里面仍然是分不清因子分析和
主成分分析的区别,看过的一些进展区别比拟的文章,我也似乎看不太
懂,这里结合?文彤的spss教程?里的区别方法以及我的理解重新写出来,
如有不当之处,请指正。
在spss中,主成分分析是跟因子分析处于一个对话框中,而且主成
分分析可以作为因子分析的一种方法使用,并且可以看出主成分分析是
一个过程,而不是作为一个终点方法。
我用的18.0是中文版,主成分和因子分析均在“分析------降维----因
子分析〞中,采用的数据仍是文彤的教程用的数据,我们这里通过因子
分析和主成分分析法对数据中的地区进展综合排名,变量从x1-x8.
由于因子分析和主成分分析的对话框都在一个当中,前面的操作根本
一样,方法中选用主成分分析方法,
-
-
-.
注意如果是主成分分析,只需选择输出“未旋转的因子解〞就可以
了。
不需要进展“旋转rotation〞和“得分score,〞对话框操作,到此即
为主成分分析。
这里为了同时进展因子分析和主成分分析比拟,因此选择旋转的“最
大方差旋转〞及“得分〞中的相应操作,如以下图的操作
-
-
-.
该旋转是属于因
子分析中的旋转,通过旋转可以更好的解释所提取的因子,而主成分分析不需要进展旋转
该图为输出因子分析的各因子得分,通过不同的方法进展保存变量,那么可以直接得
出提取的各因子实际得分,一般默认采用回归法,然后新提取因子的得分会在spss原来数
据的最后新添加几列。“显示因子得分系数矩阵〞是为了直观的列出通过因子分析方法
得出的方程系数与主成分分析法求出的方程系数比照
结果呈现进展比照
-
-
-.
首先出现的这结果是因子分析和主城分分析公用的结果,如下表
这表格大家都熟悉,就不细说了,可以看出通过主成分分析法,共提取了3个因子,可以
解释原来所有变量的89.551%的方差
接下来这表格就是主成分分析的结果,如果是要用主成分方法,那么使用下面这表格,也就
是“未旋转的因子解〞就可以列出方程
通过这个我们可以列出主成分分析方法的方程,假设三个主成分为F1F2F3
那么F1=0.884*GDP+0.606*居民消费水平+0.911*固定资产投资+0.465*职工平均工资
+……0.822*工业总产值
F2=0.385*GDP+〔-0.596〕*居民消费水平+0.163*固定资产投资+……+0.429*工业总产值
F3=0.120*GDP+0.277*居民消费水平+……+0.210*工业总产值。
在进展综合评价时,需要先计算各个主成分的权重,
F1的权重a1=3.754/〔3.754+2.203+1.208〕,F2的权重a2=2.203/〔3.754+2.203+1.208〕,
F3的权重a3=1.208/〔3.754+2.203+1.208〕,
综合得分F=a1*F1+a2*F2+a3*F3
-
-
-.
下面输出的都是因子分析的结果,经过最大方差旋转后的主成分系数矩阵,如以下图
通过旋转后的主成分系数矩阵,可以清楚的看出GDP、工业总产值、固定资产投资、
货物周转量属于第一主成分因子,可命名为“经济总量水平因子〞;职工平均工资和居民消
费水平属于第二主成分因子,可命名为“消费水平因子〞;居民消费价格指数和商品价格指
数属于第三主成分因子,可命名为“价格水平因子〞。
大家可以比拟两种方法,因子分析法可以用来对各指标进展归类,同时可以将每个主因
子所包括的指标进展一定的专业解释,从而是的问卷指标更加构造化。
接下来这表格是“成分得分系数矩阵〞,
根据这表格的系数,可以写出因子分析的各因子方程,假设三个主因子为F1F2F3
F1=0.306*GDP+0.025*居民消费水平+0.270*固定资产投资+……+0.317*工业总产值
F2=0.011*GDP+0.387*居民消费水平+0.129*固定资产投资+……+0.026*工业总产值
F3=0.047*GDP+0.040*居民消费水平+0.075*固定资产投资+……+0.123*工业总产值
-
-
-.
至此,大家可以比拟下主成分分析的系数及方程与因子分析的系数和方程,两者的数字
是完全不同的,当然因子分析的因子得分,可以直接计算出来,也就是通过回归法,而方程
那么是上面红色字体的三个方程,得分直接保存到spss原来数据中。
然后计算综合评价得分时,仍需计算各主因子的权重,各因子权重占比计算与主成分分析法
的权重占比算法一样,只不过因子分析各主因子的得分计算与主成分分析的各主成分的得分
计算已经有所不同。
所以通过两种不同的方式计算的综合评价略有不同,不过一般情况下,因子分析的方法更加
普遍和常用,也更加完善
本文发布于:2023-03-06 19:54:04,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/167810364415058.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:定量分析.doc
本文 PDF 下载地址:定量分析.pdf
留言与评论(共有 0 条评论) |