典型相关分析1

更新时间:2023-05-19 01:07:17 阅读: 评论:0

第 15 章 典型相关分析
典型相关分析(Canonical Correlation )是研究两组变量之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
我们知道,在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系。然而,这些统计方法在研究两组变量之间的相关关系时却无能为力。比如要研究生理指标与训练指标的关系,居民生活环境与健康状况的关系,人口统计变量(户主年龄、家庭年收入、户主受教育程度)与消费变量(每年去餐馆就餐的频率、每年出外看电影的频率)之间是否具有相关关系?阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)是否相关?这些多变量间的相关性如何分析?
典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。
目前,典型相关分析已被广泛应用于心理学、市场营销等领域,如用于研究个人性格与职业兴趣的关系,市场促销活动与消费者响应之间的关系等。
15.1 典型相关分析的理论与方法
15.1.1 典型相关分析的基本思想
典型相关分析的基本思想和主成分分析非常相似。首先在每组变量中找出变量的一个线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取相关系数仅次于第一对线性组合并且与第一对线性组合不相关的第二对线性组合,如此继续下去,直到两组变量之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。
一般情况,设、是两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量、,使得每一个综合变量是原变量的线性组合,即
(1)(1)(1)(1)12(,,,p X X X X =L ))P q (2)(2)(2)(2)12(,,,q X X X X =L i U i V ()(1)()(1)()(1)()(1)1122i i i i i P U a X a X a X a X ′=+++L
()(2)()(2)()(2)()(2)1122i i i i i q V b X b X b X b X ′=+++L
为了确保典型变量的唯一性,我们只考虑方差为1的(1)X 、(2)X 的线性函数与,求使得它们相关系数达到最大的这一组。若存在常向量,,在
的条件下,使得相关系数ρ到最大,
则()(1)i a X ′(1)b )()(2)i b X ′(1D a X (1)a (2)′达)(1)(1)(2)()()D b X ′′=1=(1)(1)(,a X ′(1)b X
称(1a (1b )(1)X ′、是)(2)X ′(1)X 、(2)X 的第一对典型相关变量,它们之间的相关系数就叫典型
相关系数。求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对典型相关变量、第三对典型相关变量、……。这些典型相关变量就反映了(1)X 、(2)X 之间的线性相关情况。这里值得注意的是,我们可以通过检验各对典型相关变量相关系数的显著性,来反映每一对综合变量的代表性,如果某一对的相关程度不显著,那么这对变量就不具有代表性,不具有代表性的变量就可以忽略。这样就可以通过对少数典型相关变量的研究,代替原来两组变量之间的相关关系的研究,从而容易抓住问题的本质。
15.1.2 典型相关变量及典型相关系数的求解步骤
为了节省篇幅,不加证明地给出求解典型相关变量与典型相关系数的一般步骤:
1. 计算原始数据的协差阵。
设有两组变量,(1)X
代表第一组的p 个变量,(2)X 代表第二组的q 个变量,不妨假设
p ≤q 。令 (1)1(1)2(1)(1)(2)()1(2)1(2)2(2)p p q X q X X X X X X X X +×⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎡⎤⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎦
早晨问候M M  ⎣()()()()1112(,)2122p p p q q p q q ΣΣ⎡⎤X X ××××⎢⎥
⎢⎥=Cov ΣΣ⎢⎥⎢⎥⎣⎦(1)()X (2)(1)12(),(,v Cov X Cov X X =Σ=(2))=11Co Σ=22,Σ21′Σ
儿子生日快乐祝福语即将总的样本协差阵剖分为第一组变量的协差阵11Σ、第二组变量的协差阵以及两组变量之间的协差阵和。
22Σ12ΣΣ212. 计算两个矩阵和A B :
1111122221A −−=ΣΣΣΣ
1122211112B −−=ΣΣΣΣ
其中为p×p 阶矩阵,A B 为q×q 阶矩阵。可以证明,矩阵和A B 具有相同的非零特征根,且非零特征根的个数。
七开头的成语()r ank A ==r ()rank B
3. 计算矩阵和A B 的非零特征根为2212r 2λλλ≥≥L ,为对应于(1)(2)(),,,r a a a L A 22212,,,r λλL λ的特
征向量,b b 为(1)(2),,,L ()r b B 对应于22212,,,r λλλL 的特征向量。则最大特征根21λ对应的特征向量(1)(1)(1)12(,a a (1),,)p a a ′=L (1)=和就是所求的第一对典型变量的系数向量,即
(1)(1)(1)12(,,,q b
b b b ′L )(1)(1)(1)(1)(1)(1)(1)(1)11122P P
U a X a X a X a X ′==+++L  (1)(2)(1)(2)(1)(2)(1)(2)11122q q
路政大队
V b X b X b X b X ′==+++L  最大特征根的平方根1λ即为两典型变量的相关系数,我们称其为第一典型相关系数。
同理,矩阵和A B 的第二大特征根22λ的平方根2λ,其对应的特征向量,就是第二对典型变量的系数向量,称和(2)a
(2)b (2)′(1)2U a
X =2V = 为第二对典型变量,(2)(2)b X ′2λ为第二典型相关系数。
类似地,依次可求出第对典型变量:和,其系数向量和分别为矩阵和r ()(1)r r U a
X ′=()(2)r r V b X ′=()r a ()r b A B 的第特征根r 2r λ对应的特征向量。r λ即为第典型相关系数。
r 可以证明,典型变量具有如下性质:
(1) ()1,()1
(1,2,,)k k D U D V k r ===L (2)
(,)0,(,)0()i j i j Cov U U Cov V V i j ==≠(3) 0(,1,2,,)
(,)0朋友祝福语
()
0()i i j i j i r Cov U V i j j r λ≠==⎧⎪=≠⎨⎪>⎩
L 15.1.3 典型相关系数的显著性检验
在进行典型相关分析时,对于两随机向量(1)(2)X X 、,我们总共可以提取出对典型变量,问题是进行典型相关分析的目的就是要减少分析变量,简化两组变量间关系分析,提取对变量是否必要?我们如何确定保留多少对典型变量?
r r 若第个总体典型相关系数k 0k λ=,则相应的典型变量,之间无相关关系,这样的典型变量可以不予考虑。由于第个以后的典型相关系数逐渐减小,如果第个典型相关系数不显著,则显然后面的典型相关系数均不显著。这样,可以建立如下的原假设:
衡阳师范学院南岳学院k U k V k k 012:0k k r H λλλ++====L
11:0k H λ+≠
用于检验的似然比统计量为:
21ˆ
(1)r k i i k λ=+Λ=
−∏ 可以证明,统计量近似服从ln k k Q m =−Λk 2()k f χ分布,其中
1(1)(2
k m n k p q =−−−++ 1)自由度)()(k f p k q k =−−。
SPSS 会自动计算至的上述卡方统计量以及对应的1k =r p 值,如果p 值小于给定的显著性水平α,则
拒假设,认为第个典型相关系数显著;如果绝原k p 值大于给定的显著性水平α,则无法原假设,认为从第k 个开始往后的所有典型相关系数均不显著。 15.1.4 从相关矩阵出发计算典型相关最毒的水母
相关分析涉及多个变量,
不同的变量往往具有不同的量纲及不同的数量级别。在进行典15.2 典型相关的实例
测量15名受试者的身体形态以及健康情况指标。指标分为两组,第一组是身体形态变量,15.2.1 SPSS 操作步骤
在SPSS 中没有提供典型相关分析的专门菜单项,要想利用SPSS 实现典型相关分析,必须面的语句:(图  E 'Canonical correlation.sps'.
其中,x1、组原始变量的变量名,y1、y2、y3为第二组原始变量的典型型相关分析时,由于典型变量是原始变量的线性组合,具有不同量纲变量的线性组合显然失去了实际意义。其次,不同的数量级别会导致“以大吃小”,即数量级别小的变量的影响会被忽略,从而影响了分析结果的合理性。因此,为了消除量纲和数量级别的影响,必须对数据先做标准化变换处理,然后再做典型相关分析。显然,经标准化变换之后的协差阵就是相关系数矩阵,因而,也即通常应从相关矩阵出发进行典型相关分析。
有年龄(X1)、体重(X2)、日抽烟量(X3)和胸围(X4);第二组是健康状况变量,有脉搏(Y1)
、收缩压(Y2)和舒张压(Y3)。要求测量身体形态以及健康状况这两组变量之间的关系。
在语句窗口中调用SPSS 的 Canonical correlation.sps 宏。具体方法如下:
1. 选择菜单项File →New →Syntax ,新建一个语句窗口。在语句窗口中输入下 15-1)
INCLUD CANCORR SET1=x1 x2 x3 x4 /性字组词
SET2=y1 y2 y3 / .
x2、x3、x4为第一
变量名。
图 15-1  在语句窗口中输入典型相关分析命令
2. 点击语句窗口Run All 子菜单项,运行典型相关宏命令,得出结果。 15.2.2 实例结果分析
1. Correlations for Set-1、Correlations for Set-2、Correlations Between Set-1 and Set-2(分别给出两组变量内部以及两组变量之间的相关系数矩阵)计算的出发点。
表 15-1  两组变量内部以及两组变量之间的相关系数矩阵 Correlations for Set-1
X1
Correlations for Set-2
orrelations Between Set-1 and Set-2
菜单中的
由前面介绍的理论知识知道,这些矩阵是典型相关分析  X2      X3      X4
X1  1.0000  .7697  .5811  .1022
X2  .7697  1.0000  .8171  -.1230
X3  .5811  .8171  1.0000  -.1758
X4  .1022  -.1230  -.1758  1.0000
Y1      Y2      Y3
Y1  1.0000  .8865  .8614
Y2  .8865  1.0000  .7465
Y3  .8614  .7465  1.0000
C        Y1      Y2      Y3
X1  .7582  .8043  .5401
X2  .8572  .7830  .7171
X3  .8864  .7638  .8684
X4  .0687  .1169  .0147

本文发布于:2023-05-19 01:07:17,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/688289.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   典型   相关   分析   关系   研究   具有   矩阵
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图