MATLAB协⽅差[cov]和相关系数[corrcoef]说明
A,B为两个长度相同的向量
求协⽅差
S=cov(A,B);
b和c数值上是相等的。
求相关系数
R=corrcoef(A,B)
数值上,f和g是相同到。
相关系数存在许多种类,上述corrcoef指pearsoncorrelationcoefficient。
扩展阅读1
协⽅差
⼆维随机变量(X,Y),X与Y之间的协⽅差定义为:
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}
其中:E(X)为分量X的期望,E(Y)为分量Y的期望
协⽅差Cov(X,Y)是描述随机变量相互关联程度的⼀个特征数。从协⽅差的定义可以看出,它是X的偏差【X-E(X)】与Y的偏差【Y-E(Y)】的
乘积的数学期望。由于偏差可正可负,因此协⽅差也可正可负。
l当协⽅差Cov(X,Y)>0时,称X与Y正相关
l当协⽅差Cov(X,Y)<0时,称X与Y负相关
l当协⽅差Cov(X,Y)=0时,称X与Y不相关
举个例⼦
⼆维随机变量(⾝⾼X,体重Y)(数据是⾃⼰编的)
⾝⾼X(cm)体重Y(500g)X-E(X)Y-E(Y)[X-E(X)][Y-E(Y)]
115292-19.4-39.7770.18
218516213.630.3412.08
3169125-2.4-6.716.08
41721180.6-13.7-8.22
51741222.6-9.7-25.22
6168135-3.43.3-11.22
71801688.636.3312.18
E(X)=171.4E(Y)=131.7E{[X-E(X)][Y-E(Y)]}=209.4
根据直觉我们也会想到,⾝⾼和体重是有正相关性的,⾝⾼较⾼的体重⼀般会⽐较⼤,同样体重⼤的⾝⾼⼀般也⽐较⾼。计算出来的结果也
⾮常符合我们的直觉。
再来举⼀个反例
⼆维随机变量(玩游戏的时间X,学习成绩Y)(数据是⾃⼰编的)
游戏时间X(h/天)学习成绩YX-E(X)Y-E(Y)[X-E(X)][Y-E(Y)]
1095-1.3620.7-28.152
2165-0.36-9.33.348
33701.64-4.3-7.052
42550.64-19.3-12.352
52.5651.14-9.3-10.602
60.580-0.865.7-4.902
70.590-0.8615.7-13.502
E(X)=1.36E(Y)=74.3E{[X-E(X)][Y-E(Y)]}=-10.5
同样根据直觉我们也会觉得,⼩朋友玩游戏的时间越长,学习成绩越差的可能性就越⼤,计算结果也很好的符合我们的直觉。
从上⾯两幅散点图上⼤约可以看出体重随⾝⾼的变化趋势,以及学习成绩随玩游戏时间长短的变化趋势。因此,可以说协⽅差是两个随机变
量具有相同变化趋势的度量。
但是,协⽅差仅能进⾏定性的分析,并不能进⾏定量的分析,⽐如⾝⾼体重之间的协⽅差为209.1,它们之间的相关性具体有多⼤呢,协⽅
差并没有给出定量的判断标准。因此我们引出相关系数的概念。
相关系数
相关系数的定义
其中:Var(X)为X的⽅差,Var(Y)为Y的⽅差。
根据施⽡茨不等式可以得到-1
lCorr(X,Y)=1的时候,说明两个随机变量完全正相关,即满⾜Y=aX+b,a>0
考虑Corr(X,X),两个随机变量相同,肯定满⾜线性关系,此时,Cov(X,X)=Var(X),容易得到Corr(X,Y)=1
lCorr(X,Y)=-1的时候,说明两个随机变量完全负相关,即满⾜Y=-aX+b,a>0
l0<|Corr(X,Y)|<1的时候,说明两个随机变量具有⼀定程度的线性关系。
还是以前⾯的两个例⼦为例,
⾝⾼体重:Corr(X,Y)=209.4/(10.2*24.4)=0.84
游戏时间与学习成绩:Corr(X,Y)=-10.5/(1.1*13.4)=-0.71
有了相关系数,我们可以说,⾝⾼与体重之间的线性相关性⽐游戏时间与学习成绩之间的线性相关性更⼤。
补充说明:
Corr(X,Y)为0,表⽰X与Y不相关,这⾥的不相关指的是X与Y没有线性关系,但不是没有关系。因此将“相关”理解为“线性相关”也许更
恰当⼀些。
扩展阅读2:
1。向量的⽅差与协⽅差矩阵
cov(x)
求向量x的⽅差。
cov(x)为⼀个数值,数值⼤⼩计算公式为S(x)。
cov(x,y)
求向量x与y的协⽅差矩阵。
cov(x,y)为2*2矩阵,
[S(x)C(x,y);
C(y,x)S(y);]
2。矩阵协⽅差矩阵
cov(X)
求矩阵X的协⽅差矩阵。diag(cov(X))得到每⼀个列向量的⽅差。sqrt(diag(cov(X)))得到每⼀个列的标准差。
若X⼤⼩为M*N,则cov(X)⼤⼩为N*N的矩阵。cov(X)的第(i,j)个元素等于X的第i列向量与第j列向量的⽅差,即C(Xi,Xj)。
cov(X,Y)
求矩阵X与Y的协⽅差矩阵。
若X⼤⼩为M*N,Y为K*P,则X,Y的⼤⼩必须满⾜M*N=K*P,即X,Y的元素个数相同。
此时,cov(X,Y)等于cov([X(:)Y(:)])和cov(X(:),Y(:)),即计算两个向量的协⽅差矩阵,得到的结果为2*2矩阵。
[S(X(:))C(X(:),Y(:));
C(Y(:),X(:))S(Y(:));]
Matlab中cov函数详细解读-钰-计算机视觉·图像处理
可知,S(X)=C(X,X).
3。关于归⼀化的问题
在上述的S(X),C(X,Y)计算中,采⽤的归⼀化参数是1/(N-1),其中N是向量中元素的个数。⽽下⾯的调⽤形式采⽤的归⼀化参数是1/N。对
应的公式如下图所⽰。
cov(x,1)
求向量x的⽅差。计算⽅法如cov(x),但归⼀化参数为1/N。
cov(x,y,1)
求向量x与y的协⽅差矩阵。计算⽅法如cov(x,y),但归⼀化参数为1/N。
Matlab中cov函数详细解读-钰-计算机视觉·图像处理
4。PS:
为区别对待,
cov(x)⼜记作cov(x,0)
cov(x,y)⼜记作cov(x,y,0)
cov(X)⼜记作cov(X,0)
cov(X,Y)⼜记作cov(x,y,0)
对于归⼀化参数为1/(N-1)的情况,当N=1时,⾃动将参数调整为1/N。
扩展阅读3
想⽤MATLAB中的corrcoef函数求两个向量的相关系数。
⽐如A=[123];B=[537];r=corrcoef(A,B)可以求出相关系数是0.5.为什么两个向量的元素都要是3个以上才⾏?⽽只有两个元素的向量
如A=[12];B=[53];不管怎么随机的取,相关系数都是1或-1啊?只含两个元素的向量,都⼀定相关吗?
这是求相关度的结果,对于⼀般的矩阵X,执⾏A=corrcoef(X)后,A中每个值的所在⾏a和列b,反应的是原矩阵X中相应的第a个列向量和
第b个列向量的相似程度(即相关系数)。计算公式是:C(1,2)/SQRT(C(1,1)*C(2,2)),其中C表⽰矩阵[f,g]的,假设f和g都是列向量
(这两个序列的长度必须⼀样才能参与运算),则得到的(我们感兴趣的部分)是⼀个数。以默认的A=corrcoef(f,g)为例,输出A是⼀个
⼆维矩阵(对⾓元恒为1),我们感兴趣的f和g的相关系数就存放在A(1,2)=A(2,1)上,其值在[-1,1]之间,1表⽰最⼤的正相关,-1表⽰绝
对值最⼤的负相关
>>A=[123];B=[537];r=corrcoef(A,B)
r=
1.00000.5000
0.50001.0000
>>A=[12];B=[53];
r=corrcoef(A,B)
r=
1.0000-1.0000
-1.00001.0000%%-1是算出来的,不是说⼆维向量就⼀定相关,根据图中r和的关系
cov(A,B)
ans=
0.5000-1.0000
-1.00002.0000%%%A和B的,
那么R(1,2)=C(1,2)/(sqrt(C(1,1)*C(2,2)))=-1,sqrt为开⽅的意思。
向左转|向右转
追问
⾮常感谢你的回答,真的是太详细了,我都抄在本⼦上了呵呵。但还是有⼀点不明⽩,
“-1是算出来的,不是说⼆维向量就⼀定相关,”什么意思?为什么任何两个⼆维向量计算出来的相关系数都是1或者-1?
你不是说“1表⽰最⼤的正相关,-1表⽰绝对值最⼤的负相关”吗?那么任何两个⼆维的向量都具有最⼤的正(负)相关性吗?相关系数为1,
也就是相关的。我不是学数学的,是做课题的时候发现这个问题不明⽩。
追答
>>A=[10];B=[01];%%⼆维向量,不相关
cov(A,B)
ans=
0.5000-0.5000
-0.50000.5000
A=[12];B=[510];%%⼆维向量,相关
cov(A,B)
ans=
0.50002.5000
2.500012.5000
正相关是指两列变量变动⽅向相同,⼀列变量由⼤到⼩或由⼩到⼤变化时,另⼀列变量亦由⼤到⼩或由⼩到⼤变化。
负相关是指两列变量变动⽅向相反,⼀列变量由⼤到⼩或由⼩到⼤变化时,另⼀列变量反⽽由⼩到⼤或由⼤到⼩变化。
matlab函数corrcoef也是根据上⾯的概念计算的,关于⼆维向量计算总得到-1或者1的问题,我仔细看了下,上⾯的测试两组数据,
可以看出协⽅差矩阵中sqrt(C(1,1)*C(2,2))=C(1,2)or-C(1,2)。
也就是说不管你怎么换数据sqrt(C(1,1)*C(2,2))=C(1,2)or-C(1,2)这个式⼦总是成⽴的,
所以我个⼈认为是样本数量(向量维数)少或者是这个函数的缺陷。
本文发布于:2022-12-04 03:06:49,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/48469.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |