第七章 多重共线性

更新时间:2023-07-21 17:45:14 阅读: 评论:0

第七章  多重共线性
教学目的及要求:
1、重点理解多重共线性在经济现象中的表现及产生的原因和后果
2、掌握检验和处理多重共线性问题的方法
3、学会灵活运用Eviews软件解决多重共线性的实际问题。
第一节  多重共线性的产生及后果
一、多重共线性的含义
1、含义
在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。
2、类型
多重共线性包含完全多重共线性和不完全多重共线性两种类型。
(1)完全多重共线性
完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。
如对于多元线性回归模型
EMBED Equation.3                              (7-1)
存在不全为零的数  EMBED Equation.3    ,使得下式成立:
EMBED Equation.3                                                (7-2)
则可以说解释变量  EMBED Equation.3    之间存在完全的线性相关关系,即存在完全多重共线性。
从矩阵形式来看,就是  EMBED Equation.3    , 即  EMBED Equation.3    ,观测值矩阵是降秩的,表明在向量X中至少有一个列向量可以由其他列向量线性表示。
(2)不完全多重共线性
不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。
如对于多元线性回归模型(7-1)存在不全为零的数  EMBED Equation.3    ,使得下式成立:
EMBED Equation.3                                              (7-3)
其中  EMBED Equation.3    为随机误差项,则可以说解释变量  EMBED Equation.3    之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。
完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。
就业协议书
二、多重共线性产生的原因
多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。
(一)经济变量间具有相同方向的变化趋势
在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投
资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。
(二)经济变量间存在较密切关系
由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。
(三)采用滞后变量作为解释变量较易产生多重共线性
一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。
(四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。
三、多重共线性产生的后果
由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模型进行最小二乘估计都会产生严重后果。
(一)完全多重共线性 产生的后果
以二元线性回归模型为例,
    EMBED Equation.3                                                    (7-4)
以离差形式表示,假设其中  EMBED Equation.3    ,  EMBED Equation.3    ,  EMBED Equation.3    ,  EMBED Equation.3    ,常数  EMBED Equation.3    ,则,  EMBED Equation.3      ,  EMBED Equation.3    的最小二乘估计量为
    EMBED Equation.3                   
EMBED Equation.3                              (7-5)
同理得到:    EMBED Equation.3                                                              (7-6)
可见参数估计值  EMBED Equation.3    和  EMBED Equation.3    无法确定。
再考察参数估计量的方差,由前面章节可知:
EMBED Equation.3                                          (7-7)
将  EMBED Equation.3    代入上式,则
EMBED Equation.3                                            (7-8)
            =  EMBED Equation.3   
说明此种情况下  EMBED Equation.3    方差为无穷大。
新年歌曲同理可以证明  EMBED Equation.3    的方差在完全共线性下也为无穷大。
以上分析表明,在完全多重共线性条件下,普通最小二乘法估计的参数值不能确定,并且估计值的方差为无穷大。
(二)不完全多重共线性产生的后果
假设上述二元线性回归模型中解释变量  EMBED Equation.3    与  EMBED Equation.3    的关系为
        EMBED Equation.3                                                        (7-9)
其中  EMBED Equation.3    为随机项,满足  EMBED Equation.3    ,  EMBED Equation.3    ,代入  EMBED Equation.3    估计表达得:
EMBED Equation.3      EMBED Equation.3   
      =  EMBED Equatio
n.3                                                                (7-10)
由于  EMBED Equation.3    ,因而  EMBED Equation.3    是可确定估计的,但是其数值依赖  EMBED Equation.3    的数值,而  EMBED Equation.3    的数值随样本的变化有较大变化,所以  EMBED Equation.3    估计值是很不稳定的。
同理可以证明  EMBED Equation.3    也是可估计的,且数值具有不稳定性。
考察估计量的方差:
由(7-1)式可知  EMBED Equation.3    是  EMBED Equation.3    、  EMBED Equation.3    的相关系数,因此
EMBED Equation.3                                                      (7-11)
参数估计量的方差可表达为:
EMBED Equation.3   
          EMBED Equation.3                                            (7-12)
其中  EMBED Equation.3    为  EMBED Equation.3    和  EMBED Equation.3    之间的相关系数,从(7-12)式可见,  EMBED Equation.3    的值越大,则共线程度越高,估计量方差  EMBED Equation.3    越大,直至无穷。
综上所述,线性回归模型解释变量间存在多重共线性可能产生如下后果:增大最小二乘估计量的方差;参数估计值不稳定,对样本变化敏感;检验可靠性降低,产生弃真错误。由于参数估计量方差增大,在进行显著性检验时,t检验值将会变小,可能使某些本该参数显著的检验结果变得不显著,从而将重要变量舍弃。
第二节  多重共线性的检验
多重共线性是较为普通存在的现象,从上节分析可知,较高程度的多重共线性会对最小二乘估计产生严重后果,因此,在运用最小二乘法进行多元线性回归时,不但要检验解释变量间是否存在多重共线性,还要检验多重共线性的严重程度。 
一、不显著系数法
情况1、  EMBED Equation.3      很大,t小
不显著系数法是利用多元线性回归模型的拟合结果进行检验。如果拟合优度  EMBED Equation.3    的值很大(一般来说在0.8以上),然而模型中的全部或部分参数值估计值经检验却不显著,那么解释变量间有可能存在较严重的多重共线性。
情况2、理论性强,检验值弱
如果从经济理论或常识来看某个解释变量对被解释变量有重要影响,但是从线性回归模型的拟合结果来看,该解释变量的参数估计值经检验却不显著,那么可能是解释变量间存在多重共线性所导致的。
情况3、新引入变量后,方差增大
在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显增大,则说明解释变量间可能存在多重共线性。
二、拟合优度  EMBED Equation.3    检验
对多元线性回归模型中各个解释变量相互建立回归方程,分别求出各回归方程的拟和优度,如果其中最大的一个
接近1,  EMBED Equation.3    显著大于临界值,该变量可以被其他变量线性解释,则其所对应的解释变量与其余解释变量间存在多重共线性。
如设某多元线性回归模型中原有  EMBED Equation.3    个解释变量  EMBED Equation.3    ,将每个解释变量对其他解释变量进行回归,得到  EMBED Equation.3    个回归方程:
乒乓球训练计划EMBED Equation.3   
EMBED Equation.3   
EMBED Equation.3   
EMBED Equation.3   
分别求出上述各个方程的拟合优度  EMBED Equation.3    ,如果其中最大的一个  EMBED Equation.3    接近于1,则它所对应的解释变量  EMBED Equation.3    与其余解释变量间存在多重共线性。
三、相关矩阵法
考察多元线性回归模型
车来了
EMBED Equation.3                                                    (7-13)
其解释变量之间的相关系数矩阵为:
        EMBED Equation.3                                  (7-14)
因为  EMBED Equation.3    ,,所以上面相关阵为对称阵,  EMBED Equation.3    ,只需考察主对角线元素上方(或下方)某个元素绝对值是否很大(一般在0.8以上),就可以判断两个解释变量间是否存在多重共线性。
结论:
另外需要特别注意的是,如果相关系数很大,则一定存在多重共线性,如果相关系数很小,不一定没有多重共线性。
四、Frisch综合分析法
1、方法及分析标准
Frisch综合分析法也叫逐步分析估计法,其基本思想是先将被解释变量对每个解释变量作简单回归方程,称为基本回归方程。再对每一个基本回归方程进行统计检验,并根据经济理论分析选出最优基本方程,然后再将其他解释变量逐一引入,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:
1.如果新引进的解释变量使  EMBED Equation.3    得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。
2.如果新引进的解释变量对  EMBED Equation.3    改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。
3.如果新引进的解释变量不仅改变了  EMBED Equation.3    ,而且对其他回归系数的数值或符号具有明显影响,则可认为引进新变量后,回归模型解释变量间存在严重多重共线性。这个新引进的变量如果从理论上分析是十分重要的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明存在明显线性相关的两个解释变量中的一个可以被另一个解释,则可略去其中对被解释变量影响较小的那个变量,模型
中保留影响较大的那个变量。
2、具体实例
识字课例7-1 设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表7-1,请建立需求函数模型。
表7-1 服装消费及相关变量调查数据
年份 服装开支
(百万元) 可支配收入
Y
(百万元) 流动资产
(百万元) 服装类物价指数Pc
1992年=100 总物价指数
P0
1992年=100  1988 8.4 82.9 17.1 92 94  1989 9.6 88.0 21.3 93 96  1990 10.4 99.9 25.1 96 97  1991 11.4 105.3 29.0 94 97  1992 12.2 117.7 34.0 100 100  1993 14.2 131.0 40.0 101 101  1994 15.8 148.2 44.0 105 104  1995 17.9 161.8 49.0 112 109  1996 19.3 174.2 51.0 112 111  1997 20.8 184.7 53.0 112 111 
(1)设对服装的需求函数为
EMBED Equation.3   
用最小二乘法估计得
元旦的风俗EMBED Equation.3   
EMBED Equation.3        EMBED Equation.3        EMBED Equation.3        EMBED Equation.3   
EMBED Equation.3   
由  EMBED Equation.3    得出拒绝零假设,认为服装支出与解释变量间存在显著关系。
(2)求各解释变量的基本相关系数
EMBED Equation.3   
上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性。
高级职业资格证书(3)为检验多重共线性的影响,作如下简单回归:
①  EMBED Equation.3   
(-3.3102)  (41.9370)
EMBED Equation.3          EMBED Equation.3   
②  EMBED Equation.3   
(-9.1682)  (12.5363)
EMBED Equation.3          EMBED Equation.3   
③  EMBED Equation.3   
(2.5858)  (15.3096)
EMBED Equation.3          EMBED Equation.3   
④  EMBED Equation.3   
(-14.7710) (18.6585)
EMBED Equation.3          EMBED Equation.3   
以上四个方程根据经济理论和统计检验,收入Y是最重要的解释变量(t检验值=41.937也最大),从而得出最优简单回归方程  EMBED Equation.3    。
鸡蛋炒丝瓜
(4)将其余变量逐个引入  EMBED Equation.3    ,计算结果如下表7-2:
表7-2 服装消费模型的估计
EMBED Equation.3   
(常数)  EMBED Equation.3        EMBED Equation.3        EMBED Equation.3        EMBED Equation.3        EMBED Equation.3        EMBED Equation.3        EMBED Equation.3      -1.2455
(-3.3102) 0.117(41.9370) ____ ____ ____ 0.9955 2.6271    EMBED Equation.3      1.4047
(0.2852) 0.1257
(8.4259) -0.0361
(-0.5398) ____ ____ 0.9957 2.5335    EMBED Equation.3      0.9400
(0.1815) 0.1387
(5.5845) -0.0345
(-0.4941) -0.0379
(-0.6682) ____ 0.9959 3.1568    EMBED Equation.3      -12.7593
(-1.9581) 0.1036
(7.4640) -0.1882
(-2.4693) ____ 0.3186
(2.6189) 0.9980 3.5241    EMBED Equation.3      -13.5335
(-1.8013) 0.0970
(3.6603) -0.1991
(-2.2087) 0.0151
(0.3053) 0.3401
(2.2714) 0.9980 3.3826 
结果分析:
①在最优简
单回归方程  EMBED Equation.3    中引入变量  EMBED Equation.3    ,使  EMBED Equation.3    由0.9955提高到0.9957,  EMBED Equation.3    正号,  EMBED Equation.3    负号是合理的,进行t检验  EMBED Equation.3    不显著。从经济理论分析,  EMBED Equation.3    应该是重要因素,虽然  EMBED Equation.3    与  EMBED Equation.3    高度相关,但并不影响  EMBED Equation.3    的显著性和稳定性,因此,可能是“有利变量”,暂时给予保留。
②模型中引入变量  EMBED Equation.3    ,  EMBED Equation.3    由0.9957提高到0.9959,  EMBED Equation.3    值略有提高。虽然  EMBED Equation.3    与  EMBED Equation.3    ,  EMBED Equation.3    与  EMBED Equation.3    均高度相关,但是  EMBED Equation.3    的引入对参数  EMBED Equation.3    、  EMBED Equation.3    的影响不大,  EMBED Equation.3      的符号不满意,可能是“多余变量”,暂时删除。
③舍去变量  EMBED Equation.3    ,加入变量  EMBED Equation.3    ,使  EMBED Equation.3    由0.9957提高到0.9980,  EMBED Equation.3    值改进较大,  EMBED Equation.3    、  EMBED Equation.3    、  EMBED Equation.3    均显著,从经济意义上看也是合理的。因此可以认为  EMBED Equation.3    、  EMBED Equation.3    皆为“有利变量”应给予保留。
④最后再引入变量  EMBED Equation.3    ,  EMBED Equation.3    =0.9980没有增加(或几乎没有增加),对其他三个解释变量参数系数没有多大影响,可以确定  EMBED Equation.3    是多余变量,应从模型中删除。
得到如下结论:
回归模型以  EMBED Equation.3    为最优模型。
通过上例分析可以看出,Frisch综合分析法不但可以检验多重共线性,同时也可以对多重共线性进行处理。
第三节  多重共线性的处理
一、先验信息法
先验信息法是指根据经济理论或者其他已有研究成果事前确定回归模型参数间的某种关系,将这种约束条件与样本信息综合考虑,进行最小二乘估计。运用参数间的先验信息可以消除多重共线性。
如对Cobb-Douglas生产函数进行回归估计
EMBED Equation.3     
其中Y、L、K分别表示产出、劳动力和资本
由先验信息可知劳动投入量L与资金投入量K之间通常是高度相关的,如果按照经济理论“生产规模报酬不变”的假定,则
EMBED Equation.3   
则        EMBED Equation.3                   
EMBED Equation.3                                                         
两边取对数
EMBED Equation.3                                                        (7-15)
此时上式为一元线性回归模型,不存在多重共线性问题。
二、改变变量的定义形式
在进行回归模型共线性处理时,有时要根据所分析的具体经济问题

本文发布于:2023-07-21 17:45:14,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/1109351.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   解释   共线性   模型   回归   存在   经济
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图