时间固定效应和个体固定效应的选择_【⼗分钟计量经济学】⾯板数据选择固定效应还是随机效应...
对⼏种⾯板数据模型的理解
1、 混合效应模型 pooled model
就是所有的省份,都是相同,即同⼀个⽅程 ,截距项和斜率项都相同
yit=c+bxit+ᵋit c 与b 都是常数
2 、固定效应模型fixed-effect model 和随机效应模型random-effects model
就是所有省份,既有相同的部分,即斜率项都相同;也有不同的部分,即截距项不同。
2.1 固定效应模型 fixed-effect model
yit=ai+bxit+ᵋit cov(ci,xit)≠0
固定效应⽅程隐含着跨组差异可以⽤常数项的不同刻画。每个ai都被视为未知的待估参数。xit中任何不随时间推移⽽变化的变量都会模拟因个体⽽已的常数项
2.2 随机效应模型 random-effects model
yit=a+ui+bxit+ᵋit cov(a+ui,xit)=0
A是⼀个常数项,是不可观察差异性的均值,ui为第i个观察的随机差异性,不随时间变化。
3 、变系数模型Variable Coefficient Models(变系数也分固定效应和随机效应)
每⼀个组,都采⽤⼀个⽅程进⾏估计。就是所有省份的线性回归⽅程的截距项和斜率项都不相同。
yit=ui+bixit+ᵋit
1.混合估计模型就是各个截⾯估计⽅程的截距和斜率项都⼀样,也就是说回归⽅程估计结果在截距项和斜率项上是⼀样的。如果是考察各个省份,历年的收⼊对消费影响。则各个省份的回归⽅程就完全相同,⽆论是截距,还是斜率。
2.随机效应模型和固定效应模型在斜率项都是相同的,都是截距项不同。区别在于截距项和⾃变量是否相关,不相关选择随机效应模型,相关选择固定效应模型。则说明各个省份的回归⽅程,斜率相同,差别的是截距项,即平移项。
3 .变系数模型,就是⽆论是截距项,还是系数项,对于不同省份,每个省份都有⼀个回归⽅程,都⼀个最适合⾃⼰的回归⽅程,完全不管整体。每个省份的回归⽅程与其他省份的,⽆论在斜率上,还是截距上都不相同。
总之,从混合估计模型,到变截距模型,再到变系数模型,考察省份是从完全服从整体和没有个性(回归⽅程是从整体⾓度⽽定的和估计的,是⼀⼑切的,是完全没有差异性和个性的,完全牺牲⾃我),到随⼼所欲和完全个性化(每个省份都有⼀个最适合⾃⼰的回归⽅程)。即从完全⽆个性⽽⾔到完全有个性。
在固定效⽤模型和随机效⽤模型选择中的甄别⽅法
关于随机效应模型及固定效应模型的选择, ⼀贯做法是两个模型都分析,看结果是否⼀致。如果⼀致且异质性较⼩或⽆,则选择固定效应模型。
如果结果不⼀致且异质性较⼤,则选择随机效应模型,并进⾏亚组分析寻找异质性的来源,并且下结论应⽐较保守。
好⼏篇meta-analysis在⽅法学部分都说:“All pooled outcome measures were determined using random-effects models” 、"All pooled outcome measures were determined using random-effects models as described by DerSimonian and Laird"。
为什么都直接⽤随机效应模型却不⽤固定效应模型?是因为考虑RCTs异质性⼤,所以直接⽤随机效应模型吗?
1.就是根据I2值来决定模型的使⽤,⼤部分认为>50%,存在异质性,使⽤随机效应模型,≤50%,⽤固定,有了异质性,通过敏感性分析,或者亚亚组分析,去探求异质性的来源,但是这两者都是定性的,不⼀定能找到,即使你做了,研究数⽬多的话,可以做个meta回归来找异质性的来源
2.在任何情况下都使⽤随机效应模型,因为如果异质性很⼩,那么随即和固定效应模型最终合并结果不会有很⼤差别,当异质性很⼤时,就只能使⽤随机效应模型,所以可以说,在任何情况下都使⽤随机效应模型
3.还有⼀种,看P值,⼀般推荐P的界值是0.1,但现在⼤部分使⽤0.05,就是说P>0.05,⽤固定,≤0.05⽤随机
其实个⼈偏向于第三种,因为P值可以看出来有没有异质性,I2是定量描述⼀致性的⼤⼩
本来随机效应的假设就是我们的样本从⼀个很⼤的母体抽取,所以⼤家的期望(均值)相同;如果我们的样本⼏乎是全部母体了,我们就不能说个体的差异是随机的,所以固定效应⽐较好;这是从模型的设定⾓度说的。但是随机效应模型有⼀个致命的硬伤,就是假设
cov(x,ui)=0,⽽固定效应不要求这个假设,Hausman检验所做的⼯作就是检验⼀下这个假设对随机效应模型来说是不是成⽴,如果不成⽴,随即效应模型的估计是有偏的,即使采⽤B-P的LM检验表明存在随机效应,你也没有办法⽤了。
总结:检验固定效应是否显著,采⽤F检验(对⽐模型是pooled);检验随机效应是否显著,采⽤LM检验(对⽐模型也是pooled);检验固定和随机哪个更适⽤,采⽤Hausman检验(对⽐fe和be)。
1 ⽤eviews可以检验⾯板数据适⽤于混合估计法还是固定效应法
2 然后再进⾏豪斯曼检验,确定是⽤固定效应模型还是随机效应模型
是选择固定效应模型,还是随机效应模型的Hausman test
Hausman test 是为了区分是选择固定效应模型,还是选择随机效应模型的计算。并且Hausman test 是针对随机效应模型进⾏的检验,原假设是接受随机效应模型。
A Hausman test说明⼀个有效的估计与它和⼀个⾮有效的估计之差的协⽅差是0。即Cov(b-b,b)=Cov(b,b)-var(b)=0
B 原假设是随机效应模型有效,备选假设是固定效应模型有效
C 根据随机效应模型有效构造的统计量W服从⾃由度为k-1的有限卡⽅分布。即var(b-b)=var(b)-var(b)=W
处理异⽅差问题
实际上,在处理⾯板数据线性回归时,主要考虑固定效应模型与pooled OLS的异⽅差问题。因为随机效应模型使⽤GLS估计,本⾝就已经控制了异⽅差。
GLS(⼴义最⼩⼆乘法)是⼀种常见的消除异⽅差的⽅法.它的主要思想是为解释变量加上⼀个权重,从⽽使得加上权重后的回归⽅程⽅差是相同的.因此在GLS⽅法下我们可以得到估计量的⽆偏和⼀致估计,并可以对其进⾏OLS下的t检验和F检验.
⽂章来源:计量经济学 CSDN博客