一、我对几种面板数据模型的理解
1混合效应模型 pooled model
就是所有的省份,都是相同,即同一个方程 ,截距项和斜率项都相同
yit =c+bxt mmk+?it c与b都是常数
2固定效应模型fixed-effect model 和随机效应模型random-effects model
就是所有省份,既有相同的部分,即斜率项都相同;也有不同的部分,即 截距项不同。
2.1固定效应模型 fixed-effect model
yit =a+bx, +? it cov(c i,x 化)工 0
固定效应方程隐含着跨组差异可以用常数项的不同刻画。每个 ai都被视
为未知的待估参数。Xit中任何不随时间推移而变化的变量都会模拟因个体而已 的常数项
2.2随机效应模型 random-effects model
yit =a+u +bxt +? it cov(a+u i ,x tmd是什么it )=0
A是一个常数项,是不可观察差异性的均值, ui为第i个观察的随机差异
性,不随时间变化。
3变系数模型Variable Coefficient Models( 变系数也分固定效应和随机效应)
每一个组,都采用一个方程进行估计。就是所有省份的线性回归方程的 截距项和斜率项都不相同。
yit =u+biXit +? it
1.混合估计模型就是各个截面估计方程的截距和斜率项都一样,也就是 说回归方程估计结果在截距项和斜率项上是一样的。 如果是考察各个省份,历年 的收入对消费影响。则各个省份的回归方程就完全相同,无论是截距,还是斜率。
2.随机效应模型和固定效应模型在斜率项都是相同的, 都是截距项不同。 区别在于截距项和自变量是否相关, 不相关选择随机效应模型,相关选择固定效 应模型。则说明各个省份
的回归方程,斜率相同,差别的是截距项,即平移项。
3.变系数模型,就是无论是截距项,还是系数项,对于不同省份,每 个省份都有一个回归方程,都一个最适合自己的回归方程,完全不管整体。每个 省份的回归方程与其他省份的,无论在斜率上,还是截距上都不相同。
总之,从混合估计模型,到变截距模型,再到变系数模型,考察省份是 从完全服从整体和没有个性(回归方程是从整体角度而定的和估计的, 是一刀切
的,是完全没有差异性和个性的,完全牺牲自我),到随心所欲和完全个性化(每 个省份都有一个最适合自己的回归方程)。即从完全无个性而言到完全有个性 。
二、一个做医学哥们在固定效用模型和随机效用模型选择中的甄别方法
关于随机效应模型及固定效应模型的选择, 一贯做法是两个模型都分析,
看结果是否一致。如果一致且异质性较小或无,则选择固定效应模型。
如果结果不一致且异质性较大,则选择随机效应模型,并进行亚组分析寻
找异质性的来源,并且下结论应比较保守。
好几篇 meta-analysis 在方法学部分都说:“All pooled outcome measures were determined using random-effects models ” 、"All pooled outcome
measures were determ ined using ran dom-effects models as described by
DerSim onian and Laird" 。
为什么都直接用随机效应模型却不用固定效应模型?是因为考虑 RCTs异
质性大,所以直接用随机效应模型吗?
ncre1.就是根据12值来决定模型的使用,大部分认为〉50%存在异质性,使 用随机效应模型,w 50%用固定,有了异质性,通过敏感性分析,或者亚亚组 分析,去探求异质性的来源,但是这两者都是定性的,不一定能找到,即使你做
了,研究数目多的话,可以做个 meta回归来找异质性的来源
2.在任何情况下都使用随机效应模型, 因为如果异质性很小,那么随即
和固定效应模型最终合并结果不会有很大差别, 当异质性很大时,就只能使用随
机效应模型,所以可以说,在任何情况下都使用随机效应模型
3.还有一种,看P值,一般推荐P的界值是0.1,但现在大部分使用0.05,
就是说P>0.05,用固定,w 0.05用随机
其实个人偏向于第三种,因为 P值可以看出来有没有异质性,12是定量 描述一致性的大小
本来随机效应的假设就是我们的样本从一个很大的母体抽取, 所以大家的期
望(均值)相同;如果我们的样本几乎是全部母体了,我们就不能说个体的差异 是随机的,所以固定效应比较好;这是从模型的设定角度说的。但是随机效应模 型有一个致命的硬伤,就是假设cov (x,ui ) =0,而固定效应不要求这个假设, Hausman佥验所做的工作就是检验一下这个假设对随机效应模型来说是不是成 立,如果不成立,随即效应模型的估计是有偏的, 即使采用B-P布什演讲的LM检验表明
存在随机效应,你也没有办法用了。
总结:检验固定效应是否显著, 采用F助长检验(对比模型是pooled );检验 随机效应是否显著,采用LM检验(对比模型也是pooled lookinto);检验固定和随机哪 个更适用,采用Hausmar可爱妆容检验(对比fe和be)。
1男衣服的穿配法用eviews可以检验面板数据适用于混合估计法还是固定效应法
2然后再进行豪斯曼检验,确定是用固定效应模型还是随机效应模型
三、是选择固定效应模型,还是随机效应模型的 Hausman test
Hausman test是为了区分是选择固定效应模型,还是选择随机效应模 型的计算。并且Hausmantest是针对随机效应模型进行的检验,原假设是接受 随机效应模型。
A Hausman test说明一个有效的估计与它和一个非有效的估计之差的协 方差是 0。即卩 Cov(b-b,b)=Cov(b,b)-var(b)=0
B原假设是随机效应模型有效,备选假设是固定效应模型有效
C根据随机效应模型有效构造的统计量 南极星翻译W服从自由度为k-1的有限卡方分布。 即 欺负的读音var(b-b)=v
ar(b)-var(b)=W
四、处理异方差问题
实际上,在处理面板数据线性回归时, 主要考虑固定效应模型与 pooled OLS的异方差
问题。因为随机效应模型使用 GLS估计,本身就已经控制了异方差。
GLS(广义最小二乘法)是一种常见的消除异方差的方法 •它的主要思想是为解释变量加
上一个权重,从而使得加上权重后的回归方程方差是相同的 •因此在GLS方法下我们可以得
到估计量的无偏和一致估计 ,并可以对其进行 OLS下的t检验和F检验.