第二讲 面板数据回归模型
2.1面板数据回归模型的一般形式 面板数据模型的一般形式如下:
it K
k kit ki it u x y +=∑=1
β (2.1)
其中,N ,,,,i "321=,表示N 个个体;T ,,,,t "321=,表示已知的T 个时点。it y 是被解释变量对个体i 在t 时的观测值;kit x 是第k 个非随机解释变量对于个体i 在t 时的观测值;ki β是待估计的参数;it u 是随机误差项。用矩阵表示为
i i i i =+Y X βU (N ,,,,i "321=) (2.1’)
其中,12
1i i i iT T y y y ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#Y ,11
21112
22
212i i Ki i i Ki i iT
iT
KiT T K x x x x x x x x x ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦""##"#"X , 121×⎥
⎥
⎥⎥⎦⎤
⎢⎢⎢⎢⎣⎡=K Ki i i i βββ#β,121
i i i
iT T u u u ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#U .
2.2 面板数据回归模型的分类
通常,对模型(2.1)将做许多限制性假设,使其成为不同类型的面板数据回归模型。一般来说,常用的面板数据回归模型有如下九种模型,下面分别介绍它们。
1混合回归模型
从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起,用普通最小二乘法(OLS )估计参数。即估计模型
12K
it k kit it k y x u ββ==++∑ (2.2)
=+Y X U β (2.2’)
其中,121N NT ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#Y Y Y Y ,12N NT K
×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#X X X X ,12
1×⎥
⎥
⎥⎥
⎦⎤
⎢⎢⎢⎢⎣⎡=K K βββ#β,121N NT ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#U U U U .
实际上,混合回归模型(Pooled Regression Models )假设了解释变量对被解释变量的影响与个体无关。关于参数的这种假设被广泛应用,但是,在许多问题的研究中,混合回归模型并不适用(Maires & Griliches ,1990)。
2 固定效应模型
在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此种模型为固定效应模型(fixed effects regression model )。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时点固定效应模型(time fixed effects regression model )和时点个体固定效应模型(time and entity fixed effects regression model )。
(1)个体固定效应模型
个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型
2
K
it i k kit it k y x u λβ==++∑ (2.3)
或者表示为矩阵形式
()N T =⊗++Y I X U ιλβ (2.3’)
其中,N T ⊗I ι是N 阶单位矩阵N I 和T 阶列向量()11'
T ,,="ι的克罗内克积,
121N N λλλ×⎡⎤⎢⎥
⎢⎥=⎢⎥
⎢⎥
⎣⎦#λ,()21
31122
322231i i Ki i i Ki i iT iT KiT T K x x x x x x x x x ×−⎡⎤⎢⎥⎢⎥=⎢⎥
⎢⎥⎣⎦""##"#"X ,()121N NT K ×−⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#X X X X ,()2311
K K βββ−×⎡⎤
⎢⎥⎢⎥=⎢⎥⎢⎥
⎣⎦#β. (2)时点固定效应模型
时点固定效应模型就是对于不同的截面(时点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时间固定效应模型
it K
k kit k t it u x y ++=∑=2
βγ (2.4)
其矩阵表示为
()N T =⊗++Y I X U ιγβ (2.5)
其中,T N I ⊗ι是N 阶列向量()'
N ,,11"=ι和T 阶单位矩阵T I 的克罗内克积,
12
1T T γγγ×⎡⎤
⎢⎥
⎢⎥=⎢⎥
⎢⎥⎣⎦#γ,()2131122
322231i i Ki i i Ki i iT iT KiT T K x x x x x x x x x ×−⎡⎤⎢⎥⎢⎥=⎢⎥
⎢⎥⎣⎦""##"#"X ,()121N NT K ×−⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#X X X X ,()2311
K K βββ−×⎡⎤
⎢⎥⎢⎥=⎢⎥⎢⎥
⎣⎦#β. (3)时点个体固定效应模型
时点个体固定效应模型就是对于不同的截面(时点)、不同的时间序列(个体)都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著地不相同,那么应该建立时点个体固定效应模型,表示如下,
2
K
it i t k kit it k y x u λγβ==+++∑ (2.6)
其矩阵表示为
()()N T N T =⊗+⊗++Y I I X U ιλιγβ
(2.7) 其中,N ,,,,i "321=,表示N 个个体;T ,,,,t "321=,表示已知的T 个时点。
实际上,如果模型(2.1)中存在缺失了随时点或个体变化的不可观测的重要确定性解释变量,则在模型中应该引入虚拟变量,设定模型为固定效应模型。
对于固定效应模型可以采用在模型中加虚拟变量的方法估计回归参数,并称这种回归为最小二乘虚拟变量(The Least Square Dummy Variable )回归,简记为LSDV 回归。也可以采用广义最小二乘法的协方差分析(Analysis of Covariance )法估计固定效应模型参数,简记为ANCOVA 回归。
3 随机效应模型 如果模型
it K
k kit k it u x y ++=∑=2
1ββ (2.8)
中缺失了分别随个体和时间变化的不可观测随机性因素时,可以通过对误差项的
分解来描述这种信息的缺失,即,将模型误差项分解为3个分量
it i t it u u v w =++ (2.9)
其中,u i ,v t 和w it 分别表示个体随机误差分量、时间随机误差分量和混合随机误差分量。同时,还假定u i ,v t ,w it 之间互不相关,各自分别不存在截面自相关、时间自相关和混合自相关。这时,模
型(2.1)被称为随机效应模型或误差分解模型。对于误差分解模型可以采用广义最小二乘法(GLS )估计模型参数。
4 确定系数面板数据模型
在面板数据模型(2.1)中,如果解释变量对被解释变量的影响随着个体的变化是不同的确定性参数时,称模型(2.1)为确定系数面板数据模型。
确定系数面板数据模型的矩阵形式为Zellner (1962)的似不相关回归模型(Seemingly Unrelated Regressions )
=+Y X U β (2.10)
其中,1
2
000
00
0N NT NK
×⎡⎤⎢⎥⎢
⎥=⎢⎥
⎢⎥⎣⎦"
"##%#X X X X ,121i i i ki K βββ×⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦#β,121N KN ×⎡⎤
⎢⎥⎢⎥=⎢⎥⎢⎥
⎣⎦#ββββ 5 随机系数面板数据模型
面板数据模型(2.1)揭示了不同个体的相同经济现象,于是,如果N 个个体是从某个总体随机抽取的一个样本时,面板数据模型(2.1)的参数列向量i β就是随机向量。另外,如果个体间是空间相关时,面板数据模型(2.1)的N 个参数列向量的集合{}12i |i ,,,N ="β可以被看成是同一个总体的N 个样本。这时,称面板数据回归模型(2.1)为随机系数回归模型(Random Coefficient Regression Model ),即,
i i =+ββv (12i ,,,N =")
其中,β是固定向量,i v 是零均值的随机向量。
从而,面板数据模型(2.1)可以表示为
()i i i i =++Y X v U β
i i i =+Y X W β (2.11)
其中,i i i i =+W X v U 。
这样,利用广义最小二乘法估计模型(2.11)得到的估计量
()()111ˆ=''−−−β
ΩΩX X X Y 比混合回归模型(2.2)的估计量更有效,其中,Ω是⎛⎞
⎜⎟⎜
⎟=⎜⎟⎜⎟⎝⎠
#1N W W W W 的方差协方差矩阵。
有关面板数据静态回归模型的分类和模型设定可用图2.1概括。
图 2.1 线性面板数据模型概述