第十五章 定义和诊断检验
本章描述的每一检验过程包括假设检验的原假设定义。检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值(p值)。p值说明在原假设为真的情况下,样本统计量绝对值的检验统计量大于或等于临界值的概率。这样,低的p值就拒绝原假设。对每一检验都有不同假设和分布结果。
方程对象菜单的View中给出三种检验类型选择来检验方程定义。包括系数检验、残差检验和稳定性检验。其他检验,如单位根检验(13章)、Granger因果检验(8章)和Johann协整检验(19章)。
§15.1 系数检验
一、Wald检验——系数约束条件检验
Wald检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。Wald统计量计算无约束估计量如何满足原假设下的约束。如果约束为真,无约束估计量应接近于满足约束条件。
考虑一个线性回归模型:和一个线性约束:,R是一个已知的阶矩阵,r是q维向量。Wald统计量在下服从渐近分布,可简写为:
进一步假设误差独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量
是约束回归的残差向量。F统计量比较有约束和没有约束计算出的残差平方和。如果约束有效,这两个残差平方和差异很小,F统计量值也应很小。EViews显示和F统计量以及相应的p值。
假设Cobb-Douglas生产函数估计形式如下:
(1)
Q为产出增加量,K为资本投入,L为劳动力投入。系数假设检验时,加入约束。
为进行Wald检验,选择View/Coefficient Tests/Wald-Coefficient Restrictions,在编辑对话框中输入约束条件,多个系数约束条件用逗号隔开。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。
为检验规模报酬不变的假设,在对话框中输入下列约束:c(2)+c(3)=1
二、遗漏变量检验
这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用。原假设是添加变量不显著。选择View/Coefficient Tests/Omitted Variables—Likehood Ration,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。例如:原始回归为 LS log(q) c log(L) log(k) ,输入:K L,EViews将显示含有这两个附加解释变量的无约束回归结果,而且显示假定新变量系数为0的检验统计量。
三、冗余变量
冗余变量检验可以检验方程中一部分变量的统计显著性。更正式,可以确定方程中一部分
变量系数是否为0,从而可以从方程中剔出去。只有以列出回归因子形式,而不是公式定义方程,检验才可以进行。
选择View/Coefficient Tests/Redundant Variable—likelihood Ratio,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开。例如:原始回归为: Ls log(Q) c log(L) log(K) K L,如果输入K L,EViews显示去掉这两个回归因子的约束回归结果,以及检验原假设(这两个变量系数为0)的统计量。
§15.2 残差检验
一、相关图和Q—统计量
在方程对象菜单中,选择View/Residual Tests/Correlogram-Q-Statistics,将显示直到定义滞后阶数的残差自相关性和偏自相关图和Q-统计量。在滞后定义对话框中,定义计算相关图时所使用的滞后数。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。
二、平方残差相关图
选择View/Residual Tests/Correlogram Squared Residual,在打开的滞后定义对话框,定义计算相关图的滞后数。将显示直到任何定义的滞后阶数的平方残差的自相关性和偏自相关性,且计算出相应滞后阶数的Q-统计量。平方残差相关图可以用来检查残差自回归条件异方差性(ARCH)。见下面ARCH LM检验。如果残差中不存在ARCH,在各阶滞后自相关和偏自相关应为0,且Q统计量应不显著。
三、直方图和正态检验
选择View/Residual Tests/Histogram Normality,将显示直方图和残差的描述统计量,包括检验正态性的Jarque-Bera统计量。如果残差服从正态分布,直方图应呈钟型,J-B统计量应不显著。
四、序列相关LM检验
选择View/Residual Tests /Serial correlation LM Test定义AR或MA最高阶数。这一检验可以替代Q-统计量检验序列相关。属于渐近检验(大样本)一类,被称为拉格朗日乘数(LM)检验。与D-W统计量仅检验AR(1)误差不同,LM检验可应用于检验高阶ARMA误差,
而且不管是否有滞后因变量均可。因此,当我们认为误差可能存在序列相关时,更愿意用它来进行检验。LM检验原假设为:直到p阶滞后,不存在序列相关。
五、ARCH LM检验
Engle(1982)提出对残差中自回归条件异方差(Autoregressive Conditional Heteroskedasticity, ARCH)进行拉格朗日乘数检验 (Lagrange multiplier test),即 LM检验。选择View/Residual Tests/ARCH LM Tests进行检验,定义要检验的ARCH阶数。ARCH LM检验统计量由一个辅助检验回归计算。为检验原假设:残差中直到q阶都没有ARCH,运行如下回归:
式中e是残差。这是一个对常数和直到q阶的滞后平方残差所作的回归。F统计量是对所有滞后平方残差联合显著性所作的检验。Obs*统计量是LM检验统计量,它是观测值数乘以检验回归。
六、White异方差性检验
White (1980) 提出了对最小二乘回归中残差的异方差性的检验。包括有交叉项和无交叉项两种检验。White检验是检验原假设:不存在异方差性。检验统计量通过一个辅助回归来计算。利用回归因子所有可能的交叉乘积对残差做回归。例如:假设估计如下方程
式中b估计系数,e是残差。检验统计量基于辅助回归:
F统计量是对所有交叉作用(包括常数)联合显著性的检验。
选择view/Residual test/White Heteroskedasticity进行White’s异方差检验。EViews对检验有两个选项:交叉项和没有交叉项。有交叉项包括所有交叉作用项。但如果回归右边有许多变量,交叉项的个数会很多,所以把它们全包括在内不实用。无交叉项选项仅使用回归因子平方进行检验回归。
§15.3 定义和稳定性检验
EViews提供了一些检验统计量选项,它们检查模型参数在数据的不同子区间是否平稳。一个推荐的经验方法是把观测值区间T分为T1和T2两部分。T1个观测值用于估计,T2个观测值用于检验和评价。把所有样本数据用于估计,有利于形成最好的拟合,但没有考虑到模型检验,也无法检验参数不变性,估计关系的稳定性。检验预测效果要用估计时未用到的数据,建模时常用T1区间估计模型,用T2区间检验和评价效果。例如居民收入,企业的销售,或其他指标,留下一部分样本进行检验。对于子区间T1和T2的相对大小,没有太明确的规则。有时可能会出现明显的结构变化的转折点,例如战争,石油危机等。当看不出有转折点时,常用的经验方法是用85%-90%的数据作估计,剩余的数据作检验。EViews提供了现成方法,进行这类分析很方便。
一、Chow分割点检验
分割点Chow检验的思想是把方程应用于每一个子样本区间,看看估计方程中是否存在显著差异。显著差异说明关系中有结构变化。为了进行Chow间断点检验,选择View/Stability Tests/Chow Breakpoint Test…出现对话框以后,填入间断点的日期。原假设:不存在结构变化。
二、Chow预测检验
Chow预测检验先估计了包括T1区间子样本的模型,然后用估计的模型去预测在剩余的T2区间样本的因变量的值。如果真实值和预测值差异很大,就说明模型可能不稳定。检验适用于最小二乘法和二阶段最小二乘法。原假设为无结构变化。选择View/Stability Test /Chow Forecast Test进行Chow预测检验。.对预测样本开始时期或观测值数进行定义。数据应在当前观测值区间内。
三、RESET Test
由Ramy(1969)提出RESET方法,即回归定义错误检验(Regression Specification Error Test)。古典正态线性回归模型定义如下:。扰动项服从多元正态分布。序列相关,异方差性,非正态分布都违反了扰动项服从多元正态分布的假设。存在以上这样的定义错误,LS估计量会是有偏的且不一致,一般推断方法也将不适用。Ramy说明:任一或所有上述定义错误对产生一个非零均值向量。因此,RESET检验原假设和被选假设为: ; ()。检验基于一个扩展回归方程:。建立检验的关键问题是决定什么变量应记入z矩阵。Ramy建议把因变量预测值的乘方(这是解释变量乘方和互乘项的线性组合)计入z,特别的,建议:。是y对X回归的拟合值向量。上标说明乘方阶数。一阶没有包括在内,因为它与X矩阵完全共线性。
选择View/stability tests/Ramy RESET test进行检验,定义检验回归中要包括的拟合项数。拟合项是原始回归方程拟合值的乘方。如果定义一个很大的拟合项数,EViews将显示一个近似奇异矩阵误差信息,这是因为拟合项的乘方很可能高度共线。Ramy RESET检验仅应用于LS估计的方程。
四、递归最小二乘法
在递归最小二乘法中,方程使用样本数据大子区间进行重复估计。如果在向量b中有k个系数要估计,那么前k个观测值就被用于形成对b的第一次估计。这一估计重复进行,直到T个样本点都被使用,产生对b向量的T-k+1个估计值。在每一步中,b的最后一个估计值可以用来预测因变量的下一个值。这一预测过程的一步超前预测误差,被定义为递归误差。选择View/stability tests/Recursive Estimate(OLS only)计算递归残差,递归估计仅适用于没有AR和MA项的OLS估计方程。如果模型有效,递归残差将独立且服从零均值,常数方差的正态分布。