经济学家发展和评价了关于经济行为的理论。假设检验程序被用来检验他们
的理论。在第7章,我们发展和应用了单个假说t假设检验。,我们在这一章遇到
的一个重要的新发展是使用F分布同时检验一个由两个或更多的关于多元回归
模型中的参数的零假设。
8.6模型假定
在所有到目前为止已经涉及到的内容中,我们通常把模型当作已给出。现在
已经是下列几种问题:给定一个特殊的回归模型,估计其参数的最好方法是什么?
给定一个特定的模型,我们如何检验关于模型参数的假设?我们如何构建一个模
型参数的区间估计?在给定的模型中,估计量的性质是什么?考虑到所有这些问
题需要模型的知识,自然会问该模型从何而来。在任何计量调查中,模型的选择是
第一步骤之一。因此,在这部分里,我们集中考虑以下几个问题:当选择模型时什
么是重要的考量?选择错误的模型会有什么后果?有没有评估的一个模型是否
可行的方法?
模型选择的三个必要的特征是:(1)模型函数形式的选择,(2)包括在该模
型中的解释变量(解释量)的选择;(3)多元回归模型的假设是否支持
MR1-MR6,在150页。在后面的章节中,关于异方差存在性,自相关性,随机
的解释变量解决了这些假设的错误。对于函数式和解释变量的选择,经济原则
和逻辑推理发挥了十分显著和重要的作用。我们要问:什么变量会可能影响因
变量y?这些变量改变时y怎样变动?以一种恒定的速率变动吗?以一个持续
降低的速率变动吗?在整个数据的变动中,认为常数弹性合理吗?这些问题的
答案在解释变量的选择以及选择合适的函数形式上有一些关系。在章节6.3
的一些细节中替代功能的函数形式被采用;在第10章进一步的问题被重视。
在接下来的部分里,我们考虑到选择一系列错误的解释变量的后果和关于解释
变量的选择的一些问题。在这一节,错误假定的试验被证明。
8.6.1遗漏和不相关变量
即使有健全的经济原则和逻辑,一个被选择的模型可能有遗漏或不相关的变
量包括在内的重要变量,这是有可能的。为介绍遗漏变量问题,假设在某个特定
的行业,雇员的工资率为
t
W,取决于他们的经验
t
E和他们的动机
t
M,以至我们
可以写成
123tttt
WEMe(8.6.1)
然而,有关动机的数据都是无效的。所以,相反,我们估计模型
12ttt
WE(8.6.2)
通过估计(8.6.2),当它不真时我们将限制条件限制为
3
0。强加一个错误的
限制的含义已在8.5部分讨论过。对
1
和
2
的最小二乘估计通常是有偏见的,虽
然它有较低的方差。当它不是有偏的时候就是当遗漏变量(
t
M)与被包括变量之
间(
t
E)不相关时。然而不相关的解释变量是很少见的。遗漏变量有偏的一种证
明在本部分后面会给出。
遗漏变量有偏的可能性意味着要试图包括所有重要相关变量。这也意味着,
如果一个被估计方程含有具有没预期到的意义的系数,或不切实际的数量,这些
奇怪的结果的一个可能的原因是遗漏重要变量。
评价一个变量或一组变量是否应该包含在一个方程里的一种方法是完成“有
意义的检验’’。这就是用t检验检验如
0
H:
3
0这样的假设,或F检验检
验比如
0
H:
34
0的假设。可是,重要的是要记住,有两种不丢弃零原假设
的测试结果的可能的原因。
1.相应的变量没有影响y,并且可以排除出模型。
2.相应的变量是该模型的重要的必须出现的变量,但数据
没有足够好以致拒绝
0
H。也就是说,数据并不足够充分证实变量都是十分重要
的。(缺少数据的可能原因将在8.7讨论。)
因为一个系数的“无意义”可能是由(1)或(2)引起的,你必须谨慎地考虑下
面的规则,去掉具有毫无意义系数的变量。你可以排除无关的变量,但你也可以在
余下的系数估计里包括有偏遗漏变量。
省略相关变量的后果可能导致你认为一个好的办法就是在你的模型里尽可
能包括许多变量。然而,这样做不仅会使模型复杂化,因为不相关变量的存在它
可能扩大你的估计方差。看清楚何谓不相关的变量,假设正确的格式
123tttt
WEMe(8.6.3)
但是我们估计模型为
1234ttttt
WEMCe
其中
t
C是第t个员工的孩子总数,并且实际上
4
0。
t
C是一个不相关的变量。
包括它不会使最小二乘估计有偏,但它意味着
1
b,
2
b和
3
b将会比通过估计正确的
模型(8.6.3)获得的数好。这个结果合理,因为根据高斯-马克连夫定理,(8.6.3)
的最小二乘法估计量是
1
,
2
,和
3
的最小方差线性无偏估计量。如果
t
C和
t
E、
t
M不相关方差的扩大不会出现。但是注意,即使孩子人数是不太可能影响工资率,
但它可以与经验相关联。
遗漏变量和不相关的变量估计后果是在评价实证结果时要记住的一些东西。
他们也要重新指向我们原来的建议:经济原则和逻辑推理是变量选择的重要考虑
因素。
8.6.1遗漏变量偏差:一个证明
假设我们无意中遗漏一个回归模型的变量。那就是,假定真实模型是
123
yxhe,但我们估计模型
12
yxe,从模型中遗漏了h。然后
我们用此估计量
*
223
22
()()()
()()
tttt
tttt
tt
xxyyxxy
bwhwe
xxxx
其中
2()
t
t
t
xx
w
xx
所以,*
2232
()
tt
Ebwh
进一步观察,我们发现
222
()()()()()(1)
cov(,)
()()()(1)
var()
tttttt
tt
tt
ttt
t
xxhxxhhxxhhT
xh
wh
xxxxxxT
x
因此,*
2232
cov(,)
()
var()
tt
t
xh
Eb
x
明白
3
的标志和
t
x和
t
h的协方差的符号告诉我们有偏的方向。同样的,尽管
遗漏回归的一个变量通常使最小二乘估计量有偏,如果
t
x和遗漏变量
t
h之间的样
本协方差,或样本之间的相关性是零,则在错误假定模型中的最小二乘估计量仍
然是无偏的。
8.6.2错误假定模型的检验:RESET检验
计量模型的误设检验是一个问的方式:我们的模型足够吗,还是我们可以提高
它吗?如果我们漏掉重要变量,包括无关的变量,选择错误的函数形式,或有一个
违反多元回归模型假设的模型,它可能是误设的。RESET检验(回归设定错误检
验)是用来检测遗漏变量和不正确的函数形式。该推理如下。
假设我们已经指定和估计出回归模型
12233tttt
yxxe(8.6.4)
让(
123
,,bbb)作为最小二乘估计值并且让
12233ttt
ybbxbx
(8.6.5)
作为
t
y的被预测值。考虑以下两个人工模型
2
122331ttttt
yxxye
(8.6.6)
23
1223312tttttt
yxxyye
(8.6.7)
在(8.6.6)中,模型误设的检验是
01
:0H对应备择假设
11
:0H的一个检验。
在(8.6.7)中,检验
012
:0H对应
11
:0H或者
2
0是模型误设的一
种检验。在头一种情况下一个t或一个F检验可以被使用。第二个方程需要F
检验。拒绝
0
H表示原模型是不充分的,是可以改进的。拒绝
0
H的失败表示此检
验已经不能够检测到任何模型误设。
此检验背后的思想是一种通用的一个测试。注意,
2
t
y
和
3
t
y
将是
2t
x和
3t
x的
多项式函数。因此,如果原模型不是正确的函数形式,包括
2
t
y
和
3
t
y
在内的多项式
逼近可以大大改善模型的适度,并且这个事实将可以通过
1
和
2
的非零值被检测
到。此外,如果我们遗漏变量,这些变量和
2t
x与
3t
x相关,则它们的一些影响也许会
通过
2
t
y
和
3
t
y
被检测到。总的来说,检验的一般道理是:如果我们能由人为地包
括模型预测的能力明显改善模型,则原模型一定是不充分的。
作为检验的一个例子,考虑在8.5节啤酒需求的例子来说明非样本信息的加
入。我们早前指定的log-log模型
12345
ln()ln()ln()ln()ln()
t
tBtLtRtmt
qppppe(8.6.8)
估计该模型,然后用预测量的平方和立方,RESET检验结果扩大它,列在表
8.4的上半部分里。F值是非常小的,和相应的0.93和0.70得p值都远高于传
统意义的显著性水平0.05。没有RESET检验的证据显示log-log模型是不充分
的。
现在,假设我们已经指定了一个线性模型来代替log-log模型。也就是说,我们估
计模型
12345
t
tBtLtRtmt
qppppe(8.6.9)
用平方项扩展该模型,然后预测量
t
q
的平方和立方服从表8.4的下半部分的
RESET检验结果。0.0066和0.0186的p值都低于0.05表明线性模型是不适当的。
你应该用你的电脑软件复制表8.4里的实验结果。当这样做时,注意我们没有
包括关于在8.5节里用到的系数的非样本限制。较容易的比较两个函数形式被遗
漏了。你也应该知道,作为一个在可供选择的函数形式之间的有偏见的设计,
RESET检验不总是产生这样明确的结果。例如,对于一个线性模型和log-log模
型不被拒绝是可能的。
8.7共线性经济变量
大多数用于估计经济关系的经济数据是非实验性的。的确,在大多数情况下,
他们被简单的“收集”为行政或其他用途。因此,数据不是一个有计划的实验设
计被指定为了解释变量的实验的结果。在严密控制的实验里,在第一章中讨论的
那样,统计模型里等式右边部分的变量可以被指定值,以这样一种方式使得它们
的各自影响可以精确识别和估计。当数据是一个不可控的实验的结果时,很多经
济变量可以以系统的方式一起移动。这些变量被称为是共线性的,问题被标志为
共线性问题,或者当涉及几个变量时称为多元共线性。在这种情况下没有保证数
据含有“丰富的信息”,也不认为它将可能隔离经济关系或利率参数。
作为一个例子,考虑海湾地区快餐市场营销经理面对问题,他们试图估计总财
政收入的增长归因于出现在报纸上的广告和优惠券广告。假设它用普通行为去协
调这两个广告设计,以便在同一时间出现在报纸上刊登广告,有传单分发式含有
优惠券降低汉堡包价格。如果测量关于这两种形式广告的支出的变量出现在像
(7.1.2)总收入方程的右边,则这些变量的数据将显示一个系统的、积极的关系;
直观上看,这种数据揭示这两种类型的广告的独自影响很困难。因为这两种类型
的广告费用一起变动,很难分类出它们对总收入的独立影响。
作为另一个例子,把一个解释产出量随时间变化的生产关系看作一个不同投
入量的函数。有影响产量的主要因素(投入),如劳动和资本,以相对固定比例生
产。当产量增加时,两个或更多因素的数量,这样投入反映了比例的增加。变量之
间的比例关系是共线的系统关系。“任何测量来自这些数据的投入的不同混合的
各自或者独立的影响(边际产量)的努力都是很难的。
我们也应该注意这一点,不是数据样本中的变量之间的关系使得难以孤立一
个经济或统计模型中各自解释变量的独立影响。当解释变量的值在数据样本中不
改变或不改变太多时一个相关的问题出现了。当一个解释变量表现出很小的变
化,这时很难摆脱它的影响。7.3.1节中,我们注意到在一个变化里更多的变化
是事情的另一面,它导致估计不精确。这个问题也属于“共线性问题。”
8.7.1共线性问题的结果
在计量经济学模型中解释变量之间的共线性关系的结果可以概括如下:
1.每当解释变量之间有一个或更多确切的的线性相关关系,精确的共线性,或
者准确的多元共线性的条件是存在的。在这种情况下,最小二乘估计是未定义的。
我们不能得到
k
使用最小二乘法原理的估计。(7.3.1)表明这一点。例如,如果
2t
x和
3t
x有一个确切的线性关系,那么他们之间的相关性是
23
1r,
2
b的方差是
未定义的,因为0出现在分母中。同样
2
b和
3
b的协方差和公式是正确的。
2.当解释变量中近乎精确线性依赖关系存在时,一些最小二乘估计量的方差,标
准误差,和协方差可能很大。我们已注意到7.3.1章节中,有高度的相关性的两
个解释变量的估计方差的影响。最小二乘估计量的较大标准差意味着很高的样本
差异性,在样本或模型说明中估计的系数是不稳定的,有较小的变化,区间估计
宽,且关于未知参数的样本数据相对地提供不精确信息。
3。当估计量标准差很大时,很可能通常t检验导致得出这样的结论:参数估计没
有明显不同于零。这个结果出现尽管可能高2R
或F值表示“明显的”解释模型
作为一个整体的能力。问题是,共线性变量不能提供足够的信息来估计其独自影
响,即使经济理论可能表明它们在这关系里的重要性。
4。估计可能对一些观察值的添加或者删除,或删除一个显然不重要的变量非常敏
感。
5.尽管很难孤立一个样本的各个变量的影响,如果在新样本观察值中存在同样
的共线关系特征,准确预测是可能的。例如,一个总生产函数,其中投入劳动和
资本是近似共线性的,对某一特定比例的投入而言,精准预测产出是可能的,但
不适合各种组合的投入。
8.7.2判断和减轻共线性
一个简单的检测共线性关系的方法是用一些解释变量间的样本相关系数。这
些样本相关性是线性关联的描述性的测量。一种常用的规则是解释变量之间的相
关系数绝对值大于0.8或者0.9预示着一种强烈的线性关系和一个潜在的有害的
共线性关系。检验两两相关共线关系的唯一的问题是,共线关系可能涉及两个以
上的解释变量,通过检查两两之间的关系,这是可能或不可能被检测出的。
第二个识别共线存在的简单而有效的程序是估计所谓的“辅助回归。”在这
些最小二乘回归中左边的变量是其中的解释变量,等式右边部分变量是所有剩下
的解释变量。例如,
2t
x的辅助回归是
21133tttKtK
xaxaxaxerror
如果这个人工模型的2R
高了,超出80,表示
2t
x有一大部份的变化可以解释为其
它解释变量的变化,在另一个。在7.3.1节,关键的一点是一个变量的变化与任
何其他解释变量没有联系,这些解释变量在提高最小二乘估计量
2
b的精度是有用
的。如果辅助回归中的2R
不高,则
2t
x中的变化不能被其余解释变量解释,并且估
计量
2t
x的精度不受这个问题的影响。
共线的问题是,数据不包含关于解释变量的各自影响的足够“信息”使得允
许我们准确地估计统计模型的所有参数估计。因此,一种解决办法就是分析中得
到更多的信息和使用它。
新信息可以采用的是更多、更好的样本数据。不幸的是,在经济学上,这不总
是可能的。获取横截面数据是很贵的,用时间序列数据,因此你必须等数据出现。
另外,如果新数据通过非实验的过程得到且作为原始数据样本,新的观察结果可
能面对相同的共线性关系并以新方式提供较少的、独立的信息。在这些情况下,
新数据在提高最小二乘估计的准确度上作用很小。
像8.5节中所做的那样,通过介绍参数限制形式的非样本信息,我们会增加问
题结构。这些非样本信息就有可能与样本信息结合来提供限制性最小二乘估计。
好在,线性约束参数值的非样本信息的使用减少了估计量样本的差异性。坏消息
是,产生的限制的估计量是有偏的,除非限制条件是完全真实的。因此,使用好的
非样本信息是很重要的,从而降低样本差异性不是以大的估计偏差为代价的。
本文发布于:2022-12-29 20:16:25,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/55152.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |