异方差性案例分析
一、问题的提出和模型设定
根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为
(5.31)
其中表示卫生医疗机构数,表示人口数。由2001年《四川统计年鉴》得到如下数据。
表5.1 四川省2000年各地区医疗机构数与人口数
地区 | 人口数(万人) X | 医疗机构数(个)Y | 地区 | 人口数(万人) X | 医疗机构数(个)Y |
成都 | 1013.3 | 6304 | 眉山 | 339.9 | 827 |
自贡 | 315 | 911 | 宜宾 | 508.5 | 1530 |
攀枝花 | 103 | 934 | 广安 | 438.6 | 1589 |
泸州 | 463.7 | 1297 | 达州 | 620.1 | 2403 |
德阳 | 379.3 | 1085 | 雅安 | 149.8 | 866 |
绵阳 | 518.4 | 1616 | 巴中 | 346.7 | 1223 |
广元 | 302.6 | 1021 | 资阳 | 488.4 | 1361 |
遂宁 | 371 | 1375 | 阿坝 | 82.9 | 536 |
内江 | 419.9 | 1212 | 甘孜 | 88.9 | 594 |
乐山 | 345.9 | 1132 | 凉山 | 402.4 | 1471 |
南充 | 709.2 | 4064 | | | |
| | | | | |
二、参数估计
进入EViews软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下
表5.2
估计结果为
(5.32)
括号内为t统计量值。
三、检验模型的异方差
本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。
(一)图形法
1、EViews软件操作。
由路径:Quick/Qstimate Equation,进入Equation Specification窗口,键入“y c x”,确认并“ok”,得样本回归估计结果,见表5.2。
(1)生成残差平方序列。在得到表5.2估计结果后,立即用生成命令建立序列,记为e2。生成过程如下,先按路径:Procs/Generate Series,进入Generate Series by Equation对话框,即
图5.4
然后,在Generate Series by Equation对话框中(如图5.4),键入“e2=(resid)^2”,则生成序列。
(2)绘制对的散点图。选择变量名X与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter,可得散点图,见图5.5。
图5.5
2、判断。由图5.5可以看出,残差平方对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。
(二)Goldfeld-Quanadt检验
1、EViews软件操作。
(1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Series命令,出现排序对话框,如果以递增型排序,选Ascenging,如果以递减型排序,则应选Descending,键入X,点ok。本例选递增型排序,这时变量Y与X将以X按递增型排序。
(2)构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样本个数均是8个,即。
在Sample菜单里,将区间定义为1—8,然后用OLS方法求得如下结果
表5.3
在Sample菜单里,将区间定义为14—21,再用OLS方法求得如下结果
表5.4
(3)求F统计量值。基于表5.3和表5.4中残差平方和的数据,即Sum squared resid的值。由表5.3计算得到的残差平方和为,由表5.4计算得到的残差平方和为,根据Goldfeld-Quanadt检验,F统计量为