第六章第二题:
1. 建立完成的教育年数(ED )对到最近大学的距离(Dist )的回归:
. reg ed dist, robust
斜率估计值是:-0.073
2. reg ed dist bytest female black hispanic incomehi ownhome dadcoll cue80 stwmfg80,robust
Dist 对ED 的效应估计是:-0.032
3. 系数下降50%,存在很大差异,(1)中回归存在遗漏变量偏差
4. di e(r2_a)(可看到调整后的R2)
第一问中=0.0074 调整的2R =0.00718796
_cons 13.95586 .0378112 369.09 0.000 13.88172 14.02999 dist -.0733727 .0134334 -5.46 0.000 -.0997101 -.0470353 ed Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Root MSE = 1.8074 R-squared = 0.0074 Prob > F = 0.0000 F( 1, 3794) = 29.83Linear regression Number of obs = 3796. reg ed dist , robust
2R
第二问中=0.2788 2R = 0.27693235
可以得到第二问中的拟合效果要优于第一问。
第二问中相似的原因:因为n 很大。 5. Dadcoll 父亲有没有念过大学:
系数为正(0.6961324)衡量父亲念过大学的学生接受的教育年数平均比其父亲没有年过大学的学生多。
-.0517777 1)原因:这些参数在一定程度上构成了上大学的机会成本。
2)它们的系数估计值的符号应该如此。当Stwmfg80增加时,放弃的工资增加,所以大学入学率降低
了;因而Stwmfg80的系数对应为负。
而当Cue80增加时,人们会发现找工作很困难,这降低上大学的机会成本,所以平均的大学入学率就会增加;因而Cue80的系数对应为正。
7.带入计算即可(14.75)
8.同7.(14.69)
第七章第二题
1. . reg cour_eval beauty,robust
95%置信区间见上表。
2.
2
R
_cons 3.998272 .0253493 157.73 0.000 3.948458 4.048087
beauty .1330014 .0323189 4.12 0.000 .0694908 .1965121
cour_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust
Root MSE = .54545
R-squared = 0.0357
Prob > F = 0.0000
F( 1, 461) = 16.94
Linear regression Number of obs = 463
Linear regression Number of obs = 463 F( 7, 455) = 14.43 Prob > F = 0.0000 R-squared = 0.1556 Root MSE = .51377
Robust
cour_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]
age -.0019545 .0026218 -0.75 0.456 -.0071068 .0031978 beauty .1592092 .0306846 5.19 0.000 .098908 .2195104 minority -.1694282 .067891 -2.50 0.013 -.3028471 -.0360093 female -.1832345 .0521947 -3.51 0.000 -.2858071 -.0806619 onecredit .633 .1077655 5.87 0.000 .4212201 .8447798 intro .0079488 .0565469 0.14 0.888 -.1031766 .1190742 nnenglish -.2438402 .0958959 -2.54 0.011 -.432294 -.0553863 _cons 4.16853 .1390349 29.98 0.000 3.8953 4.44176
由P值得出age 及intro 变量均不显著。所以应该去掉。
Source SS df MS Number of obs = 463
F( 5, 457) = 16.71
Model 21.9857702 5 4.39715404 Prob > F = 0.0000
Residual 120.25285 457 .263135339 R-squared = 0.1546
Adj R-squared = 0.1453
Total 142.23862 462 .307875801 Root MSE = .51297
cour_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]
minority -.1647853 .0756893 -2.18 0.030 -.3135275 -.0160431
female -.1741755 .049113 -3.55 0.000 -.2706909 -.0776601
onecredit .6413254 .1063165 6.03 0.000 .4323955 .8502554
beauty .1660434 .0306266 5.42 0.000 .1058569 .2262299
nnenglish -.2480077 .1052349 -2.36 0.019 -.4548121 -.0412033
_cons 4.072006 .032976 123.48 0.000 4.007203 4.13681
变量均显著
合理的置信区间应为(0 .1058569 0.2262299)
第八章第二题:
< cour_eval beauty intro onecredit female minority nnenglish,r
2. gen age2=age*age
. reg cour_eval age age2,beauty intro onecredit female minority nnenglish ,r
由age 与age2 的p值可看出均大于0.05,因此不能拒绝原假设,即没有充分的证据显示age 对cour_eval的效应是非线性的,也没有证据显示Age对Cour_Eval 有影响。
3.生成交互项:generate a= female* beauty
.regress cour_eval beauty intro onecredit female minority nnenglish fb,robust
female与Beauty的交互作用的变量后,其P值为0.000变量是显著的,即有充分证据表明性别不同时,Beauty的效应之差存在。
4.
. sum beauty
Variable Obs Mean Std. Dev. Min
> Max
>
beauty 463 4.75e-08 .7886477 -1.450494
> 1.970023
可知:手术前的beauty为-0.7886,术后为0.7886,上升了0.231 * (2 * 0.79) = 0.37.课程提高的95%置信区间为(0.231*1.96*0.048) *(2 *0.79) ,即(0.22 ,0.51)
5.计算略