16724113 杨梦俊 上海研究院 产业经济学
第二章作业题
Problem3
输入数据后,得到回归结果如下图所示,
鬼夜哭
------------------------------------------------------------------------------ _cons | .5681319 .9284214 0.61 0.563 -1.703633 2.839897 ACT | .1021978 .035692 2.86 0.029 .0148626 .189533-------------+---------------------------------------------------------------- GPA | Coef. Std. Err. t P>|t| [95% Conf. Interval]------------------------------------------------------------------------------ Total | 1.02875 7 .146964286 Root MSE = .26917-------------+------------------------------ Adj R-squared = 0.5070 Residual | .434725292 6 .072454215 R-squared = 0.5774 Model | .594024707 1 .594024707 Prob > F = 0.0287-------------+------------------------------ F( 1, 6) = 8.20 Source | SS df MS Number of obs = 8 所以,GPA=0.568+0.102*ACT+u
(1)这个回归方程的截距项是0.568.斜率为0.102。这个关系的方向为正向,即ACT 没提高1个单位,GPA 平均上升0.102个单位。
这里的截距表示的是,当一个学生没有能力的时候,该学生的GPA 为0.568,因此没有一个有用的解释。
如果ACT 上升五分,GPA 预期会提高0.102*5=0.51个单位。雌雄同体歌词
(2)根据回归方程GPA=0.568+0.102*ACT+u ,对应ACT ,拟合值GPA ^和残差u (值为GPA- GPA ^
)如下表所示,
将所有u 相加,和为0.042,接近于0。
(3)预测值GPA ^
=0.568+0.102*20=2.608
(4)由于R^2=0.5774,调整的R^2=0.5070,所以,对这8个学生来说,至少有50%的GPA 可以由ACT 来解释,且判断失误的概率不超过3%。
Computer Exercis3
(1)reg sleep totwrk
Source SS df MS Number of obs = 706
F( 1, 704) = 81.09
Model 14381717.2 1 14381717.2 Prob > F = 0.0000
Residual 124858119 704 177355.282 R-squared = 0.1033
Adj R-squared = 0.1020
Total 139239836 705 197503.313 Root MSE = 421.14
sleep Coef. Std. Err. t P>|t| [95% Conf. Interval]
totwrk -.1507458 .0167403 -9.00 0.000 -.1836126 -.117879
_cons 3586.377 38.91243 92.17 0.000 3509.979 3662.775
所以,sleep=3586.38-0.15totwrk+u
该式子表示,一周中用于工作的时间每增加一个单位,每周用于晚上睡眠的分钟数平均减少0.15;
观测次数为706,R^2=0.10,即一周中用于工作的时间解释了10%的睡眠分钟的变化原因;截距项表示,每周不工作,用于晚上的睡眠时间为3586.38分钟。
(2)totwrk增加2时,sleep减少0.15*2=0.3分钟。我觉得这个效应很小,一分钟都不到。
第三章
P1
reg colgpa hsperc sat
Source SS df MS Number of obs = 4137
F( 2, 4134) = 777.92
Model 490.606706 2 245.303353 Prob > F = 0.0000
Residual 1303.58897 4134 .315333567 R-squared = 0.2734
Adj R-squared = 0.2731
Total 1794.19567 4136 .433799728 Root MSE = .56155
colgpa Coef. Std. Err. t P>|t| [95% Conf. Interval]
hsperc -.0135192 .0005495 -24.60 0.000 -.0145965 -.012442
sat .0014762 .0000653 22.60 0.000 .0013482 .0016043
_cons 1.391757 .0715424 19.45 0.000 1.251495 1.532018
(1)因为hsperc表示学生在高中班上名次的百分数,显然,数值越大,该学生的排名越低,所以系数为负可以讲得通。
(2)GPA的预测值为1.392-0.0135*20+0.00148*1050=2.676
生活小知识
(3)ΔGPA=0.00148*140=0.2072,所以,预测SAT高的学生在大学的GPA比低的那位高0.2。这个差距不大,GPA仅差0.2,也就是两分的差距而已。
(4)0.5/0.00148=337.84。即SAT的分数相差约338,才能导致colgpa相差0.5。
sum sat
Variable Obs Mean Std. Dev. Min Max
sat 4137 1030.331 139.4014 470 1540
,在观测的4137个数据中,标准差为139.4,由此可知,大部分人的差距都在139.4*2=278.8之内,所以,一般来说,SAT的差距对大学GPA的影响不是很大。大学的成绩主要还是看大学期间的努力了。
C2平凡的生活
reg price sqrft bdrms
泳衣英文Source SS df MS Number of obs = 88
F( 2, 85) = 72.96
Model 580009.152 2 290004.576 Prob > F = 0.0000
Residual 337845.354 85 3974.65122 R-squared = 0.6319
Adj R-squared = 0.6233
Total 917854.506 87 10550.0518 Root MSE = 63.045
price Coef. Std. Err. t P>|t| [95% Conf. Interval]
sqrft .1284362 .0138245 9.29 0.000 .1009495 .1559229
bdrms 15.19819 9.483517 1.60 0.113 -3.657582 34.05396
_cons -19.315 31.04662 -0.62 0.536 -81.04399 42.414
(1)price=-19.315+0.128*sqrft+15.198*bdrms+u
(2)估计会增加15.198*1=15.198(千美元)
(3)估计会增加0.128*140=17.92(千美元)
携手向前
跟(2)比较可得,增加140平方英尺的房间面积(不论是否为卧室),与增加一间卧室对住房价格的影响基本相当。
(4)因为R^2=0.6319,所以,价格的变异大约有63%的比例能够被平方英尺数和卧室数所解释。
(5)预计销售价格为-19.315+0.128*2438+15.198*4=353.541(千美元)
(6)残差为300-353.541=-53.541(千美元)=53541(美元)
实际销售价格比预期价格低,对购买者来说,支付了过低的价格。
第四章
茴香素饺子P3
(1)该系数表示sales(销售额)每增加百分之一,rdintens(研发支出占销售额的百分比)就增加0.00321个单位。
如果sales增加10%,估计rdintens会增加0.0321个单位,即研发支出占销售额的比重上升0.321%。在现实经济生活中,这个影响一般。
(2)由题意得以下假设:
H0:销售额对研发强度没有显著影响。
H1:研发支出随着销售额的提高而提高。
t=0.321 / 0.216=1.486
当而α=0.05时,tα/2(n-k)=t0.025(32-3)=2.045>1.486,所以不拒绝原假设,说明在5%的置信水平下,销售额对研发强度的影响不显著。
当α=0.1时,tα/2(n-k)=t0.05(32-3)=1.699>1.486,同理不拒绝原假设,说明在10%的置信水平下,销售额对研发强度的影响不显著。
(3)profmarg的系数表明,利润占销售额的百分比每上升一个单位,研发支出占销售额的百分比就上升0.05的单位。
艰难困苦由经济常识可知,这个影响不显著,因为,利润占销售额的百分比上升20%,研发支出占销售额的百分比才上升1%,显然不显著。
(4)由于t=0.05/0.046=1.087,
对于常用的α=0.05时,tα/2(n-k)=t0.025(32-3)=2.045>1.087,所以不能拒绝原假设(利润占销售额的比重变化对研发支出不影响),证明统计不显著。
C6
(1)reg lwage educ exper motheduc fatheduc
Source SS df MS Number of obs = 1230
F( 4, 1225) = 72.20
Model 82.6485753 4 20.6621438 Prob > F = 0.0000
Residual 350.570687 1225 .286180152 R-squared = 0.1908
Adj R-squared = 0.1881
Total 433.219262 1229 .352497365 Root MSE = .53496
lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
educ .1158932 .0095127 12.18 0.000 .0972302 .1345561
exper .0341919 .0067459 5.07 0.000 .020957 .0474268
motheduc .0083299 .0086698 0.96 0.337 -.0086793 .0253391
fatheduc .0209308 .0060239 3.47 0.001 .0091125 .032749
_cons .1736195 .1825745 0.95 0.342 -.1845738 .5318128
原假设H0:β3=β4(父亲与母亲的教育水平对某人小时工资水平的影响程度是一样的)。(2)由(1)可得,
log(wage)=0.174+0.116educ+0.034exper+0.008motheduc+0.0209fatheduc+u
一般来说,母亲的最高教育年限每增加一年,在其他因素不变的情况下,一个人的小时工资水平平均上升0.83%。
父亲的最高教育年限每增加一年,在其他因素不变的情况下,一个人的小时工资水平平均上升2.09%。
由于父亲教育水平前的系数β3为0.209,显著大于母亲教育水平前的系数β4=0.008,表明父亲的教育水平对一个人的工资水平影响更大。
(3)令φ=β3-β4
原假设H0:φ=0(父亲和母亲的受教育程度对某人小时工资水平的影响程度是一样的)
备择假设H1:φ≠0
则log(wage)=β0+β1educ+β2exper+(φ+β4) motheduc+β4fatheduc+u
整理得,
log(wage)=β0+β1educ+β2exper+φmotheduc+β4(motheduc +fatheduc)+u
利用tata进行回归,
gen total= motheduc+ fatheduc
reg lwage educ exper motheduc total
Source SS df MS Number of obs = 1230
F( 4, 1225) = 72.20
Model 82.6485753 4 20.6621438 Prob > F = 0.0000
Residual 350.570687 1225 .286180152 R-squared = 0.1908
Adj R-squared = 0.1881
Total 433.219262 1229 .352497365 Root MSE = .53496
lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
educ .1158932 .0095127 12.18 0.000 .0972302 .1345561
exper .0341919 .0067459 5.07 0.000 .020957 .0474268
motheduc -.0126008 .0127881 -0.99 0.325 -.0376898 .0124881
total .0209308 .0060239 3.47 0.001 .0091125 .032749
_cons .1736195 .1825745 0.95 0.342 -.1845738 .5318128
所以,φ95%的置信区间为[-0.038,0.012],包含0,所以不能拒绝原假设,即没有充分证据说明父亲与母亲的教育程度对一个人的小时工资的影响程度不一样。