第9章多元线性回归习题答案

更新时间:2023-06-12 12:42:25 阅读: 评论:0

第9章 多元线性回归
教材习题答案
9.1 根据下面的数据用Excel进行回归,并对回归结果进行讨论,计算 时y的预测值。
y
x1
x2
12
174
3
18
281
9
31
189
4
28
202
8
52
149
9
47
188
12
38
215
5
22
150
11
36
167
8
17
135
5
详细答案:
由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.459234
 
 
 
 
 
R Square
0.210896
 
 
 
 
 
Adjusted R Square
-0.01456
 
 
 
 
 
标准误差
13.34122
 
 
 
 
 
观测值
10
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
2
332.9837
166.4919
0.93541
0.436485
 
残差
7
1245.916
177.988
 
 
 
总计
9
1578.9
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
25.0287
22.27863
1.12344
0.298298
-27.6519
77.70928
X Variable 1
-0.04971
0.105992
-0.46904
0.653301
-0.30035
0.200918
X Variable 2
1.928169
1.47216
1.309755
0.231624
-1.55294
5.409276
得到的回证方程为: 表示,在 不变的条件下, 每变化一个单位,y平均下降0.04971个单位; 表示,在不变的条件下,每变化一个单位,y平均增加1.928169个单位。
判定系数 ,表示在因变量y的变差中能够被y与之间的线性关系所解释的比例为21.09%。由于这一比例很低,表明回归方程的拟合程度很差。估计标准误差 ,预测误差也较大。
方差分析表显示,Significance F=0.436485>a=0.05,表明y与之间的线性关系不显著。用于回归系数检验的P值均大于a=0.05,两个回归系数均不显著。
=200、=7时,y的预测值为:
9.2 根据下面Excel输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F、 及调整的 的值对模型进行讨论。
SUMMARY OUTPUT
回归统计
 
 
 
 
Multiple R
0.842407
 
 
 
 
R Square
0.709650
 
 
 
 
Adjusted R Square
0.630463
 
 
 
 
标准误差
109.429596
 
 
 
 
观测值
15
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
df
SS
MS
F
Significance F
回归
3
321946.8018
107315.6006
8.961759
0.002724
残差
11
131723.1982
11974.84
 
 
总计
14
453670
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
 
Intercept
657.0534
167.459539
3.923655
0.002378
 
X Variable 1
5.710311
1.791836
3.186849
0.008655
 
X Variable 2
-0.416917
0.322193
-1.293998
0.222174
 
X Variable 3
-3.471481
1.442935
-2.405847
0.034870
 
详细答案:
模型中涉及2个自变量,15对观察值。
估计的回归方程为:
从判定系数 和调整的判定系数 可以看出,回归方程的拟合程度一般。估计标准误差 ,预测误差比较大。
从方差分析表可知,Significance F=0.002724<a=0.05,表明因变量Y与3个自变量之间的线性关系显著。从回归系数检验的各P值可知,自变量x2不显著,表明因变量y与3个自变量之间的线性关系显著。从回归系数检验的各P值可知,自变量 不显著,其他两个自变量都是显著的。这可能意味着模型中存在多重共线性。
9.3 根据两个自变量得到的多元回归方程为 ,并且已知n=10,SST=6724.125,SSR=6216.375,
(1)在a=0.05的显著性水平下,与y线性关系是否显著?
(2)在a=0.05的显著性水平下, 是否显著?
(3)在a=0.05的显著性水平下, 是否显著?
详细答案:
(1)提出假设:
至少有一个不等于0
计算检验的统计量F
当a=0.05时, 。由于 ,所以拒绝原假设,表明 与y线性关系显著。
(2)提出假设:
计算检验的统计量t
当a=0.05, ,由于 ,所以拒绝原假设,表明 显著。
(3)提出假设:
计算检验的统计量t
当a=0.05, ,由于 ,所以拒绝原假设,表明 显著。
9.4 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据
月销售收入y(万元)
电视广告费用 (万元)
报纸广告费用 (万元)
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。
(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?
(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.807807
 
 
 
 
 
R Square
0.652553
 
 
 
 
 
Adjusted R Square
0.594645
 
 
 
 
 
标准误差
1.215175
 
 
 
 
 
观测值
8
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
回归分析
1
16.6401
16.6401
11.26881
0.015288
 
残差
6
8.859903
1.476651
 
 
 
总计
7
25.5
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
88.63768
1.582367
56.01588
2.17E-09
84.76577
92.50959
X Variable 1
1.603865
0.477781
3.356905
0.015288
0.434777
2.772952
估计的回归方程为:
(2)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.958663
 
 
 
 
 
R Square
0.919036
 
 
 
 
 
Adjusted R Square
0.88665
 
 
 
 
 
标准误差
0.642587
 
 
 
 
 
观测值
8
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
2
23.43541
11.7177
28.37777
0.001865
 
残差
5
2.064592
0.412918
 
 
 
总计
7
25.5
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
83.23009
1.573869
52.88248
4.57E-08
79.18433
87.27585
X Variable 1
2.290184
0.304065
7.531899
0.000653
1.508561
3.071806
X Variable 2
1.300989
0.320702
4.056697
0.009761
0.476599
2.125379
估计的回归方程为:
(3)不相同。在月销售收入与电视广告费用的方程中,回归系数 表示电视广告费用每增加1万元,月销售额平均增加1.603865万元;在月销售收入与电视广告费用和报纸广告费用的方程中,回归系数 表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.290184万元。
(4) 。表明在销售收入的总变差中,被估计的回归方程所解释的比例为88.665%
(5) 的P-Value=0.000653, 的P-Value=0.009761,均小于a=0.05,两个回归系数均显著。
9.5 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下
收获量y(kg/hm2)
降 雨 量x1(mm)
温 度x2 (
2250
25
6
3450
33
8
4500
45
10
6750
105
13
7200
110
14
7500
115
16
8250
120
17
(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。
(2)解释回归系数的实际意义。
(3)根据你的判断,模型中是否存在多重共线性?
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.995651
 
 
 
 
 
R Square
0.991321
 
 
 
 
 
Adjusted R Square
0.986982
 
 
 
 
 
标准误差
261.431
 
 
 
 
 
观测值
7
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
2
31226615
15613308
228.4445
7.53E-05
 
残差
4
273384.7
68346.19
 
 
 
总计
6
31500000
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
-0.591
505.0042
-0.00117
0.999122
-1402.71
1401.526
X Variable 1
22.38646
9.600544
2.331791
0.080095
-4.26892
49.04184
X Variable 2
327.6717
98.79792
3.316585
0.029472
53.3647
601.9787
早稻收获量对春季降雨量和春季温度的二元线性回归方程为:
(2)回归系数 表示,降雨量每增加1mm,小麦收获量平均增加22.3865kg/hm2;回归系数 表示,温度每增加1 ,小麦收获量平均增加327.6717kg/mh2。
(3)从降雨量和温度与收获量的关系看,两个变量与收获量之间都存在较强的关系,而且温度与降雨量之间也存在较强的关系,因此,模型中可能存在多重共线性。
9.6 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值( )、房产的评估价值( )和使用面积( )建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据
房地产编号
销售价格y(元/㎡)
地产估价(万元)
房产估价(万元)
使用面积(㎡)
1
6890
596
4497
18730
2
4850
900
2780
9280
3
5550
950
3144
11260
4
6200
1000
3959
12650
5
11650
1800
7283
22140
6
4500
850
2732
9120
7
3800
800
2986
8990
8
8300
2300
4775
18030
9
5900
810
3912
12040
10
4750
900
2935
17250
11
4050
730
4012
10800
12
4000
800
3168
15290
13
9700
2000
5851
24550
14
4550
800
2345
11510
15
4090
800
2089
11730
16
8000
1050
5625
19600
17
5600
400
2086
micromon
13440
18
3700
450
2261
9880
19
5000
340
3595
10760
20六级词汇下载
2240
150
578
9620
  用Excel进行回归,回答下面的问题:
  (1)写出估计的多元回归方程。
  (2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
  (3)检验回归方程的线性关系是否显著(a=0.05)。
  (4)检验各回归系数是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.947362
 
 
 
 
 
R Square
0.897496
 
 
 
 
 
Adjusted R Square
0.878276
 
 
 
 
 
标准误差
791.6823
 
 
 
 
 
观测值
20
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
莲藕的功效与作用 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
3
87803505
29267835
46.69697
3.88E-08
 
残差
16
10028175
agree的过去式
626760.9
 
 
 
总计
19
97831680
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
148.7005
574.4213
0.25887
0.799036
-1069.02
1366.419
X Variable 1
0.814738
0.511989
1.591321
0.131099
-0.27063
1.900105
X Variable 2
0.82098
0.211177
3.887646
0.001307
0.373305
1.268654
X Variable 3
0.135041
0.065863
2.050322
0.057088
-0.00458
0.274665
估计的多元回归方程为:
(2)判定系数 ,调整的判定系数 。表明销售价格的总变差中,被估计的回归方程所解释的比例为87.83%。
(3)由于Significance F=3.88E-08
(4) 的P-Value=0.1311>a=0.05,不显著; 的P-Value=0.0013 的P-Value=0.0571>a=0.05,不显著。
9.7 根据9.4题中的数据,回答下面的问题:
(1)a=0.01的水平下,检验二元回归模型线性关系的显著性。
(2)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗?
(3)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗?
详细答案:
(1)由于Significance F =0.001865
(2)的P-Value=0.0007
(3)的P-Value=0.0098
9.8 根据下面的数据回答下面的问题:
y
123.7
22.3
96.6
126.6
25.7
89.4
120.0
38.7
44.0
119.3
31.0
66.4
110.6
33.9
49.1
130.3
28.3
85.2
131.3
30.2
80.4
114.4
21.4
90.5
128.6
30.4
77.1
108.4
32.6
51.1
112.0
33.9
50.5
115.6
23.5
85.1
108.3
27.6
65.9
126.3
39.0
49.0
124.6
parallelism31.6
69.6
(1)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?(a=0.05)
(2)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?(a=0.05)
(3)根据上面的结论,你认为 对预测y是否有用?
(4)用Excel进行回归,并对模型进行检验,所得的结论与(3)是否相同?(a=0.05)
(5)计算之间的相关系数,所得结果意味着什么?
详细答案:
(1)由excel的“CORREL”函数计算的系数r=0.0025。
检验的统计量为:
取a=0.05, 。由于检验统计量 ,拒绝原假设。无证据表明二者之间存在线性关系。
(2)由excel的“CORREL”函数计算的系数r=0.4341。检验的统计量为:
取a=0.05, 。由于检验统计量 ,拒绝原假设。无证据表明二者之间存在线性关系。
(3)由于与y没有相关关系,所以用 对预测y没有用。
(4)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.999924
 
 
 
 
 
R Square
0.999847
 
 
 
 
 
Adjusted R Square
0.999822
 
 
 
 
 
标准误差
0.107155
 
 
 
 
 
观测值
15
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
2
900.7222
450.3611
39222.34
1.28E-23
 
残差
12
0.137787
0.011482
 
 
 
总计
14
900.86
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
-45.1541
0.611418
-73.8515
2.53E-17
-46.4863
-43.822
X Variable 1
3.097008
0.012274
252.3137
1.01E-23
3.070264
3.123752
X Variable 2
1.031859
0.003684
280.0789
2.89E-24
1.023832
1.039886
由于Significance F=1.28E-23
(5)由excel的“CORREL”函数计算的系数r=-0.8998,两个自变量之间高度负相关。
这意味着模型中存在多重共线性。
9.9 下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)
企业编号
销售价格y
购进价格
销售费用
1
1238
966
223
2
1266
894
257
3
1200
440
387
4
1193
664
310
5
1106
791
339
6
1303
852
283
7
1313
804
302
8
1144
905
214
9
1286
771
304
10
1084
511
326
11
1120
505
339
12
1156
851
235
13
1083
659
276
14
1263
490
390
15
1246
696
316
(1)计算yy之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?
(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?
(3)用Excel进行回归,并检验模型的线性关系是否显著(a=0.05)。
(4)解释判定系数 ,所得结论与问题(2)中是否一致?
(5)计算 之间的相关系数,所得结果意味着什么?
(6)模型中是否存在多重共线性?你对模型有何建议?
详细答案:
(1)由excel的“CORREL”函数计算的系数 。检验的统计量分别为:
取a=0.05, 。由于检验统计量 。因此没有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系。
(2)没有用。
(3)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.593684
 
 
 
 
 
R Square
0.35246
 
 
 
 
 
Adjusted R Square
0.244537
 
 
 
 
 
标准误差
69.75121
 
 
 
 
 
观测值
15
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
2
31778.15
15889.08
3.265842
0.073722
 
残差
12
58382.78
4865.232
 
 
 
总计
14
90160.93
 
 
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
375.6018
339.4106
1.10663
0.290145
-363.91
1115.114
X Variable 1
0.537841
0.210447
2.555711
0.0252
0.079317
0.996365
X Variable 2
1.457194
0.667707
2.182386
0.049681
0.002386
2.912001
回归方程为:
由于Significance F=0.073722>a=0.05,线性关系不显著。
(4);。所得结论与问题(2)一致。
(5)由excel的“CORREL”函数计算的系数 ,两个自变量高度负相关。
(6)由于两个自变量高度负相关,可能存在多重共线性。建议将一个自变量从模型中剔除。
9.10 设因变量为y,一个数值型自变量 和一个具有两个水平(水平1和水平2)的分类型自变量。
(1)写出因变量y关于自变量和分类自变量的多元回归方程。
(2)对应于分类自变量水平1的y的期望值是多少?
(3)对应于分类自变量水平2的y的期望值是多少?
详细答案:
(1) ,式中:
(2)
(3)
(4) 是当 保持不变时,由于 变化一个单位引起 变化的数量。
9.11 一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运输费用作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15个路程大致相同、而货物类型不同的运输费用数据
每件产品的运输费用y(元)
货物类型
17.2
易碎品
1
11.1
易碎品
1
12.0
易碎品
1
10.9
易碎品
1
13.8
易碎品
1
6.5
易碎品
1
10.0
易碎品
1
11.5
易碎品
1
7.0
非易碎品
0
8.5
非易碎品
0
2.1
非易碎品
0
1.3
非易碎品
0
3.4
非易碎品
0bead
7.5
非易碎品
0
2.0
非易碎品
0
(1)写出运输费用与货物类型之间的线性方程。
(2)对模型中的回归系数进行解释。
(3)检验模型的线性关系是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
 
 
 
 
 
Multiple R
0.780195
 
 
 
 
 
R Square
0.608704
 
 
 
 
 
Adjusted R Square
0.578604
 
 
 
 
 
标准误差
3.042926
 
 
 
 
 
观测值
15
 
 
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
 
df
SS
MS
F
Significance F
 
回归分析
1
187.2519
187.2519
20.2229
0.000601
 
残差
13
120.3721
9.259396
 
 
 
总计
14
307.624
 
 
 
 
 
highsociety
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
4.542857
1.150118
3.949906
0.001662
2.058179
7.027535
X Variable 1
7.082143
1.574864
4.496988
0.000601
3.679857
10.48443
运输费用与货物类型之间的线性方程为:
(2) 表示,“易碎品”的预期运输费用比非易碎品的预期运输费用多7.0821元。
英语自我介绍(带翻译)
(3)由于Significance F=0.000601
9.12 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下
月薪y(元)
工龄
性别(1=男,0=女)
1548
3.2
1
1629
3.8
1
1011
2.7
0
1229
3.4
0
1746
3.6
1
1528
4.1
1
1018
3.8
0
1190
3.4
0
1551
3.3
1
985
3.2
0
1610
3.5
1
1432
2.9
1
1215
3.3
0
990
2.8
0
1585
3.5
1
用Excel进行回归,并对结果进行分析。
详细答案:
回归结果如下。
shift卷福结婚
回归统计
 
 
 
 
Multiple R
0.9433914
 
 
 
 
R Square
0.8899873
 
 
 
 
Adjusted R Square
0.8716518
 
 
 
 
标准误差
96.791578
 
 
 
 
观测值
15
 
 
 
 
 
 
 
 
 
 
方差分析
 
 
 
 
 
 
df
SS
MS
F
Significance F
回归
2
909488.42
454744.21
48.539135
1.773E-06
残差
12
112423.32
9368.6096
 
 
总计
14
1021911.7
 
 
 
 
 
 
 
 
 
 
Coefficients
标准误差
t Stat
P-value
 
Intercept
732.06061
235.58436
3.1074246
0.0090641
 
X Variable 1
111.22016
72.083424
1.5429368
0.1487956
 
X Variable 2
458.68406
53.458498
8.5801899
1.823E-06
 
估计的回归方程为
  调整的判定系数 ,表示在月薪的变差中能够被月薪与工龄和性别之间的线性关系所解释的比例为87.179%,表明回归方程拟合的程度较高。估计标准误差 ,预测误差不大。
  方差分析表显示,Significance F=1.773E-06

本文发布于:2023-06-12 12:42:25,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/937254.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:回归   估计   费用
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图