《应用回归分析》课后习题部分答案-何晓群版
更新时间:2024-06-18 19:01:01 阅读量: 综合文库 文档下载
- 应用回归分析课后答案推荐度:
- 相关推荐
回归分析
作业设计
班级: 统计0802 学号: 1303080513 姓名: 刘贯春 指导老师: 胡朝明
日期:2011年1月2日
实验目的:结合SPSS软件使用回归分析中的各种方法,比较各种方
法的使用条件,并正确解释分析结果。
实验内容:世纪统计学教材应用回归分析(第二版)课后有数据的习
题。
详细设计:
第二章 一元线性回归
2.14 解答:(1)散点图为:
(2)x与y之间大致呈线性关系。 (3)设回归方程为y??0??1x
n???? ?1=
?xyii?1n??i?nxy??7
2?xi?1?2i?n(x)??0?y??1x?20?7?3??1
1
?
??可得回归方程为y??1?7x?2
(4)??(y?n-2i=11ni?2?yi)
2 ?1n-2n?(yi=1?i??(?0??1x))
222?10-(-1+7?1))?(10-(-1+7?2))?(20-(-1+7?3))?1( =?? 223??(20-(-1+7?4))?(40-(-1+7?5))?
?13?16?9?0?49??36
?110/3?1330?6 .1 ??3?(5)由于?1?N(?1,??2Lxx?)
t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即:p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??
1313可得?1的置信度为95%的置信区间为(7-2.353?即为:(2.49,11.5)
??33,7+2.353?33)
?0?N(?0,(1n?(x)2Lxx)?)
22
??t?(1n?0??0???2??0??0?
2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而
????????0??0P?||?t?/2(n?2)??1??
?2???1(x)????nLxx???????即p(?0???1n?(x)2???Lxxt?/2??0??0??1n?(x)2Lxxt?/2)?1??
可得?1的置信度为95%的置信区间为(?7.77,5.77)
n(6)x与y的决定系数r2??(y?y)ii?1n??2?(yi?1?i?490/600?0.817
2?y)(7)
ANOVA x 组间 (组合) 线性项 加权的 偏差 组内 总数 平方和 9.000 8.167 .833 1.000 10.000 df 2 1 1 2 4 均方 4.500 8.167 .833 .500 F 9.000 16.333 1.667 显著性 .100 .056 .326 由于F?F?(1,3),拒绝H0,说明回归方程显著,x与y有显著的线性关系。
??(8)t??1?2??1?Lxx?2 其中???/Lxx?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)
3
?7?1310330?21?3.6 633t?/2?2.353 t?3.66?t?/2
?接受原假设H0:?1?0,认为?1显著不为0,因变量y对自变量x的一元线性回归成立。
n?(x(9)相关系数 r?i?1n?i??x)(yi?y)?n2??iLxyLxxLyy
?(xi?1i?x)?(yi?1?y) =7010?600?760?0.904
r小于表中??1%的相应值同时大于表中??5%的相应值,?x与y有显著的线性关系.
(10) 序号 1 2 3 4 5 残差图为:
x y ?y e 1 2 3 4 5 10 10 20 20 40 6 13 20 27 34 4 -3 0 -7 6 4
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
置信度为95%的置信区间 (11)当广告费x0=4.2万元时,销售收入y0?28.4万元,??近似为y?2?,即(17.1,39.7)
2.15 解答:
(1) 散点图为:
5
(2)x与y之间大致呈线性关系。 (3)设回归方程为y??0??1x
n???? ?1=
?xyii?1n??i?nxy??2(26370?21717)(7104300?5806440)?0.0036
?xi?1?2i?n(x)??0?y??1x?2.85?0.0036?762?0.1068
???可得回归方程为y?0.1068?0.0036x?2
(4) ??(y?n-2i=11ni?2?yi)
2 ?1n-2n?(yi=1?i??(?0??1x))
6
=0.2305
??0.4801
??(5) 由于?1?N(?1,??2Lxx)
?t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即:p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??
可得?1的置信度为95%的置信区间为
(0.0036-1.860?0.4801/1297860,0.0036+1.860?0.4801/1297860)
即为:(0.0028,0.0044)
???0?N(?0,(?1n?(x)2Lxx)?)
?2t?(1n?0??0???2??0??0?
2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而
????????0??0P?||?t?/2(n?2)??1??
?2???1(x)????nLxx???????即p(?0??
1n?(x)2???Lxxt?/2??0??0??1n?7
(x)2Lxxt?/2)?1??
?可得?1的置信度为95%的置信区间为(?0.3567,0.5703)
n(6)x与y的决定系数 r2??(y?y)ii?1n??2?(yi?1?i?216.8202718.525=0.908
?y)(7) ANOVA x 组间 (组合) 线性项 加权的 偏差 组内 总数 平方和 1231497.500 1168713.036 62784.464 66362.500 1297860.000 df 7 1 6 2 9 均方 175928.214 1168713.036 10464.077 33181.250 F 5.302 35.222 .315 显著性 .168 .027 .885 由于F?F?(1,9),拒绝H0,说明回归方程显著,x与y有显著的线性关系。
??(8) t??1?2??1?Lxx?2 其中???/Lxx ?0.003?6?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)
1297860?8.54 20.04801t?/2?1.895 t?8.542?t?/2
?接受原假设H0:?1?0,认为?1显著不为0,因变量y对自变量x的一元线性回归成立。
n?(x(9) 相关系数 r?i?1n?i??x)(yi?y)?n2??LxyLxxLyy
?i?1(xi?x)?i?1(yi?y) =46531297860?18.525?0.9489
8
r小于表中??1%的相应值同时大于表中??5%的相应值,?x与y有显著的线性关系.
(10) 序号 1 2 3 4 5 6 7 8 9 10 x y ?y e 825 215 1070 550 480 920 1350 325 670 1215 3.5 1 4 2 1 3 4.5 1.5 3 5 3.0768 0.8808 3.9588 2.0868 1.8348 3.4188 4.9688 1.2768 2.5188 4.4808 0.4232 0.1192 0.0412 -0.0868 -0.8348 -0.4188 -0.4668 0.2232 0.4812 0.5192
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)新保单x0?1000时,需要加班的时间为y0?3.7小时。
(12)y0的置信概率为1-?的置信区间精确为y0?t?/2(n?2)1?h00?, 即为(2.7,4.7)
近似置信区间为:y0?2?,即(2.74,4.66)
(13)可得置信水平为1-?的置信区间为y0?t?/2(n?2)h00?,即为(3.33,4.07). 2.16 (1)散点图为:
???????9
可以用直线回归描述y与x之间的关系. (2)回归方程为:y?12112.629?3.314x (3)
? 10
从图上可看出,检验误差项服从正态分布。
第三章 多元线性回归
3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵: 相关性 Pearson 相关性 y x1 x2 x3 y x1 x2 y 1.000 .556 .731 .724 . .048 .008 x1 .556 1.000 .113 .398 .048 . .378 11
x2 .731 .113 1.000 .547 .008 .378 . x3 .724 .398 .547 1.000 .009 .127 .051
x3 N y x1 x2 x3 .009 10 10 10 10 .127 10 10 10 10 .051 10 10 10 10 . 10 10 10 10 所以~r=
系数a 模型 非标准化系数 B 1 (常量) 标准系数 t Sig. -1.974 B 的 95.0% 置信区间 下限 上限 零阶 相关性 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 176.459 -348.280 .096 -780.083.500 60 .556 .731 .724 .825 .687 .586 1.211 1.455 1.708 x1 x2 x3 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .535 2.465 .277 1.178 .100 .049 -.977 8.485 .053 14.149 .621 .350 .709 .444 .433 .212 .284 -13.4138.310 5 a. 因变量: y (2)
???348.28?3.754x1?7.101x2?12.447x3 所以三元线性回归方程为y模型汇总 模型 R 1 .898a R 方 .806 调整 R 方 .708 标准 估计的误差 23.44188 R 方更改 .806 F 更改 8.283 更改统计量 df1 3 df2 6 Sig. F 更改 .015 a. 预测变量: (常量), x3, x1, x2。 (3) 由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高
(4)
Anovab 模型 平方和 df 均方 12
F Sig. 1 回归 残差 总计 13655.370 3297.130 16952.500 3 6 9 4551.790 549.522 8.283 .015a a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y
因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好
(5)
系数a 模型 非标准化系数 B 1 (常量) x1 x2 x3 a. 因变量: y 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .100 .535 2.465 .049 .277 1.178 .284 -.977 .053 -13.415 8.485 14.149 38.310 .556 .731 .724 .621 .709 .433 .350 .444 .212 .825 1.211 .687 1.455 .586 1.708 -348.280 标准 误差 176.459 标准系数 试用版 t Sig. 下限 -780.060 B 的 95.0% 置信区间 上限 83.500 零阶 相关性 偏 部分 共线性统计量 容差 VIF -1.974 .096
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得: Anovab 模型 1 回归 残差 总计 平方和 12893.199 4059.301 16952.500 df 2 7 9 均方 6446.600 579.900 F 11.117 Sig. .007a a. 预测变量: (常量), x2, x1。 b. 因变量: y
由表知通过F检验 继续做回归系数检验
13
系数a 模型 非标准化系数 B 1 (常量) -459.624 x1 x2 4.676 8.971 标准系数 t Sig. B 的 95.0% 置信区间 下限 -821.547 .381 3.134 上限 -97.700 8.970 14.808 相关性 零阶 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 153.058 1.816 2.468 .479 .676 -3.003 .020 2.575 3.634 .037 .008 .556 .731 .697 .808 .476 .672 .987 1.013 .987 1.013 a. 因变量: y
此时,我们发现x1,x2的显著性大大提高。
(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)
?*?0.385x1*?0.535x2*?0.277x3* (8)y(9) 残差统计量a 预测值 标准 预测值 预测值的标准误差 调整的预测值 残差 标准 残差 Student 化 残差 已删除的残差 Student 化 已删除的残差 Mahal。 距离 Cook 的距离 居中杠杆值 a. 因变量: y 极小值 175.4748 -1.438 10.466 188.3515 -25.19759 -1.075 -2.116 -97.61523 -3.832 .894 .000 .099 极大值 292.5545 1.567 20.191 318.1067 33.22549 1.417 1.754 50.88274 2.294 5.777 3.216 .642 均值 231.5000 .000 14.526 240.1835 .00000 .000 -.123 -8.68348 -.255 2.700 .486 .300 标准 偏差 38.95206 1.000 3.127 49.83914 19.14022 .816 1.188 43.43220 1.658 1.555 .976 .173 N 10 10 10 10 10 10 10 10 10 10 10 10
所以置信区间为(175.4748,292.5545)
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好
3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产
14
业每增加一个单位,GDP就增加0.607个单位。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。
第四章 违背基本假设的情况
4.9 解: 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: y -.831 .004 标准 误差 .442 .000 标准系数 试用版 t -1.882 .839 11.030 Sig. .065 .000 ?=-0.831+0.004x 由SPSS计算得:y残差散点图为:
15
(2)由残差散点图可知存在异方差性 再用等级相关系数分析: 相关系数 Spearman 的 rho x 相关系数 Sig.(双侧) N t 相关系数 Sig.(双侧) N x 1.000 . 53 .318* .021 53 t .318* .021 53 1.000 . 53 *. 在置信度(双测)为 0.05 时,相关性是显著的。
P=0.021 所以方差与自变量的相关性是显著的。 (3) 模型描述 因变量 自变量 权重 1 源 幂值 模型: MOD_1. y x x 1.500
M=1.5时可以建立最优权函数,此时得到: ANOVA 回归 残差 总计 平方和 .006 .003 .009 df 1 51 52 均方 .006 .000 F 98.604 Sig. .000 系数 (常数)
未标准化系数 B -.683 标准误 .298 标准化系数 试用版 标准误 t -2.296 Sig. .026 16
系数 (常数) x 未标准化系数 B -.683 .004 标准误 .298 .000 标准化系数 试用版 标准误 t -2.296 .082 9.930 Sig. .026 .000 .812
所以:y??-0.683+0.004x (4) 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: yy .582 .001 标准 误差 .130 .000 标准系数 试用版 t 4.481 .805 9.699 Sig. .000 .000
17
4.13 解: (1) 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: y -1.435 .176 标准 误差 .242 .002 标准系数 试用版 t -5.930 .999 107.928 Sig. .000 .000
?y=-1.435+0.176x
模型汇总b (2) 模型 R 1 .999a R 方 .998 调整 R 方 .998 标准 估计的误差 .09744 Durbin-Watson .663 a. 预测变量: (常量), x。 b. 因变量: y
DW=0.663 查DW分布表知:dL=0.95 所以DW
18
et随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。
?=1-0.5*DW=0.6685 计算得: (3)?Y’ x’ 7.39 44.90 7.65 45.80 6.84 40.69 8.00 48.50 7.79 46.85 8.26 49.45 7.96 48.47 8.28 50.04 7.90 48.03 8.49 51.17 7.88 47.26 8.77 52.33 8.93 52.69 9.32 54.95 9.29 55.54 9.48 56.77 9.38 55.83 9.67 58.00 9.90 59.22
19
模型汇总b 模型 R 1 .996a R 方 .993 调整 R 方 .993 标准 估计的误差 .07395 Durbin-Watson 1.344 a. 预测变量: (常量), xx。 b. 因变量: yy 系数a 模型 非标准化系数 B 1 (常量) xx a. 因变量: yy -.303 .173 标准 误差 .180 .004 标准系数 试用版 t -1.684 .996 49.011 Sig. .110 .000 ?'=-0.303+0.173x’ 得回归方程 y?t=-0.303+0.6685yt?1+0.173(xt—0.6685xt?1) 即:y(4)
模型汇总b 模型 R 1 .978 a标准 估计的误R 方 .957 调整 R 方 .955 差 .07449 Durbin-Watson 1.480 a. 预测变量: (常量), x3。 b. 因变量: y3 系数a 模型 非标准化系数 B 1 (常量) x3 a. 因变量: y3 20
.033 .161 标准 误差 .026 .008 标准系数 试用版 t 1.273 .978 19.528 Sig. .220 .000
△yt=0.033+0.161△xt
?t=0.033+yt?1+0.161(xt-xt?1) 即:y(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的??值最小为0.07395,拟合的较好。
4.14解:(1) 模型汇总b 模型 R 1 .541a R 方 .293 调整 R 方 .264 标准 估计的误差 329.69302 Durbin-Watson .745 a. 预测变量: (常量), x2, x1。 b. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x1 x2 a. 因变量: y -574.062 191.098 2.045 标准 误差 349.271 73.309 .911 标准系数 试用版 t -1.644 .345 .297 2.607 2.246 Sig. .107 .012 .029
?=-574.062+191.098x1+2.045x2 回归方程为:yDW=0.745
残差图为:
21
?=1-0.5*DW=0.6275 (2)? 模型汇总b 模型 R 1 .688 a标准 估计的误R 方 .474 调整 R 方 .452 差 257.67064 Durbin-Watson 1.716 a. 预测变量: (常量), x22, x12。 b. 因变量: y2 系数a 模型 非标准化系数 B 1 (常量) x12 x22 a. 因变量: y2 -179.668 211.770 1.434 标准 误差 90.337 47.778 .628 标准系数 试用版 t -1.989 .522 .269 4.432 2.283 Sig. .052 .000 .027
?t’=-179.668+211.77x1’+1.434x2’ 此时得方程:y22
所以回归方程为:
?t??179.668?0.6275yt?1?211.77(x1t?0.6275x1t?1?)?1.434(x2t?0.6275x2t?1) y
(3) 模型汇总 模型 R 1 .715a R 方 .511 调整 R 方 .490 标准 估计的误差 283.79102 Durbin-Watson 2.042 ba. 预测变量: (常量), x23, x13。 b. 因变量: y3 系数 模型 非标准化系数 B 1 (常量) x13 x23 a. 因变量: y3 7.698 209.891 1.399 标准 误差 39.754 44.143 .583 标准系数 试用版 t .194 .544 .274 4.755 2.400 Sig. .847 .000 .020 a
?t?7.698?209.891?x1?1.399?x2 此时得方程:△y?t?7.698?209.891(xt?xt?1)?1.399(x2t?x2t?1)所以回归方程为:y
第五章 自变量选择与逐步回归
5.9 后退法:输出结果
系数a 模型 非标准化系数 B 1
(常量) 1438.120 标准 误差 2252.472 23
标准系数 试用版 t .638 Sig. .533 农业x1 工业x2 建筑业x3 人口x4 最终消费x5 受灾面积x6 2 (常量) 农业x1 工业x2 建筑业x3 最终消费x5 受灾面积x6 3 (常量) 农业x1 工业x2 最终消费x5 受灾面积x6 4 (常量) 农业x1 工业x2 最终消费x5 a. 因变量: 财政收入y -.626 -.328 -.383 -.004 .672 -.006 1079.754 -.642 -.303 -.402 .658 -.006 1083.150 -.624 -.373 .657 -.005 874.604 -.611 -.353 .637 .168 .207 .555 .025 .130 .008 299.759 .130 .131 .525 .095 .007 295.816 .127 .093 .094 .007 106.869 .124 .088 .089 -1.098 -1.352 -.251 -.014 3.710 -.015 -3.720 -1.587 -.691 -.161 5.178 -.695 3.602 -4.925 -2.314 -.765 6.905 -.849 3.662 -4.931 -3.998 6.981 -.758 8.184 -4.936 -3.994 7.142 .002 .135 .501 .875 .000 .499 .003 .000 .035 .456 .000 .409 .002 .000 .001 .000 .460 .000 .000 .001 .000 -1.126 -1.249 -.263 3.636 -.017 -1.095 -1.535 3.627 -.015 -1.073 -1.454 3.516 Anovae 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 4 回归 平方和 1.365E8 528793.319 1.370E8 1.365E8 529767.852 1.370E8 1.364E8 550440.103 1.370E8 1.364E8 df 6 14 20 5 15 20 4 16 20 3 24
均方 2.274E7 37770.951 F 602.127 Sig. .000a 2.729E7 35317.857 772.734 .000b 3.411E7 34402.506 991.468 .000c 4.547E7 1355.753 .000d
残差 总计 570180.931 1.370E8 17 20 33540.055 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 e. 因变量: 财政收入y 模型汇总 模型 标准 估计的误R 1 2 3 4 .998a .998b .998c .998d R 方 .996 .996 .996 .996 调整 R 方 .994 .995 .995 .995 差 194.34750 187.93046 185.47913 183.13944 R 方更改 .996 .000 .000 .000 F 更改 602.127 .026 .585 .574 df1 6 1 1 1 df2 14 14 15 16 更改统计量 Sig. F 更改 .000 .875 .456 .460 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 回归方程为:y?874.604?0.611x1?0.353x2?0.637x5
逐步回归法:输出结果
模型汇总 模型 标准 估计的误R 1 2 3 .994a .996b .998c R 方 .989 .992 .996 调整 R 方 .988 .991 .995 差 285.68373 247.77768 183.13944 R 方更改 .989 .003 .004 F 更改 1659.441 7.258 15.948 df1 1 1 1 df2 19 18 17 更改统计量 Sig. F 更改 .000 .015 .001 ?a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。
25
Anovad 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 平方和 1.354E8 1550688.654 1.370E8 1.359E8 1105088.003 1.370E8 1.364E8 570180.931 1.370E8 df 1 19 20 2 18 20 3 17 20 均方 1.354E8 81615.192 F 1659.441 Sig. .000a 6.794E7 61393.778 1106.637 .000b 4.547E7 33540.055 1355.753 .000c a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 d. 因变量: 财政收入y 系数a 模型 非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 26
业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准 误差 90.891 .004 标准系数 试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶 相关性 偏 部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 系数a 模型 非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 a. 因变量: 财政收入y 业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准 误差 90.891 .004 标准系数 试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶 相关性 偏 部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 回归方程为:y?874.604?0.636x1?0.353x2?0.637x5
5.10 (1) 模型汇总 模型 R 1 2 .908a .000b R 方 .824 .000 调整 R 方 .736 .000 标准 估计的误差 625.88326 1217.15945 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) Anovac 模型 1 回归 残差 总计 平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 27
均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归 残差 总计 .000 2.222E7 2.222E7 0 15 15 .000 1481477.129 . .b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) c. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) 5922.827 4.864 2.374 -817.901 14.539 -846.867 7542.938 标准 误差 2504.315 2.507 .842 187.279 147.078 291.634 304.290 标准系数 试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 24.789 Sig. .040 .081 .018 .001 .923 .016 .000 a. 因变量: y 回归方程为:y?5922.827?4.864x2?2.374x3?817.901x4?14.539x5?846.867x6 (2)后退法:输出结果 模型汇总 模型 R 1 2 .908a .907b R 方 .824 .824 调整 R 方 .736 .759 标准 估计的误差 625.88326 597.04776 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 Anovac 模型 1 回归 残差 总计
平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 28
均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归 残差 总计 1.830E7 3921126.262 2.222E7 4 11 15 4575257.669 356466.024 12.835 .000b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 c. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) x2 x3 x4 x6 a. 因变量: y ?标准系数 试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 2.675 .706 .760 -1.165 -.916 3.727 4.750 -4.913 -3.711 Sig. .040 .081 .018 .001 .923 .016 .022 .003 .001 .000 .003 标准 误差 2504.315 2.507 .842 187.279 147.078 291.634 2245.481 1.360 .486 167.776 232.489 5922.827 4.864 2.374 -817.901 14.539 -846.867 6007.320 5.068 2.308 -824.261 -862.699 y?6007.320?5.068x2?2.308x3?824.261x4?862.699x6
(3)逐步回归 模型汇总 模型 R 1 2 3 .498a .697b .811c R 方 .248 .485 .657 调整 R 方 .194 .406 .572 标准 估计的误差 1092.83206 937.95038 796.60909 a. 预测变量: (常量), x3。 29
b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。
Anovad 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 d. 因变量: y 平方和 5502210.090 1.672E7 2.222E7 1.079E7 1.144E7 2.222E7 1.461E7 7615032.418 2.222E7 df 1 14 15 2 13 15 3 12 15 均方 5502210.090 1194281.918 F 4.607 Sig. .050a 6.130 .013b 5392697.554 879750.910 4869041.506 634586.035 7.673 .004c 系数a 模型 非标准化系数 B 1 (常量) x3 2 (常量) x3 x5 3 (常量) x3 x5 x4 a. 因变量: y 5161.259 1.511 472.298 3.188 212.325 1412.807 3.440 348.729 -415.136 标准 误差 1142.744 .704 2150.138 .913 86.643 1865.912 .782 92.220 169.163 标准系数 试用版 t 4.517 .498 2.146 .220 3.492 2.451 .757 4.398 3.782 -2.454 Sig. .000 .050 .830 .004 .029 .464 .001 .003 .030 1.050 .737 1.133 1.210 -.587 y?1412.807?3.440x3?348.729x5?415.136x4
?(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4
30
作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力
第六章 多重共线性的情形及其处理
6.6
解:由下表我们可以看出
系数 模型 非标准化系数 B 1 (常量) x1 x2 x3 x4 x5 x6 a. 因变量: y -6381.575 -.593 .549 -.756 .080 .006 -.010 标准 误差 2736.958 .279 .199 .911 .031 .006 .014 标准系数 试用版 t -2.332 -2.127 2.753 -.830 2.590 .918 -.750 Sig. .035 .052 .016 .420 .021 .374 .466 共线性统计量 容差 VIF a -1.040 2.260 -.495 .281 .038 -.027 .003 .001 .002 .064 .434 .574 318.536 897.470 472.951 15.706 2.305 1.742 方差扩大因子最大的为VIF2=897.470,故首先应剔除变量x2.将剩下变量继续进行回归得下表: 系数 模型 非标准化系数 B 1 (常量) x1 x3 x4 x5 x6 a. 因变量: y -2677.422 -.053 1.433 .036 .006 .002 标准 误差 2858.846 .237 .533 .032 .008 .015 标准系数 试用版 t -.937 -.221 2.690 1.137 .822 .157 Sig. .364 .828 .017 .274 .424 .878 共线性统计量 容差 VIF a -.092 .937 .127 .041 .006 .006 .009 .087 .434 .647 160.620 112.478 11.509 2.303 1.545 此时,有最大的方差扩大因子VIF1=160.620,且此时x1系数为负,故x1也应被剔除,继续将剩下变量进行回归得:
31
系数a 模型 非标准化系数 B 1 (常量) x3 x4 x5 x6 a. 因变量: y -2214.129 1.318 .031 .006 .003 标准 误差 1888.503 .109 .019 .007 .015 标准系数 试用版 t -1.172 .862 .107 .041 .008 12.068 1.586 .841 .209 Sig. .258 .000 .132 .412 .837 共线性统计量 容差 VIF .199 .221 .434 .671 5.023 4.523 2.302 1.489 此时,所有方差扩大因子都小于10,故回归方程如下:
?y=-2214.129+1.318x3+0.031x4+0.006x5+0.003x6
32
正在阅读:
物联网技术在停车场管理系统中的应用与优势04-07
13版七年级英语下册期末试卷12-22
秩序维护员月考核奖惩细则05-22
县食品药品监督管理局领导班子述职报告01-05
XXX有限责任公司管理手册(定稿前的一个质量和食品安全管理手册)12-06
2014河南政法干警申论热点:“招商热”还须冷思考603-22
Unit 2 I can do it!09-21
家乡的环境变化作文500字07-07
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 晓群
- 课后
- 习题
- 回归
- 答案
- 部分
- 应用
- 分析
- 东师C++程序设计16秋在线作业2
- 《正常人体学基础》教案
- 2017高三数学备课组工作计划精选
- 2011年高考试题(山东卷)
- 新-船舶结构与货运-真题-部分
- 对口生网上志愿填报模拟演练操作手册 - 图文
- 从“钱老之问”,看“黄维之说”
- 在线测试题试题库及解答(第四章)影响线
- Linux下Wi—Fi驱动程序的设计与实现
- 41煤区二号辅助运输巷及1号措施巷施工安全技术措施
- 选择判断题
- 七年级英语第二课堂活动方案
- 武汉大学2013年学生暑期社会实践活动优秀成果名单
- 统计学试题和答案
- CA6150数控车床主轴箱及传动系统设计
- 学生行为规范建设活动实施方案
- 轴承座说明书
- 公共浙江事业单位考试公共基础知识每日一练(2014.5.12) —事业单
- MapGIS K9集体土地所有权建库流 - 图文
- 高速公路立交交通疏导专项施工方案