《应用回归分析》课后习题部分答案-何晓群版

更新时间：2024-06-18 19:01:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

应用回归分析课后答案推荐度：
相关推荐

回归分析

作业设计

班级：统计0802 学号： 1303080513 姓名：刘贯春指导老师：胡朝明

日期：2011年1月2日

实验目的：结合SPSS软件使用回归分析中的各种方法，比较各种方

法的使用条件，并正确解释分析结果。

实验内容：世纪统计学教材应用回归分析（第二版）课后有数据的习

题。

详细设计：

第二章一元线性回归

2.14 解答：（1）散点图为：

（2）x与y之间大致呈线性关系。（3）设回归方程为y??0??1x

n???? ?1=

?xyii?1n??i?nxy??7

2?xi?1?2i?n(x)??0?y??1x?20?7?3??1

??可得回归方程为y??1?7x?2

（4）??(y?n-2i=11ni?2?yi)

2 ?1n-2n?(yi=1?i??(?0??1x))

222?10-（-1+7?1））?（10-（-1+7?2））?（20-（-1+7?3））?1（ =?? 223??（20-（-1+7?4））?（40-（-1+7?5））?

?13?16?9?0?49??36

?110/3?1330?6 .1 ??3?（5）由于?1?N(?1,??2Lxx?)

t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即：p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??

1313可得?1的置信度为95%的置信区间为（7-2.353?即为：（2.49，11.5）

??33，7+2.353?33）

?0?N(?0,(1n?(x)2Lxx)?)

??t?(1n?0??0???2??0??0?

2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而

????????0??0P?||?t?/2(n?2)??1??

?2???1(x)????nLxx???????即p(?0???1n?(x)2???Lxxt?/2??0??0??1n?(x)2Lxxt?/2)?1??

可得?1的置信度为95%的置信区间为（?7.77,5.77）

n（6）x与y的决定系数r2??(y?y)ii?1n??2?(yi?1?i?490/600?0.817

2?y)（7）

ANOVA x 组间（组合）线性项加权的偏差组内总数平方和 9.000 8.167 .833 1.000 10.000 df 2 1 1 2 4 均方 4.500 8.167 .833 .500 F 9.000 16.333 1.667 显著性 .100 .056 .326 由于F?F?(1,3),拒绝H0,说明回归方程显著，x与y有显著的线性关系。

??（8）t??1?2??1?Lxx?2 其中???/Lxx?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)

?7?1310330?21?3.6 633t?/2?2.353 t?3.66?t?/2

?接受原假设H0:?1?0,认为?1显著不为0，因变量y对自变量x的一元线性回归成立。

n?(x（9）相关系数 r?i?1n?i??x)(yi?y)?n2??iLxyLxxLyy

?(xi?1i?x)?(yi?1?y) =7010?600?760?0.904

r小于表中??1%的相应值同时大于表中??5%的相应值，?x与y有显著的线性关系.

(10) 序号 1 2 3 4 5 残差图为：

x y ?y e 1 2 3 4 5 10 10 20 20 40 6 13 20 27 34 4 -3 0 -7 6 4

从图上看，残差是围绕e=0随机波动，从而模型的基本假定是满足的。

置信度为95%的置信区间（11）当广告费x0=4.2万元时，销售收入y0?28.4万元，??近似为y?2?，即（17.1，39.7）

2.15 解答：

（1）散点图为：

（2）x与y之间大致呈线性关系。（3）设回归方程为y??0??1x

n???? ?1=

?xyii?1n??i?nxy??2(26370?21717)(7104300?5806440)?0.0036

?xi?1?2i?n(x)??0?y??1x?2.85?0.0036?762?0.1068

???可得回归方程为y?0.1068?0.0036x?2

(4) ??(y?n-2i=11ni?2?yi)

2 ?1n-2n?(yi=1?i??(?0??1x))

=0.2305

??0.4801

??(5) 由于?1?N(?1,??2Lxx)

?t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即：p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??

可得?1的置信度为95%的置信区间为

（0.0036-1.860?0.4801/1297860，0.0036+1.860?0.4801/1297860）

即为：（0.0028，0.0044）

???0?N(?0,(?1n?(x)2Lxx)?)

?2t?(1n?0??0???2??0??0?

2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而

????????0??0P?||?t?/2(n?2)??1??

?2???1(x)????nLxx???????即p(?0??

1n?(x)2???Lxxt?/2??0??0??1n?7

(x)2Lxxt?/2)?1??

?可得?1的置信度为95%的置信区间为（?0.3567,0.5703）

n(6)x与y的决定系数 r2??(y?y)ii?1n??2?(yi?1?i?216.8202718.525=0.908

?y)(7) ANOVA x 组间（组合）线性项加权的偏差组内总数平方和 1231497.500 1168713.036 62784.464 66362.500 1297860.000 df 7 1 6 2 9 均方 175928.214 1168713.036 10464.077 33181.250 F 5.302 35.222 .315 显著性 .168 .027 .885 由于F?F?(1,9),拒绝H0,说明回归方程显著，x与y有显著的线性关系。

??(8) t??1?2??1?Lxx?2 其中???/Lxx ?0.003?6?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)

1297860?8.54 20.04801t?/2?1.895 t?8.542?t?/2

?接受原假设H0:?1?0,认为?1显著不为0，因变量y对自变量x的一元线性回归成立。

n?(x(9) 相关系数 r?i?1n?i??x)(yi?y)?n2??LxyLxxLyy

?i?1(xi?x)?i?1(yi?y) =46531297860?18.525?0.9489

r小于表中??1%的相应值同时大于表中??5%的相应值，?x与y有显著的线性关系.

(10) 序号 1 2 3 4 5 6 7 8 9 10 x y ?y e 825 215 1070 550 480 920 1350 325 670 1215 3．5 1 4 2 1 3 4.5 1.5 3 5 3.0768 0.8808 3.9588 2.0868 1.8348 3.4188 4.9688 1.2768 2.5188 4.4808 0.4232 0.1192 0.0412 -0.0868 -0.8348 -0.4188 -0.4668 0.2232 0.4812 0.5192

从图上看，残差是围绕e=0随机波动，从而模型的基本假定是满足的。

(11)新保单x0?1000时，需要加班的时间为y0?3.7小时。

（12）y0的置信概率为1-?的置信区间精确为y0?t?/2(n?2)1?h00?, 即为（2.7，4.7）

近似置信区间为：y0?2?，即（2.74，4.66）

（13）可得置信水平为1-?的置信区间为y0?t?/2(n?2)h00?，即为（3.33，4.07）. 2.16 (1)散点图为：

???????9

可以用直线回归描述y与x之间的关系. (2)回归方程为:y?12112.629?3.314x (3)

? 10

从图上可看出，检验误差项服从正态分布。

第三章多元线性回归

3.11 解：（1）用SPSS算出y，x1，x2,x3相关系数矩阵：相关性 Pearson 相关性 y x1 x2 x3 y x1 x2 y 1.000 .556 .731 .724 . .048 .008 x1 .556 1.000 .113 .398 .048 . .378 11

x2 .731 .113 1.000 .547 .008 .378 . x3 .724 .398 .547 1.000 .009 .127 .051

x3 N y x1 x2 x3 .009 10 10 10 10 .127 10 10 10 10 .051 10 10 10 10 . 10 10 10 10 所以~r=

系数a 模型非标准化系数 B 1 (常量) 标准系数 t Sig. -1.974 B 的 95.0% 置信区间下限上限零阶相关性偏部分共线性统计量容差 VIF 标准误差试用版 176.459 -348.280 .096 -780.083.500 60 .556 .731 .724 .825 .687 .586 1.211 1.455 1.708 x1 x2 x3 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .535 2.465 .277 1.178 .100 .049 -.977 8.485 .053 14.149 .621 .350 .709 .444 .433 .212 .284 -13.4138.310 5 a. 因变量: y (2)

???348.28?3.754x1?7.101x2?12.447x3 所以三元线性回归方程为y模型汇总模型 R 1 .898a R 方 .806 调整 R 方 .708 标准估计的误差 23.44188 R 方更改 .806 F 更改 8.283 更改统计量 df1 3 df2 6 Sig. F 更改 .015 a. 预测变量: (常量), x3, x1, x2。（3）由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高

（4）

Anovab 模型平方和 df 均方 12

F Sig. 1 回归残差总计 13655.370 3297.130 16952.500 3 6 9 4551.790 549.522 8.283 .015a a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y

因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好

（5）

系数a 模型非标准化系数 B 1 (常量) x1 x2 x3 a. 因变量: y 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .100 .535 2.465 .049 .277 1.178 .284 -.977 .053 -13.415 8.485 14.149 38.310 .556 .731 .724 .621 .709 .433 .350 .444 .212 .825 1.211 .687 1.455 .586 1.708 -348.280 标准误差 176.459 标准系数试用版 t Sig. 下限 -780.060 B 的 95.0% 置信区间上限 83.500 零阶相关性偏部分共线性统计量容差 VIF -1.974 .096

（6）可以看到P值最大的是x3为0.284，所以x3的回归系数没有通过显著检验，应去除。

去除x3后作F检验，得： Anovab 模型 1 回归残差总计平方和 12893.199 4059.301 16952.500 df 2 7 9 均方 6446.600 579.900 F 11.117 Sig. .007a a. 预测变量: (常量), x2, x1。 b. 因变量: y

由表知通过F检验继续做回归系数检验

系数a 模型非标准化系数 B 1 (常量) -459.624 x1 x2 4.676 8.971 标准系数 t Sig. B 的 95.0% 置信区间下限 -821.547 .381 3.134 上限 -97.700 8.970 14.808 相关性零阶偏部分共线性统计量容差 VIF 标准误差试用版 153.058 1.816 2.468 .479 .676 -3.003 .020 2.575 3.634 .037 .008 .556 .731 .697 .808 .476 .672 .987 1.013 .987 1.013 a. 因变量: y

此时，我们发现x1，x2的显著性大大提高。

（7）x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)

?*?0.385x1*?0.535x2*?0.277x3* (8)y(9) 残差统计量a 预测值标准预测值预测值的标准误差调整的预测值残差标准残差 Student 化残差已删除的残差 Student 化已删除的残差 Mahal。距离 Cook 的距离居中杠杆值 a. 因变量: y 极小值 175.4748 -1.438 10.466 188.3515 -25.19759 -1.075 -2.116 -97.61523 -3.832 .894 .000 .099 极大值 292.5545 1.567 20.191 318.1067 33.22549 1.417 1.754 50.88274 2.294 5.777 3.216 .642 均值 231.5000 .000 14.526 240.1835 .00000 .000 -.123 -8.68348 -.255 2.700 .486 .300 标准偏差 38.95206 1.000 3.127 49.83914 19.14022 .816 1.188 43.43220 1.658 1.555 .976 .173 N 10 10 10 10 10 10 10 10 10 10 10 10

所以置信区间为（175.4748，292.5545）

（10）由于x3的回归系数显著性检验未通过，所以居民非商品支出对货运总量影响不大，但是回归方程整体对数据拟合较好

3.12 解：在固定第二产业增加值，考虑第三产业增加值影响的情况下，第一产

业每增加一个单位，GDP就增加0.607个单位。

在固定第一产业增加值，考虑第三产业增加值影响的情况下，第二产业每增加一个单位，GDP就增加1.709个单位。

第四章违背基本假设的情况

4.9 解：系数a 模型非标准化系数 B 1 (常量) x a. 因变量: y -.831 .004 标准误差 .442 .000 标准系数试用版 t -1.882 .839 11.030 Sig. .065 .000 ?=-0.831+0.004x 由SPSS计算得：y残差散点图为：

（2）由残差散点图可知存在异方差性再用等级相关系数分析：相关系数 Spearman 的 rho x 相关系数 Sig.（双侧） N t 相关系数 Sig.（双侧） N x 1.000 . 53 .318* .021 53 t .318* .021 53 1.000 . 53 *. 在置信度（双测）为 0.05 时，相关性是显著的。

P=0.021 所以方差与自变量的相关性是显著的。（3）模型描述因变量自变量权重 1 源幂值模型: MOD_1. y x x 1.500

M=1.5时可以建立最优权函数，此时得到： ANOVA 回归残差总计平方和 .006 .003 .009 df 1 51 52 均方 .006 .000 F 98.604 Sig. .000 系数（常数）

未标准化系数 B -.683 标准误 .298 标准化系数试用版标准误 t -2.296 Sig. .026 16

系数（常数） x 未标准化系数 B -.683 .004 标准误 .298 .000 标准化系数试用版标准误 t -2.296 .082 9.930 Sig. .026 .000 .812

所以：y??-0.683+0.004x （4）系数a 模型非标准化系数 B 1 (常量) x a. 因变量: yy .582 .001 标准误差 .130 .000 标准系数试用版 t 4.481 .805 9.699 Sig. .000 .000

4.13 解： (1) 系数a 模型非标准化系数 B 1 (常量) x a. 因变量: y -1.435 .176 标准误差 .242 .002 标准系数试用版 t -5.930 .999 107.928 Sig. .000 .000

?y=-1.435+0.176x

模型汇总b (2) 模型 R 1 .999a R 方 .998 调整 R 方 .998 标准估计的误差 .09744 Durbin-Watson .663 a. 预测变量: (常量), x。 b. 因变量: y

DW=0.663 查DW分布表知：dL=0.95 所以DW

et随t的变化逐次变化并不频繁的改变符号，说明误差项存在正相关。

?=1-0.5*DW=0.6685 计算得：（3）?Y’ x’ 7.39 44.90 7.65 45.80 6.84 40.69 8.00 48.50 7.79 46.85 8.26 49.45 7.96 48.47 8.28 50.04 7.90 48.03 8.49 51.17 7.88 47.26 8.77 52.33 8.93 52.69 9.32 54.95 9.29 55.54 9.48 56.77 9.38 55.83 9.67 58.00 9.90 59.22

模型汇总b 模型 R 1 .996a R 方 .993 调整 R 方 .993 标准估计的误差 .07395 Durbin-Watson 1.344 a. 预测变量: (常量), xx。 b. 因变量: yy 系数a 模型非标准化系数 B 1 (常量) xx a. 因变量: yy -.303 .173 标准误差 .180 .004 标准系数试用版 t -1.684 .996 49.011 Sig. .110 .000 ?'=-0.303+0.173x’ 得回归方程 y?t=-0.303+0.6685yt?1+0.173（xt—0.6685xt?1）即：y（4）

模型汇总b 模型 R 1 .978 a标准估计的误R 方 .957 调整 R 方 .955 差 .07449 Durbin-Watson 1.480 a. 预测变量: (常量), x3。 b. 因变量: y3 系数a 模型非标准化系数 B 1 (常量) x3 a. 因变量: y3 20

.033 .161 标准误差 .026 .008 标准系数试用版 t 1.273 .978 19.528 Sig. .220 .000

△yt=0.033+0.161△xt

?t=0.033+yt?1+0.161（xt-xt?1）即：y（5）差分法的DW值最大为1.48消除相关性最彻底，但是迭代法的??值最小为0.07395，拟合的较好。

4.14解：（1）模型汇总b 模型 R 1 .541a R 方 .293 调整 R 方 .264 标准估计的误差 329.69302 Durbin-Watson .745 a. 预测变量: (常量), x2, x1。 b. 因变量: y 系数a 模型非标准化系数 B 1 (常量) x1 x2 a. 因变量: y -574.062 191.098 2.045 标准误差 349.271 73.309 .911 标准系数试用版 t -1.644 .345 .297 2.607 2.246 Sig. .107 .012 .029

?=-574.062+191.098x1+2.045x2 回归方程为：yDW=0.745

残差图为：

?=1-0.5*DW=0.6275 （2）? 模型汇总b 模型 R 1 .688 a标准估计的误R 方 .474 调整 R 方 .452 差 257.67064 Durbin-Watson 1.716 a. 预测变量: (常量), x22, x12。 b. 因变量: y2 系数a 模型非标准化系数 B 1 (常量) x12 x22 a. 因变量: y2 -179.668 211.770 1.434 标准误差 90.337 47.778 .628 标准系数试用版 t -1.989 .522 .269 4.432 2.283 Sig. .052 .000 .027

?t’=-179.668+211.77x1’+1.434x2’ 此时得方程：y22

所以回归方程为：

?t??179.668?0.6275yt?1?211.77(x1t?0.6275x1t?1?)?1.434(x2t?0.6275x2t?1) y

（3）模型汇总模型 R 1 .715a R 方 .511 调整 R 方 .490 标准估计的误差 283.79102 Durbin-Watson 2.042 ba. 预测变量: (常量), x23, x13。 b. 因变量: y3 系数模型非标准化系数 B 1 (常量) x13 x23 a. 因变量: y3 7.698 209.891 1.399 标准误差 39.754 44.143 .583 标准系数试用版 t .194 .544 .274 4.755 2.400 Sig. .847 .000 .020 a

?t?7.698?209.891?x1?1.399?x2 此时得方程：△y?t?7.698?209.891(xt?xt?1)?1.399(x2t?x2t?1)所以回归方程为：y

第五章自变量选择与逐步回归

5.9 后退法：输出结果

系数a 模型非标准化系数 B 1

(常量) 1438.120 标准误差 2252.472 23

标准系数试用版 t .638 Sig. .533 农业x1 工业x2 建筑业x3 人口x4 最终消费x5 受灾面积x6 2 (常量) 农业x1 工业x2 建筑业x3 最终消费x5 受灾面积x6 3 (常量) 农业x1 工业x2 最终消费x5 受灾面积x6 4 (常量) 农业x1 工业x2 最终消费x5 a. 因变量: 财政收入y -.626 -.328 -.383 -.004 .672 -.006 1079.754 -.642 -.303 -.402 .658 -.006 1083.150 -.624 -.373 .657 -.005 874.604 -.611 -.353 .637 .168 .207 .555 .025 .130 .008 299.759 .130 .131 .525 .095 .007 295.816 .127 .093 .094 .007 106.869 .124 .088 .089 -1.098 -1.352 -.251 -.014 3.710 -.015 -3.720 -1.587 -.691 -.161 5.178 -.695 3.602 -4.925 -2.314 -.765 6.905 -.849 3.662 -4.931 -3.998 6.981 -.758 8.184 -4.936 -3.994 7.142 .002 .135 .501 .875 .000 .499 .003 .000 .035 .456 .000 .409 .002 .000 .001 .000 .460 .000 .000 .001 .000 -1.126 -1.249 -.263 3.636 -.017 -1.095 -1.535 3.627 -.015 -1.073 -1.454 3.516 Anovae 模型 1 回归残差总计 2 回归残差总计 3 回归残差总计 4 回归平方和 1.365E8 528793.319 1.370E8 1.365E8 529767.852 1.370E8 1.364E8 550440.103 1.370E8 1.364E8 df 6 14 20 5 15 20 4 16 20 3 24

均方 2.274E7 37770.951 F 602.127 Sig. .000a 2.729E7 35317.857 772.734 .000b 3.411E7 34402.506 991.468 .000c 4.547E7 1355.753 .000d

残差总计 570180.931 1.370E8 17 20 33540.055 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 e. 因变量: 财政收入y 模型汇总模型标准估计的误R 1 2 3 4 .998a .998b .998c .998d R 方 .996 .996 .996 .996 调整 R 方 .994 .995 .995 .995 差 194.34750 187.93046 185.47913 183.13944 R 方更改 .996 .000 .000 .000 F 更改 602.127 .026 .585 .574 df1 6 1 1 1 df2 14 14 15 16 更改统计量 Sig. F 更改 .000 .875 .456 .460 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。回归方程为：y?874.604?0.611x1?0.353x2?0.637x5

逐步回归法：输出结果

模型汇总模型标准估计的误R 1 2 3 .994a .996b .998c R 方 .989 .992 .996 调整 R 方 .988 .991 .995 差 285.68373 247.77768 183.13944 R 方更改 .989 .003 .004 F 更改 1659.441 7.258 15.948 df1 1 1 1 df2 19 18 17 更改统计量 Sig. F 更改 .000 .015 .001 ?a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。

Anovad 模型 1 回归残差总计 2 回归残差总计 3 回归残差总计平方和 1.354E8 1550688.654 1.370E8 1.359E8 1105088.003 1.370E8 1.364E8 570180.931 1.370E8 df 1 19 20 2 18 20 3 17 20 均方 1.354E8 81615.192 F 1659.441 Sig. .000a 6.794E7 61393.778 1106.637 .000b 4.547E7 33540.055 1355.753 .000c a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 d. 因变量: 财政收入y 系数a 模型非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 26

业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准误差 90.891 .004 标准系数试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶相关性偏部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 系数a 模型非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 a. 因变量: 财政收入y 业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准误差 90.891 .004 标准系数试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶相关性偏部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 回归方程为:y?874.604?0.636x1?0.353x2?0.637x5

5.10 (1) 模型汇总模型 R 1 2 .908a .000b R 方 .824 .000 调整 R 方 .736 .000 标准估计的误差 625.88326 1217.15945 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) Anovac 模型 1 回归残差总计平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 27

均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归残差总计 .000 2.222E7 2.222E7 0 15 15 .000 1481477.129 . .b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) c. 因变量: y 系数a 模型非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) 5922.827 4.864 2.374 -817.901 14.539 -846.867 7542.938 标准误差 2504.315 2.507 .842 187.279 147.078 291.634 304.290 标准系数试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 24.789 Sig. .040 .081 .018 .001 .923 .016 .000 a. 因变量: y 回归方程为：y?5922.827?4.864x2?2.374x3?817.901x4?14.539x5?846.867x6 (2)后退法：输出结果模型汇总模型 R 1 2 .908a .907b R 方 .824 .824 调整 R 方 .736 .759 标准估计的误差 625.88326 597.04776 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 Anovac 模型 1 回归残差总计

平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 28

均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归残差总计 1.830E7 3921126.262 2.222E7 4 11 15 4575257.669 356466.024 12.835 .000b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 c. 因变量: y 系数a 模型非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) x2 x3 x4 x6 a. 因变量: y ?标准系数试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 2.675 .706 .760 -1.165 -.916 3.727 4.750 -4.913 -3.711 Sig. .040 .081 .018 .001 .923 .016 .022 .003 .001 .000 .003 标准误差 2504.315 2.507 .842 187.279 147.078 291.634 2245.481 1.360 .486 167.776 232.489 5922.827 4.864 2.374 -817.901 14.539 -846.867 6007.320 5.068 2.308 -824.261 -862.699 y?6007.320?5.068x2?2.308x3?824.261x4?862.699x6

(3)逐步回归模型汇总模型 R 1 2 3 .498a .697b .811c R 方 .248 .485 .657 调整 R 方 .194 .406 .572 标准估计的误差 1092.83206 937.95038 796.60909 a. 预测变量: (常量), x3。 29

b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。

Anovad 模型 1 回归残差总计 2 回归残差总计 3 回归残差总计 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 d. 因变量: y 平方和 5502210.090 1.672E7 2.222E7 1.079E7 1.144E7 2.222E7 1.461E7 7615032.418 2.222E7 df 1 14 15 2 13 15 3 12 15 均方 5502210.090 1194281.918 F 4.607 Sig. .050a 6.130 .013b 5392697.554 879750.910 4869041.506 634586.035 7.673 .004c 系数a 模型非标准化系数 B 1 (常量) x3 2 (常量) x3 x5 3 (常量) x3 x5 x4 a. 因变量: y 5161.259 1.511 472.298 3.188 212.325 1412.807 3.440 348.729 -415.136 标准误差 1142.744 .704 2150.138 .913 86.643 1865.912 .782 92.220 169.163 标准系数试用版 t 4.517 .498 2.146 .220 3.492 2.451 .757 4.398 3.782 -2.454 Sig. .000 .050 .830 .004 .029 .464 .001 .003 .030 1.050 .737 1.133 1.210 -.587 y?1412.807?3.440x3?348.729x5?415.136x4

?（4）两种方法得到的模型是不同的，回退法剔除了x5，保留了x6, x3, x2, x4

作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的，这与自变量的相关性有关联。相比之下，后退法首先做全模型的回归，每一个变量都有机会展示自己的作用，所得结果更有说服力

第六章多重共线性的情形及其处理

6.6

解:由下表我们可以看出

系数模型非标准化系数 B 1 (常量) x1 x2 x3 x4 x5 x6 a. 因变量: y -6381.575 -.593 .549 -.756 .080 .006 -.010 标准误差 2736.958 .279 .199 .911 .031 .006 .014 标准系数试用版 t -2.332 -2.127 2.753 -.830 2.590 .918 -.750 Sig. .035 .052 .016 .420 .021 .374 .466 共线性统计量容差 VIF a -1.040 2.260 -.495 .281 .038 -.027 .003 .001 .002 .064 .434 .574 318.536 897.470 472.951 15.706 2.305 1.742 方差扩大因子最大的为VIF2=897.470，故首先应剔除变量x2.将剩下变量继续进行回归得下表：系数模型非标准化系数 B 1 (常量) x1 x3 x4 x5 x6 a. 因变量: y -2677.422 -.053 1.433 .036 .006 .002 标准误差 2858.846 .237 .533 .032 .008 .015 标准系数试用版 t -.937 -.221 2.690 1.137 .822 .157 Sig. .364 .828 .017 .274 .424 .878 共线性统计量容差 VIF a -.092 .937 .127 .041 .006 .006 .009 .087 .434 .647 160.620 112.478 11.509 2.303 1.545 此时，有最大的方差扩大因子VIF1=160.620，且此时x1系数为负，故x1也应被剔除，继续将剩下变量进行回归得：

系数a 模型非标准化系数 B 1 (常量) x3 x4 x5 x6 a. 因变量: y -2214.129 1.318 .031 .006 .003 标准误差 1888.503 .109 .019 .007 .015 标准系数试用版 t -1.172 .862 .107 .041 .008 12.068 1.586 .841 .209 Sig. .258 .000 .132 .412 .837 共线性统计量容差 VIF .199 .221 .434 .671 5.023 4.523 2.302 1.489 此时，所有方差扩大因子都小于10，故回归方程如下：

?y=-2214.129+1.318x3+0.031x4+0.006x5+0.003x6

本文来源：https://www.bwwdw.com/article/ilq3.html

相关文章：

正在阅读：

《应用回归分析》课后习题部分答案-何晓群版06-18

物联网技术在停车场管理系统中的应用与优势04-07

13版七年级英语下册期末试卷12-22

秩序维护员月考核奖惩细则05-22

县食品药品监督管理局领导班子述职报告01-05

XXX有限责任公司管理手册（定稿前的一个质量和食品安全管理手册）12-06

2014河南政法干警申论热点：“招商热”还须冷思考603-22

Unit 2 I can do it!09-21

家乡的环境变化作文500字07-07

华东2018年秋季学期《管理信息系统》在线考试补考(适用于2019年4月份考试)08-26

上一篇：初一数学上册应用题大全下一篇：ProgrammingProject1 SocketProgramming(WinSocket编程-TCP协议)