SPSS实验6-回归分析
更新时间:2024-06-04 03:13:01 阅读量: 综合文库 文档下载
SPSS作业6:回归分析
(一) 回归分析
多元线性回归模型的基本操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Enter方法;
在Statistics框中,选择Estimates、Model fit、Covariancematrix、Collinearity diagnostics选项; 在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot; (4)选择菜单Analyze-Non Test-1-Sanple K-S; 选择菜单Analyze-Correlate-Brivariate; 结果如下:
Regression
能源消费需求的多元线性回归分析结果(强制进入策略) (一) Model Summary bModel 1 R .990 aR Square .980 Adjusted R Square .973 Std. Error of the Estimate 8480.38783 1
a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元
b. Dependent Variable: 能源消费标准煤总量/万吨
分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。该方程有6个解释变量,调整的判定系数为0.973,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。
能源消费需求的多元线性回归分析结果(强制进入策略) (二) ANOVA Model 1 Regression Residual Total Sum of Squares 5.766E10 1.151E9 5.882E10 df 6 16 22 Mean Square 9.611E9 7.192E7 F 133.636 Sig. .000 ab a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Dependent Variable: 能源消费标准煤总量/万吨
分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及均方分别为1.151E9和7.192E7,F检验统计量的观测值为133.636,对应的概率p值近似为0。如果显著性水平a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。
2
能源消费需求的多元线性回归分析结果(强制进入策略) (三)
Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% B 168326.234 -.142 .503 8.294 -.203 233.912 -1373.376 Std. Error 108640.972 .764 .249 10.431 .111 388.519 1588.868 -.191 .293 .619 -.075 .338 -.051 Coefficients Beta t 1.549 -.186 2.024 .795 -1.829 .602 -.864 Sig. .141 .855 .060 .438 .086 .556 .400 .001 .058 .002 .731 .004 .353 Collinearity Statistics Tolerance VIF a 854.967 17.109 495.962 1.368 257.777 2.833 a. Dependent Variable: 能源消费标准煤总量/万吨
分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解释变量的容忍度和方差膨胀因子。
由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍度和方差膨胀因子来看,该方程的解释变量的多重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变量。
3
能源消费需求的多元线性回归分析结果(强制进入策略) (四) Collinearity Diagnostics Variance Proportions DimensiModel 1 on 1 2 3 4 5 6 7 Eigenvalue 5.714 .709 .551 .023 .001 .000 .000 Condition Index 1.000 2.838 3.219 15.624 62.420 135.055 211.339 (Constant) .00 .00 .00 .00 .00 .00 .99 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 .00 .00 .00 .00 .00 .99 .00 .00 .00 .01 .81 .10 .07 .02 .00 .00 .00 .00 .22 .62 .15 交通运输邮电业增人均电力消费/千瓦能源加工转换效率加值/亿元 .01 .66 .16 .00 .14 .00 .02 时 .00 .00 .00 .01 .47 .43 .10 /% .00 .00 .00 .00 .01 .00 .99 aa. Dependent Variable: 能源消费标准煤总量/万吨
分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1)。依据该表可以进行多重共线性检测。
从方差比来看,第6个特征根既能解释国内生产总值方差的99%,也可以解释建筑业增加值方差的62%,同时还可以解释人均电力消费方差的43%,因此有理由认为这些变量间存在多重共线性。
从条件指数来看,第4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。
4
多元线性回归模型的其他操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Backward方法;
在Statistics框中,选择Estimates、Model fit、R-squared change、Durbin-Watson选项; 在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;
在Save框中,选择Predicted Values中的Standardized,Residuals中的Standardized选项;结果如下:
能源消费需求的多元线性回归分析结果(向后筛选策略) (一) Model Summary Adjusted R Model 1 2 3 4 5 R .990 .990 .990 .989 .987 edcbafStd. Error of the Estimate R Square Change .980 .000 .000 -.002 -.003 Change Statistics F Change 133.636 .035 .432 1.645 2.882 df1 6 1 1 1 1 df2 16 16 17 18 19 Sig. F Change .000 .855 .520 .216 .106 .741 Durbin-Watson R Square .980 .980 .980 .978 .975 Square .973 .975 .975 .975 .972 8480.38783 8236.10826 8105.20563 8241.72504 8620.83495 a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 5
c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨
分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度下降了。依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。如果显著性水平a为0.05,可以看到这些被剔除变量的偏F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。最终保留在方程中的变量是工业增加值、建筑业增加值。方程的DW检验值为0.741,残差存在一定程度的正自相关。
能源消费需求的多元线性回归分析结果(向后筛选策略) (二) ANOVA Model 1 Regression Residual Total 2 Regression Residual Total Sum of Squares 5.766E10 1.151E9 5.882E10 5.766E10 1.153E9 5.882E10 df 6 16 22 5 17 22 1.153E10 6.783E7 Mean Square 9.611E9 7.192E7 F 133.636 Sig. .000 af 170.010 .000 b 6
3 Regression Residual Total 5.763E10 1.182E9 5.882E10 5.752E10 1.291E9 5.882E10 5.733E10 1.486E9 5.882E10 4 18 22 3 19 22 2 20 22 1.441E10 6.569E7 219.321 .000 c 282.290 .000 d 1.917E10 6.793E7 4 Regression Residual Total 385.694 .000 e 2.866E10 7.432E7 5 Regression Residual Total a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨
分析:表中的第五个模型是最终的方程。如果显著性水平a为0.05,由于回归方程显著性检验的概率p值小于显著性水平,因此被解释变量与解释变量的线性关系显著,建立线性模型是恰当的。
7
能源消费需求的多元线性回归分析结果(向后筛选策略) (三) Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 2 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% B 168326.234 -.142 .503 8.294 -.203 233.912 -1373.376 168324.108 .489 6.768 -.204 185.993 -1359.393 Std. Error 108640.972 .764 .249 10.431 .111 388.519 1588.868 105511.543 .230 6.275 .108 282.858 1541.379 .285 .505 -.075 .269 -.050 -.191 .293 .619 -.075 .338 -.051 Coefficients Beta t 1.549 -.186 2.024 .795 -1.829 .602 -.864 1.595 2.123 1.079 -1.894 .658 -.882 Sig. .141 .855 .060 .438 .086 .556 .400 .129 .049 .296 .075 .520 .390 a8
3 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 能源加工转换效率/% 199581.167 .456 10.708 -.175 -1774.819 80721.633 .473 9.902 -.166 80452.139 .464 .696 92699.722 .221 1.836 .096 1383.608 2754.362 .225 1.755 .098 2876.271 .235 .431 .270 .324 .275 .739 -.061 .265 .799 -.064 -.066 2.153 2.061 5.831 -1.811 -1.283 29.307 2.105 5.644 -1.698 27.971 1.977 1.615 .045 .054 .000 .087 .216 .000 .049 .000 .106 .000 .002 .000 4 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 5 (Constant) 工业增加值/亿元 建筑业增加值/亿元 a. Dependent Variable: 能源消费标准煤总量/万吨
分析:表中展示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。如果显著性水平a为0.05,则前四个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。第五个模型是最终的方程,其回归系数显著性检验的概率p值小于显著性水平,因此工业增加值、建筑业增加值与被解释变量间的线性关系显著,它们保留在模型中是合理的。最终的回归方程是,能源消费需求=80452.139+0.464工业增加值+0.696建筑业增加值,意味着当工业增加值每增加一个单位或建筑业增加值每增加一个单位,能源消费需求分别平均增加0.464个单位或0.696个单位。
能源消费需求的多元线性回归分析结果(向后筛选策略) (四)
9
Excluded Variables Collinearity Partial Model 2 3 国内生产总值/亿元 国内生产总值/亿元 人均电力消费/千瓦时 4 国内生产总值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 5 国内生产总值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 交通运输邮电业增加值/亿元 Beta In -.191 .217 .269 .479 .417 -.066 .055 .111 -.059 -.061 ddddcccbbaeStatistics Tolerance .001 .002 .007 .002 .008 .425 .003 .010 .427 .891 t -.186 .288 .658 .668 1.124 -1.283 .077 .304 -1.096 -1.698 Sig. .855 .777 .520 .513 .276 .216 .940 .764 .287 .106 Correlation -.047 .070 .157 .156 .256 -.289 .018 .070 -.244 -.363 a. Predictors in the Model: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 b. Predictors in the Model: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 c. Predictors in the Model: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors in the Model: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 e. Dependent Variable: 能源消费标准煤总量/万吨 10
分析:上表展示了变量剔除方程的过程。各数据项的含义依次是:在剔除其他变量的情况下,如果该变量保留在模型中其标准化回归系数、t检验值和概率p值。在模型3中,剔除国内生产总值的情况下,如果保留人均电力消费,那么它的标准化回归系数为0.269,但回归系数的检验不显著(概率p值为0.520)。剔除人均电力消费的情况下,如果保留国内生产总值,那么它的标准化回归系数为0.217,但回归系数的检验不显著(概率p值为0.777)。
Charts
11
能源消费需求多元线性回归分析的残差累计概率图
12
分析:上图中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果(见下表)表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。
标准化残差的非参数检验结果 One-Sample Kolmogorov-Smirnov Test N Normal Parameters a Standardized Residual 23 Mean Std. Deviation .0000000 .95346259 .162 .108 -.162 .776 .584 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal.
分析:在上面残差累计概率图种,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。而计算残差与预测值的Spearman等级相关系数为-0.027(见下表Spearman等级相关分析结果),且检验不显著,因此认为异方差现象并不明显。
能源消费需求多元线性回归分析的残差图
13
14
标准化残差与标准化预测值的Spearman等级相关分析结果
Correlations Spearman's rho Standardized Predicted Value Correlation Coefficient Sig. (2-tailed) N Standardized Predicted Value 1.000 . 23 -.027 .904 23 Standardized Residual -.027 .904 23 1.000 . 23 Standardized Residual Correlation Coefficient Sig. (2-tailed) N
原始数据:能源消费数据分析
能源消费
国内生产
标准煤总
年份X1 总值X3/亿
量X2/万
元
吨
1985 76682 9016 1986 80850 10275.2 1987 86632 12058.6 1988 92997 15042.8
建筑业增
工业增加
加值X5/
值X4/亿元
亿元 3448.7 3967 4585.8 5777.2
417.9 525.7 665.8 810
交通运输邮电业增加值X6/亿元 406.9 475.6 544.9 661
人均电力消费X7/千瓦时 21.3 23.2 26.4 31.2
能源加工转换效率X8/% 68.29 68.32 67.48 66.54
15
1989 96934 1990 98703 1991 103783 1992 109170 1993 115993 1994 122737 1995 131176 1996 138948 1997 137798 1998 132214 1999 133831 2000 138553 2001 143199 2002 151797 2003 174990 2004 203227 2005 223319 2006 246270 2007 265583 16092.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 211923.5 249529.9 6484 6858 8087.1 10284.5 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 794 859.4 1015.1 1415 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 786 1147.5 1409.7 1681.8 2205.6 2898.3 3424.1 4068.5 4593 5278.4 5821.8 7333.4 8406.1 93930.4 10098.4 12147.6 10526.1 12481.1 14604.1 16
35.3 66.51 42.4 67.2 46.9 65.9 54.6 66 61.2 67.32 72.7 65.2 83.5 71.05 93.1 71.5 101.8 69.23 106.6 69.44 118.2 69.19 132.4 69.04 144.6 69.03 156.3 69.04 173.7 69.4 190.2 70.71 216.7 71.08 249.4 71.24 274.9 71.25
正在阅读:
SPSS实验6-回归分析06-04
现代汉语1语音文字词汇(大一上)考点03-17
2019秋部编版(统编版)五年级语文上册期末测试卷(含答案)-精编11-26
初中学生成绩报告单模板(1)06-16
概率论与数理统计练习册(最新)04-13
11规则驾驶专业+船舶操纵与避碰04-12
- 小学生造句大全
- 增压泵投资项目可行性研究报告(模板)
- 高中语文人教版粤教版必修1-5全部文言文知识点归纳
- 两学一做专题民主生活会组织生活会批评与自我批评环节个人发言提
- 管理处环境保洁工作操作标准作业指导书
- 2012六一儿童节活动议程 - 图文
- 移树申请报告
- 《贵州省市政工程计价定额》2016定额说明及计算规则
- 计算机长期没有向WSUS报告状态
- 汉语拼音教学策略研究
- 发展西部领先的航空货运枢纽
- 司法所上半年工作总结4篇
- 如何提高银行服务水平
- 发电厂各级人员岗位职责
- 丰田汽车的外部环境分析
- 2017—2018年最新冀教版四年级数学下册《混合运算》教案精品优质
- 中建八局样板策划 - 图文
- 戚安邦《项目管理学》电子书
- 2015年高级项目经理笔记
- 弯桥的设计要点
- 回归
- 实验
- 分析
- SPSS
- 苗木的维护管理和病虫害防治措施
- 高考状元李炜谈数学几何的复习
- 2009年全国注册安全工程师《安全生产管理知识》真题及答案(6)
- ISO45001-2018职业健康安全管理体系内审员考试试题及答案
- 关于发布《铁路建设项目管理程序指导意见》的通知
- 人力资源二级-绩效-历年真题
- 2018届九年级数学下册2.5直线与圆的位置关系2.5.3切线长定理教案
- 材料基础重点与习题答案
- 关于下发杨林董事长在长城电工三季度经济运行工作会议上的讲话的
- 参观学校心得体会
- 第三届中金所杯题库-答案完整版
- 曲轴的设计要求及基本参数设计原则
- 防震锤的安装距离
- 掘进工作面文明生产精细化管理标准
- 八年级英语上册Unit2学教案4
- 人教版 一年级 教材 解读
- 绿色食品标志使用申请书初次申请续展申请申请人盖章申 - 图文
- 一年级数学求被减数的简单实际问题教案
- 主持词
- 1房屋构造