SPSS实验6-回归分析

更新时间:2024-06-04 03:13:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPSS作业6:回归分析

(一) 回归分析

多元线性回归模型的基本操作:

(1)选择菜单Analyze-Regression-Linear;

(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;

(3)在Method框中,选择Enter方法;

在Statistics框中,选择Estimates、Model fit、Covariancematrix、Collinearity diagnostics选项; 在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot; (4)选择菜单Analyze-Non Test-1-Sanple K-S; 选择菜单Analyze-Correlate-Brivariate; 结果如下:

Regression

能源消费需求的多元线性回归分析结果(强制进入策略) (一) Model Summary bModel 1 R .990 aR Square .980 Adjusted R Square .973 Std. Error of the Estimate 8480.38783 1

a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元

b. Dependent Variable: 能源消费标准煤总量/万吨

分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。该方程有6个解释变量,调整的判定系数为0.973,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。

能源消费需求的多元线性回归分析结果(强制进入策略) (二) ANOVA Model 1 Regression Residual Total Sum of Squares 5.766E10 1.151E9 5.882E10 df 6 16 22 Mean Square 9.611E9 7.192E7 F 133.636 Sig. .000 ab a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Dependent Variable: 能源消费标准煤总量/万吨

分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及均方分别为1.151E9和7.192E7,F检验统计量的观测值为133.636,对应的概率p值近似为0。如果显著性水平a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。

2

能源消费需求的多元线性回归分析结果(强制进入策略) (三)

Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% B 168326.234 -.142 .503 8.294 -.203 233.912 -1373.376 Std. Error 108640.972 .764 .249 10.431 .111 388.519 1588.868 -.191 .293 .619 -.075 .338 -.051 Coefficients Beta t 1.549 -.186 2.024 .795 -1.829 .602 -.864 Sig. .141 .855 .060 .438 .086 .556 .400 .001 .058 .002 .731 .004 .353 Collinearity Statistics Tolerance VIF a 854.967 17.109 495.962 1.368 257.777 2.833 a. Dependent Variable: 能源消费标准煤总量/万吨

分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解释变量的容忍度和方差膨胀因子。

由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍度和方差膨胀因子来看,该方程的解释变量的多重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变量。

3

能源消费需求的多元线性回归分析结果(强制进入策略) (四) Collinearity Diagnostics Variance Proportions DimensiModel 1 on 1 2 3 4 5 6 7 Eigenvalue 5.714 .709 .551 .023 .001 .000 .000 Condition Index 1.000 2.838 3.219 15.624 62.420 135.055 211.339 (Constant) .00 .00 .00 .00 .00 .00 .99 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 .00 .00 .00 .00 .00 .99 .00 .00 .00 .01 .81 .10 .07 .02 .00 .00 .00 .00 .22 .62 .15 交通运输邮电业增人均电力消费/千瓦能源加工转换效率加值/亿元 .01 .66 .16 .00 .14 .00 .02 时 .00 .00 .00 .01 .47 .43 .10 /% .00 .00 .00 .00 .01 .00 .99 aa. Dependent Variable: 能源消费标准煤总量/万吨

分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1)。依据该表可以进行多重共线性检测。

从方差比来看,第6个特征根既能解释国内生产总值方差的99%,也可以解释建筑业增加值方差的62%,同时还可以解释人均电力消费方差的43%,因此有理由认为这些变量间存在多重共线性。

从条件指数来看,第4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。

4

多元线性回归模型的其他操作:

(1)选择菜单Analyze-Regression-Linear;

(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;

(3)在Method框中,选择Backward方法;

在Statistics框中,选择Estimates、Model fit、R-squared change、Durbin-Watson选项; 在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;

在Save框中,选择Predicted Values中的Standardized,Residuals中的Standardized选项;结果如下:

能源消费需求的多元线性回归分析结果(向后筛选策略) (一) Model Summary Adjusted R Model 1 2 3 4 5 R .990 .990 .990 .989 .987 edcbafStd. Error of the Estimate R Square Change .980 .000 .000 -.002 -.003 Change Statistics F Change 133.636 .035 .432 1.645 2.882 df1 6 1 1 1 1 df2 16 16 17 18 19 Sig. F Change .000 .855 .520 .216 .106 .741 Durbin-Watson R Square .980 .980 .980 .978 .975 Square .973 .975 .975 .975 .972 8480.38783 8236.10826 8105.20563 8241.72504 8620.83495 a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 5

c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨

分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度下降了。依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。如果显著性水平a为0.05,可以看到这些被剔除变量的偏F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。最终保留在方程中的变量是工业增加值、建筑业增加值。方程的DW检验值为0.741,残差存在一定程度的正自相关。

能源消费需求的多元线性回归分析结果(向后筛选策略) (二) ANOVA Model 1 Regression Residual Total 2 Regression Residual Total Sum of Squares 5.766E10 1.151E9 5.882E10 5.766E10 1.153E9 5.882E10 df 6 16 22 5 17 22 1.153E10 6.783E7 Mean Square 9.611E9 7.192E7 F 133.636 Sig. .000 af 170.010 .000 b 6

3 Regression Residual Total 5.763E10 1.182E9 5.882E10 5.752E10 1.291E9 5.882E10 5.733E10 1.486E9 5.882E10 4 18 22 3 19 22 2 20 22 1.441E10 6.569E7 219.321 .000 c 282.290 .000 d 1.917E10 6.793E7 4 Regression Residual Total 385.694 .000 e 2.866E10 7.432E7 5 Regression Residual Total a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元 b. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨

分析:表中的第五个模型是最终的方程。如果显著性水平a为0.05,由于回归方程显著性检验的概率p值小于显著性水平,因此被解释变量与解释变量的线性关系显著,建立线性模型是恰当的。

7

能源消费需求的多元线性回归分析结果(向后筛选策略) (三) Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 2 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 人均电力消费/千瓦时 能源加工转换效率/% B 168326.234 -.142 .503 8.294 -.203 233.912 -1373.376 168324.108 .489 6.768 -.204 185.993 -1359.393 Std. Error 108640.972 .764 .249 10.431 .111 388.519 1588.868 105511.543 .230 6.275 .108 282.858 1541.379 .285 .505 -.075 .269 -.050 -.191 .293 .619 -.075 .338 -.051 Coefficients Beta t 1.549 -.186 2.024 .795 -1.829 .602 -.864 1.595 2.123 1.079 -1.894 .658 -.882 Sig. .141 .855 .060 .438 .086 .556 .400 .129 .049 .296 .075 .520 .390 a8

3 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 能源加工转换效率/% 199581.167 .456 10.708 -.175 -1774.819 80721.633 .473 9.902 -.166 80452.139 .464 .696 92699.722 .221 1.836 .096 1383.608 2754.362 .225 1.755 .098 2876.271 .235 .431 .270 .324 .275 .739 -.061 .265 .799 -.064 -.066 2.153 2.061 5.831 -1.811 -1.283 29.307 2.105 5.644 -1.698 27.971 1.977 1.615 .045 .054 .000 .087 .216 .000 .049 .000 .106 .000 .002 .000 4 (Constant) 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增加值/亿元 5 (Constant) 工业增加值/亿元 建筑业增加值/亿元 a. Dependent Variable: 能源消费标准煤总量/万吨

分析:表中展示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。如果显著性水平a为0.05,则前四个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。第五个模型是最终的方程,其回归系数显著性检验的概率p值小于显著性水平,因此工业增加值、建筑业增加值与被解释变量间的线性关系显著,它们保留在模型中是合理的。最终的回归方程是,能源消费需求=80452.139+0.464工业增加值+0.696建筑业增加值,意味着当工业增加值每增加一个单位或建筑业增加值每增加一个单位,能源消费需求分别平均增加0.464个单位或0.696个单位。

能源消费需求的多元线性回归分析结果(向后筛选策略) (四)

9

Excluded Variables Collinearity Partial Model 2 3 国内生产总值/亿元 国内生产总值/亿元 人均电力消费/千瓦时 4 国内生产总值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 5 国内生产总值/亿元 人均电力消费/千瓦时 能源加工转换效率/% 交通运输邮电业增加值/亿元 Beta In -.191 .217 .269 .479 .417 -.066 .055 .111 -.059 -.061 ddddcccbbaeStatistics Tolerance .001 .002 .007 .002 .008 .425 .003 .010 .427 .891 t -.186 .288 .658 .668 1.124 -1.283 .077 .304 -1.096 -1.698 Sig. .855 .777 .520 .513 .276 .216 .940 .764 .287 .106 Correlation -.047 .070 .157 .156 .256 -.289 .018 .070 -.244 -.363 a. Predictors in the Model: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电力消费/千瓦时, 建筑业增加值/亿元 b. Predictors in the Model: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 c. Predictors in the Model: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元 d. Predictors in the Model: (Constant), 工业增加值/亿元, 建筑业增加值/亿元 e. Dependent Variable: 能源消费标准煤总量/万吨 10

分析:上表展示了变量剔除方程的过程。各数据项的含义依次是:在剔除其他变量的情况下,如果该变量保留在模型中其标准化回归系数、t检验值和概率p值。在模型3中,剔除国内生产总值的情况下,如果保留人均电力消费,那么它的标准化回归系数为0.269,但回归系数的检验不显著(概率p值为0.520)。剔除人均电力消费的情况下,如果保留国内生产总值,那么它的标准化回归系数为0.217,但回归系数的检验不显著(概率p值为0.777)。

Charts

11

能源消费需求多元线性回归分析的残差累计概率图

12

分析:上图中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果(见下表)表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。

标准化残差的非参数检验结果 One-Sample Kolmogorov-Smirnov Test N Normal Parameters a Standardized Residual 23 Mean Std. Deviation .0000000 .95346259 .162 .108 -.162 .776 .584 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal.

分析:在上面残差累计概率图种,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。而计算残差与预测值的Spearman等级相关系数为-0.027(见下表Spearman等级相关分析结果),且检验不显著,因此认为异方差现象并不明显。

能源消费需求多元线性回归分析的残差图

13

14

标准化残差与标准化预测值的Spearman等级相关分析结果

Correlations Spearman's rho Standardized Predicted Value Correlation Coefficient Sig. (2-tailed) N Standardized Predicted Value 1.000 . 23 -.027 .904 23 Standardized Residual -.027 .904 23 1.000 . 23 Standardized Residual Correlation Coefficient Sig. (2-tailed) N

原始数据:能源消费数据分析

能源消费

国内生产

标准煤总

年份X1 总值X3/亿

量X2/万

1985 76682 9016 1986 80850 10275.2 1987 86632 12058.6 1988 92997 15042.8

建筑业增

工业增加

加值X5/

值X4/亿元

亿元 3448.7 3967 4585.8 5777.2

417.9 525.7 665.8 810

交通运输邮电业增加值X6/亿元 406.9 475.6 544.9 661

人均电力消费X7/千瓦时 21.3 23.2 26.4 31.2

能源加工转换效率X8/% 68.29 68.32 67.48 66.54

15

1989 96934 1990 98703 1991 103783 1992 109170 1993 115993 1994 122737 1995 131176 1996 138948 1997 137798 1998 132214 1999 133831 2000 138553 2001 143199 2002 151797 2003 174990 2004 203227 2005 223319 2006 246270 2007 265583 16092.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 211923.5 249529.9 6484 6858 8087.1 10284.5 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 794 859.4 1015.1 1415 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 786 1147.5 1409.7 1681.8 2205.6 2898.3 3424.1 4068.5 4593 5278.4 5821.8 7333.4 8406.1 93930.4 10098.4 12147.6 10526.1 12481.1 14604.1 16

35.3 66.51 42.4 67.2 46.9 65.9 54.6 66 61.2 67.32 72.7 65.2 83.5 71.05 93.1 71.5 101.8 69.23 106.6 69.44 118.2 69.19 132.4 69.04 144.6 69.03 156.3 69.04 173.7 69.4 190.2 70.71 216.7 71.08 249.4 71.24 274.9 71.25

本文来源:https://www.bwwdw.com/article/ax16.html

Top