回归分析SPSS习题答案

更新时间:2024-04-06 08:12:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

回归分析习题

1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作 (1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度);

(2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程;

(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。

表 20个商业中心有关指标的数据

商业中单位面积年每小时机日人流居民年消对商场环对商场对商场商心编号 营业额(万动车流量量 (万费额(万境满意度设施满品丰富程x4 元/平方(万辆)x1 人)x2 元)x3 意度x5 度满意度x6 米)Y 1 2 3 4 5 6 … 15 16 17 18 19 20 2.5 3.2 2.5 3.4 1.8 0.9 … 2.6 2.7 1.4 3.2 2.9 2.5 0.51 0.26 0.72 1.23 0.69 0.36 … 1.04 1.18 0.61 1.05 1.06 0.58 3.90 4.24 4.54 6.98 4.21 2.91 … 5.53 5.98 1.27 5.77 5.71 4.11 1.94 2.86 1.63 1.92 0.71 0.62 … 1.30 1.28 1.48 2.16 1.74 1.85 7 7 8 6 8 5 … 10 8 6 7 6 7 9 4 8 10 4 6 … 7 7 7 10 9 9 6 6 7 10 7 5 … 9 9 1 9 9 6

2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。

1. 解:(1)变量间的相关性分析

利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1

从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量 (万人) ”和x3“居民年消费额(万元) ”线性关系较密切。

x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切

从表1得?(y,x3)=0.795**,?(y,x2)=0.790**,?(y,x6)=.0 .697**,

说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。

图1散点图矩阵 表1相关矩阵 对商场商 单位面积 每小时机 居民年 对商场 对商场 品丰富程 年营业额 动车流量 日人流量 消费额 环境 设施 度满意(万元/m2) (万辆) (万人) (万元) 满意度 满意度 度 .413 .071 20 1 20 .751** .790** .000 20 .751** .000 20 1 .795** .000 20 -.129 .588 20 .273 .341 .141 20 .450* .697** .046 20 .001 20 .774** .000 20 .983** 单位面积 年营业额 (万元/m2) Pearson 相关1 性 显著性(双侧) N 20 每小时机动车 流量(万辆) Pearson 相关.413 性 显著性(双侧) .071 N 20 .664** .424 .001 20 .062 20 日人流量 (万人) Pearson 相关.790** 性 .594** .279 显著性(双侧) .000 N 居民年消费额 (万元) 20 .000 20 -.129 .588 20 .664** .001 20 .424 .062 20 .774** .000 20 20 .273 .245 20 .594** .006 20 .279 .233 20 .983** .000 20 .245 20 1 20 -.112 .639 20 .426 .061 20 .144 .545 20 .006 20 -.112 .639 20 1 20 .042 .862 20 .233 20 .426 .061 20 .042 .862 20 1 20 .000 20 .144 .545 20 .643** .002 20 .243 .302 20 1 20 Pearson 相关.795** 性 显著性(双侧) .000 N 20 对商场环境 满意度 Pearson 相关.341 性 显著性(双侧) .141 N 20 对商场设施 满意度 Pearson 相关.450* 性 显著性(双侧) .046 N 20 对商场商品 丰富程度 满意度 Pearson 相关.697** 性 显著性(双侧) .001 N 20 .643** .243 .002 20 .302 20 **. 在 .01 水平(双侧)上显著相关。

(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程 设 ??y??0??1x3?? 2???~N(0,)利用SPSS软件的线性回归分析的模块进行分析,结果见表2~表6和图2~图3

由最小二乘估计得到一元线性回归方程(见表4)

Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)

由回归方程的显著性检验的p值Sig.= .000,知回归方程在α=0.01的水平上通过检验,

即Y 与x3的线性关系是显著的(见表3方差分析表)

由常量?0的t检验的p值Sig.=0.005<0.01知回归方程的常数项不为零。拟合有常数 项的回归方程是合适的 (见表4 系数表)

由方程的拟合优度(可决系数)R2=0.631,知方程的拟合优度(可决系数)还不够高,即方程有改进的余地,还可以引入有关的变量 。(见表1)

对残差作Shapiro-Wilk正态性检验,p值Sig.=0.538>0.05(见表5)知随机误差项从正态分布的假定满足。

作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项

?i服

?i服从正态分布的

假定满足

对残差序列作D-W检验,检验统计量Durbin-Watson=2.125知?1,?2,?,?n之间存在 一定的负自相关:?1,?2,?,?n相互独立的假定不一定满足(见表2)

以标准化的残差et为纵坐标,而以标准化的预测值yi为横坐标做残差的散点图(见图3)。图中显示散点随机地分布在–2到+2的带子里,可以认为线性回归模型的等方差假定成立 。

?

结论:

(1)一元线性回归方程

Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)

在α=0.01的水平上通过检验,拟合优度为0.631,方程有改进的余地,还可以引入有关的变量 。

(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满足。

表2 模型汇总 模型 1 R .795 abR 方 .631 调整 R 方 标准 估计的误差 Durbin-Watson .611 .51341 2.125 a. 预测变量: (常量), 居民年消费额(万元)。 b. 因变量: 单位面积年营业额(万元/m2)

表3 方差分析表 Anova 模型 1 回归 残差 总计 平方和 8.125 4.745 12.870 df 1 18 19 均方 8.125 .264 F 30.824 Sig. .000 ab a. 预测变量: (常量), 居民年消费额(万元)。 b. 因变量: 单位面积年营业额(万元/m2) 表4 系数 非标准化系数 模型 1 (常量) B .928 标准 误差 .288 标准系数 试用版 t 3.220 Sig. .005 a 居民年消费额(万元) a. 因变量: 单位面积年营业额(万元/m2) .887 .160 .795 5.552 .000 表5 残差的正态性检验 Tests of Normality Standardized Residual Kolmogorov-Smirnov Statistic .090 df 20 Sig. .200 *aShapiro-Wilk Statistic .960 df Sig. 20 .538 a. Lilliefors Significance Correction *. This is a lower bound of the true significance.

图2 回归标准化残差的标准P-P图

对商场环境满意度 对商场设施满意度 对商场商品丰富程度满意度 3 每小时机动车流量(万辆) 对商场设施满意度 对商场商品丰富程度满意度 .566 .790 .017 .291 .789 .016 1.767 1.266 59.374 3.442 1.267 62.518 .530 .790 .016 .277 .516 .016 d. 因变量: 单位面积年营业额(万元/m2) 表13 共线性诊断a 模型 1 维数 1 2 2 1 2 3 3 1 2 3 4 特征值 1.917 .083 2.837 .105 .058 3.785 .136 .062 .017 条件索引 1.000 4.812 1.000 5.197 6.971 1.000 5.270 7.823 14.838 (常量) .04 .96 .01 .04 .95 .00 .00 .23 .76 元) 方差比例 居民年消费额(万日人流量(万人) .04 .96 .02 .89 .10 .01 .68 .01 .31 对商场环境满意度 .01 .33 .66 .00 .03 .59 .38 .00 .05 .02 .93 a. 因变量: 单位面积年营业额(万元/m2) 表14 残差统计量a 预测值 残差 标准 预测值 标准 残差 极小值 1.0291 -.28298 -1.668 -3.193 极大值 3.9475 .08128 1.896 .917 均值 2.3950 .00000 .000 .000 标准 偏差 .81898 .08132 1.000 .918 N 20 20 20 20 a. 因变量: 单位面积年营业额(万元/m2)

表15 Tests of Normality Standardized Residual Kolmogorov-Smirnov Statistic .172 df 20 Sig. .121 aShapiro-Wilk Statistic .775 df 20 Sig. .000 a. Lilliefors Significance Correction

图4 回归标准化残差的标准P-P图

图5 标准化残差图

2. 我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。 试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。 解:

(1)利用SPSS软件作Y与X的散点图

由散点图可以看出可以利用

指数(Exponential)回归 y= aebx 对数(Logarithmic)回归 y= a +b lnx 幂函数(Power)回归 y= axb

二次曲线(Quadratic) y =b0?b1x?b2x2 三次曲线(Cubic) y =b0?b1x?b2x2?b3x3 作曲线拟合

(2)利用SPSS软件拟合结果

Model Summary and Parameter Estimates Dependent Variable:财政收入 Model Summary Equation Logarithmic Quadratic Cubic Power Exponential R Square .767 .979 F 59.175 394.453 df1 1 2 3 1 1 df2 18 17 16 18 18 Sig. Constant Parameter Estimates b1 3913.184 b2 b3 .000 -34350.518 .000 .000 .000 .000 2040.650 304.429 1.384 1562.950 -.010 1.523E-6 .998 3381.137 .962 .965 456.238 498.531 .202 -3.886E-6 3.674E-11 .785 2.428E-5 The independent variable is 国内生产总值. .95e0.00002428x 指数(Exponential)回归 y= 1562对数(Logarithmic)回归 y= -34350.518 + 3913.184lnx 幂函数(Power)回归 y= 1.384x0.785

二次曲线(Quadratic) y =2040.65?0.01x?(1.523E?6)x2

三次曲线(Cubic) y =304.429?0.202x?(3.886E?6)x2?(3.674E?11)x3

三次曲线的R Square=0.998>二次曲线的R Square=0.979>指数回归的R Square=0.965>幂函数

回归的R Square=0.962,以上四种曲线拟合都可以,三次曲线拟合最好。

本文来源:https://www.bwwdw.com/article/ojwr.html

Top