回归分析SPSS习题答案
更新时间:2024-06-20 18:11:01 阅读量: 综合文库 文档下载
回归分析习题
1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作 (1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度);
(2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程;
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
表 20个商业中心有关指标的数据
商业中单位面积年每小时机日人流居民年消对商场环对商场对商场商心编号 营业额(万动车流量量 (万费额(万境满意度设施满品丰富程x4 元/平方(万辆)x1 人)x2 元)x3 意度x5 度满意度x6 米)Y 1 2 3 4 5 6 … 15 16 17 18 19 20 2.5 3.2 2.5 3.4 1.8 0.9 … 2.6 2.7 1.4 3.2 2.9 2.5 0.51 0.26 0.72 1.23 0.69 0.36 … 1.04 1.18 0.61 1.05 1.06 0.58 3.90 4.24 4.54 6.98 4.21 2.91 … 5.53 5.98 1.27 5.77 5.71 4.11 1.94 2.86 1.63 1.92 0.71 0.62 … 1.30 1.28 1.48 2.16 1.74 1.85 7 7 8 6 8 5 … 10 8 6 7 6 7 9 4 8 10 4 6 … 7 7 7 10 9 9 6 6 7 10 7 5 … 9 9 1 9 9 6
2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。
1. 解:(1)变量间的相关性分析
利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1
从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量 (万人) ”和x3“居民年消费额(万元) ”线性关系较密切。
x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切
从表1得?(y,x3)=0.795**,?(y,x2)=0.790**,?(y,x6)=.0 .697**,
说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。
图1散点图矩阵 表1相关矩阵 对商场商 单位面积 每小时机 居民年 对商场 对商场 品丰富程 年营业额 动车流量 日人流量 消费额 环境 设施 度满意(万元/m2) (万辆) (万人) (万元) 满意度 满意度 度 .413 .071 20 1 20 .751** .790** .000 20 .751** .000 20 1 .795** .000 20 -.129 .588 20 .273 .341 .141 20 .450* .697** .046 20 .001 20 .774** .000 20 .983** 单位面积 年营业额 (万元/m2) Pearson 相关1 性 显著性(双侧) N 20 每小时机动车 流量(万辆) Pearson 相关.413 性 显著性(双侧) .071 N 20 .664** .424 .001 20 .062 20 日人流量 (万人) Pearson 相关.790** 性 .594** .279 显著性(双侧) .000 N 居民年消费额 (万元) 20 .000 20 -.129 .588 20 .664** .001 20 .424 .062 20 .774** .000 20 20 .273 .245 20 .594** .006 20 .279 .233 20 .983** .000 20 .245 20 1 20 -.112 .639 20 .426 .061 20 .144 .545 20 .006 20 -.112 .639 20 1 20 .042 .862 20 .233 20 .426 .061 20 .042 .862 20 1 20 .000 20 .144 .545 20 .643** .002 20 .243 .302 20 1 20 Pearson 相关.795** 性 显著性(双侧) .000 N 20 对商场环境 满意度 Pearson 相关.341 性 显著性(双侧) .141 N 20 对商场设施 满意度 Pearson 相关.450* 性 显著性(双侧) .046 N 20 对商场商品 丰富程度 满意度 Pearson 相关.697** 性 显著性(双侧) .001 N 20 .643** .243 .002 20 .302 20 **. 在 .01 水平(双侧)上显著相关。
(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程 设 ??y??0??1x3?? 2???~N(0,)利用SPSS软件的线性回归分析的模块进行分析,结果见表2~表6和图2~图3
由最小二乘估计得到一元线性回归方程(见表4)
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
由回归方程的显著性检验的p值Sig.= .000,知回归方程在α=0.01的水平上通过检验,
即Y 与x3的线性关系是显著的(见表3方差分析表)
由常量?0的t检验的p值Sig.=0.005<0.01知回归方程的常数项不为零。拟合有常数 项的回归方程是合适的 (见表4 系数表)
由方程的拟合优度(可决系数)R2=0.631,知方程的拟合优度(可决系数)还不够高,即方程有改进的余地,还可以引入有关的变量 。(见表1)
对残差作Shapiro-Wilk正态性检验,p值Sig.=0.538>0.05(见表5)知随机误差项从正态分布的假定满足。
作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项
?i服
?i服从正态分布的
假定满足
对残差序列作D-W检验,检验统计量Durbin-Watson=2.125知?1,?2,?,?n之间存在 一定的负自相关:?1,?2,?,?n相互独立的假定不一定满足(见表2)
以标准化的残差et为纵坐标,而以标准化的预测值yi为横坐标做残差的散点图(见图3)。图中显示散点随机地分布在–2到+2的带子里,可以认为线性回归模型的等方差假定成立 。
?
结论:
(1)一元线性回归方程
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
在α=0.01的水平上通过检验,拟合优度为0.631,方程有改进的余地,还可以引入有关的变量 。
(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满足。
表2 模型汇总 模型 1 R .795 abR 方 .631 调整 R 方 标准 估计的误差 Durbin-Watson .611 .51341 2.125 a. 预测变量: (常量), 居民年消费额(万元)。 b. 因变量: 单位面积年营业额(万元/m2)
表3 方差分析表 Anova 模型 1 回归 残差 总计 平方和 8.125 4.745 12.870 df 1 18 19 均方 8.125 .264 F 30.824 Sig. .000 ab a. 预测变量: (常量), 居民年消费额(万元)。 b. 因变量: 单位面积年营业额(万元/m2) 表4 系数 非标准化系数 模型 1 (常量) B .928 标准 误差 .288 标准系数 试用版 t 3.220 Sig. .005 a 居民年消费额(万元) a. 因变量: 单位面积年营业额(万元/m2) .887 .160 .795 5.552 .000 表5 残差的正态性检验 Tests of Normality Standardized Residual Kolmogorov-Smirnov Statistic .090 df 20 Sig. .200 *aShapiro-Wilk Statistic .960 df Sig. 20 .538 a. Lilliefors Significance Correction *. This is a lower bound of the true significance.
图2 回归标准化残差的标准P-P图
图3 标准化残差图 表6 残差统计量 a 预测值 残差 标准 预测值 标准 残差 极小值 1.4244 -.89496 -1.484 -1.743 极大值 4.0049 .76957 2.462 1.499 均值 2.3950 .00000 .000 .000 标准 偏差 .65393 .49972 1.000 .973 N 20 20 20 20 a. 因变量: 单位面积年营业额(万元/m2)
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。 解 设y与x1,x2,?,x8满足
??y??0??1x1????8x8?? 2ε~N(0,)??规定:进入方程的变量的显著性水平为0.05,从方程中剔出变量的显著性水平为0.10,(见表7)
逐步回归的步骤:(见表10)
第一步引入变量x3居民年消费额(万元)得到一元线性回归方程
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额),
第二步引入变量x2日人流量(万人)得到线性回归方程
Y(单位面积年营业额)=-0.117+0.698x3(居民年消费额) +0.317x2(日人流量(万人)), 第三步引入变量x4对商场环境满意度,所得线性回归方程为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))+0.037 x4(对商场环境满意度)
以上3方程在显著性水平为0.05上均通过检验(见表9)。
第3个方程的回归系数(包括常数项)t检验的p值0.010,0.000,0.000,0.034,在显著性水平为0.05上均通过检验(见表10)。
三个方程的修正R方值逐步增大0.611<0.985<.988,故第3个方程为最优的(见表8)
对第3个方程的自变量作共线性诊断(见表10):回归方程第i个回归系数的方差膨胀因子VIF分别1.235、1.885、1.767,说明方程中的3个回归变量不存在共线性,
对残差序列作D-W检验,检验统计量Durbin-Watson=2.574> 2知?1,?2,?,?n之间存在一定的负自相关:?1,?2,?,?n相互独立的假定不一定满足(见表8)
对残差作Shapiro-Wilk正态性检验,p值Sig.= =0 <0.01(见表15)知随机误差项不服从正态分布。
作回归标准化残差的标准P-P图(见图3),进一步验证了随机误差项分布。
以标准化的残差et为纵坐标,而以标准化的预测值yi为横坐标做残差的散点图(见图5)。图中显示散点随机地分布在–2到+2的带子里(除一个点),可以认为线性回归模型的等方差假定成立 。
结论:
(1)“单位面积年营业额”的预测公式为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))+0.037 x4(对商场环境满意度)
方程在显著性水平为0.05上通过检验,调整的R方值=0.988,
(2)模型的假定误差项的正态性和不相关性存在问题,估计方法有待改进。
??i?i不服从正态
表7 输入/移去的变量a 模型 1 输入的变量 居民年消费额(万元) 移去的变量 方法 . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。 2 日人流量(万人) . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。 3 对商场环境满意度 . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。 a. 因变量: 单位面积年营业额(万元/m2) 表8 模型汇总d 模型 1 2 3 R .795a .993b .995c R 方 .631 .987 .990 调整 R 方 标准 估计的误差 .611 .985 .988 .51341 .09930 .08861 Durbin-Watson 2.574 a. 预测变量: (常量), 居民年消费额(万元)。 b. 预测变量: (常量), 居民年消费额(万元), 日人流量(万人)。 c. 预测变量: (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。 d. 因变量: 单位面积年营业额(万元/m2) 表9 Anovad 模型 1 回归 残差 总计 平方和 8.125 4.745 12.870 df 1 18 19 均方 8.125 .264 F 30.824 Sig. .000a 2 回归 残差 总计 12.702 .168 12.870 12.744 .126 12.870 2 17 19 3 16 19 6.351 .010 644.024 .000b .000c 4.248 .008 3 回归 残差 总计 540.982 a. 预测变量: (常量), 居民年消费额(万元)。 b. 预测变量: (常量), 居民年消费额(万元), 日人流量(万人)。 c. 预测变量: (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。 d. 因变量: 单位面积年营业额(万元/m2) 表10 系数a 非标准化系数 模型 1 (常量) 居民年消费额(万元) 2 (常量) 居民年消费额(万元) 日人流量(万人) 3 (常量) 居民年消费额(万元) 日人流量(万人) 对商场环境满意度 a. 因变量: 单位面积年营业额(万元/m2)
系数a 共线性统计量 模型 1 2 居民年消费额(万元) 居民年消费额(万元) 日人流量(万人) 3 居民年消费额(万元) 日人流量(万人) 容差 1.000 .926 .926 .810 .530 VIF 1.000 1.080 1.080 1.235 1.885 B .928 .887 -.117 .698 .317 -.297 .723 .291 .037 标准 误差 .288 .160 .074 .032 .015 .102 .031 .017 .016 标准系数 试用版 t 3.220 .795 5.552 -1.585 .625 .620 21.739 21.544 -2.913 .648 .569 .076 23.603 16.766 2.313 Sig. .005 .000 .131 .000 .000 .010 .000 .000 .034 对商场环境满意度 a. 因变量: 单位面积年营业额(万元/m2) .566 1.767 表11 已排除的变量d 模型 1 每小时机动车流量(万辆) 日人流量(万人) 对商场环境满意度 对商场设施满意度 对商场商品丰富程度满意度 2 每小时机动车流量(万辆) 对商场环境满意度 对商场设施满意度 对商场商品丰富程度满意度 3 每小时机动车流量(万辆) 对商场设施满意度 对商场商品丰富程度满意度 Beta In .524a .620a .436a .137a .595a .088b .076b .013b -.113b .065c .016c -.223c t 6.813 21.544 4.192 .858 16.600 1.927 2.313 .423 -.520 1.459 .546 -1.156 Sig. .000 .000 .001 .403 .000 .072 .034 .678 .610 .165 .593 .266 偏相关 .856 .982 .713 .204 .971 .434 .501 .105 -.129 .353 .140 -.286 a. 模型中的预测变量: (常量), 居民年消费额(万元)。 b. 模型中的预测变量: (常量), 居民年消费额(万元), 日人流量(万人)。 c. 模型中的预测变量: (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。 d. 因变量: 单位面积年营业额(万元/m2) 表12 已排除的变量d 共线性统计量 模型 1 每小时机动车流量(万辆) 日人流量(万人) 对商场环境满意度 对商场设施满意度 对商场商品丰富程度满意度 2 每小时机动车流量(万辆) 容差 .983 .926 .987 .819 .979 .316 VIF 1.017 1.080 1.013 1.221 1.021 3.168 最小容差 .983 .926 .987 .819 .979 .297
对商场环境满意度 对商场设施满意度 对商场商品丰富程度满意度 3 每小时机动车流量(万辆) 对商场设施满意度 对商场商品丰富程度满意度 .566 .790 .017 .291 .789 .016 1.767 1.266 59.374 3.442 1.267 62.518 .530 .790 .016 .277 .516 .016 d. 因变量: 单位面积年营业额(万元/m2) 表13 共线性诊断a 模型 1 维数 1 2 2 1 2 3 3 1 2 3 4 特征值 1.917 .083 2.837 .105 .058 3.785 .136 .062 .017 条件索引 1.000 4.812 1.000 5.197 6.971 1.000 5.270 7.823 14.838 (常量) .04 .96 .01 .04 .95 .00 .00 .23 .76 元) 方差比例 居民年消费额(万日人流量(万人) .04 .96 .02 .89 .10 .01 .68 .01 .31 对商场环境满意度 .01 .33 .66 .00 .03 .59 .38 .00 .05 .02 .93 a. 因变量: 单位面积年营业额(万元/m2) 表14 残差统计量a 预测值 残差 标准 预测值 标准 残差 极小值 1.0291 -.28298 -1.668 -3.193 极大值 3.9475 .08128 1.896 .917 均值 2.3950 .00000 .000 .000 标准 偏差 .81898 .08132 1.000 .918 N 20 20 20 20 a. 因变量: 单位面积年营业额(万元/m2)
表15 Tests of Normality Standardized Residual Kolmogorov-Smirnov Statistic .172 df 20 Sig. .121 aShapiro-Wilk Statistic .775 df 20 Sig. .000 a. Lilliefors Significance Correction
图4 回归标准化残差的标准P-P图
图5 标准化残差图
2. 我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。 试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。 解:
(1)利用SPSS软件作Y与X的散点图
由散点图可以看出可以利用
指数(Exponential)回归 y= aebx 对数(Logarithmic)回归 y= a +b lnx 幂函数(Power)回归 y= axb
二次曲线(Quadratic) y =b0?b1x?b2x2 三次曲线(Cubic) y =b0?b1x?b2x2?b3x3 作曲线拟合
(2)利用SPSS软件拟合结果
Model Summary and Parameter Estimates Dependent Variable:财政收入 Model Summary Equation Logarithmic Quadratic Cubic Power Exponential R Square .767 .979 F 59.175 394.453 df1 1 2 3 1 1 df2 18 17 16 18 18 Sig. Constant Parameter Estimates b1 3913.184 b2 b3 .000 -34350.518 .000 .000 .000 .000 2040.650 304.429 1.384 1562.950 -.010 1.523E-6 .998 3381.137 .962 .965 456.238 498.531 .202 -3.886E-6 3.674E-11 .785 2.428E-5 The independent variable is 国内生产总值. .95e0.00002428x 指数(Exponential)回归 y= 1562对数(Logarithmic)回归 y= -34350.518 + 3913.184lnx 幂函数(Power)回归 y= 1.384x0.785
二次曲线(Quadratic) y =2040.65?0.01x?(1.523E?6)x2
三次曲线(Cubic) y =304.429?0.202x?(3.886E?6)x2?(3.674E?11)x3
三次曲线的R Square=0.998>二次曲线的R Square=0.979>指数回归的R Square=0.965>幂函数
回归的R Square=0.962,以上四种曲线拟合都可以,三次曲线拟合最好。
正在阅读:
回归分析SPSS习题答案06-20
印刷协议书05-10
安徒生童话观后感04-01
甲醇火炬吊装10-15
00监盘指南11-30
励志摘抄100字02-19
第三版新视野大学英语读写教程1Unit 1 Section A07-28
(进贤)ABC专业销售面谈技巧1205-23
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 习题
- 回归
- 答案
- 分析
- SPSS
- 福建省龙岩市2019年高中毕业班5月教学质量检查数学(理)试题
- 洁净空调技术复习题
- 中国复合包装市场发展研究及投资前景报告(目录) - 图文
- 1、2 第一、二讲 走进名校
- 妇产科学题库
- 民事诉讼法综合训练
- 中国现代文学史网络学习答案
- 预制板钢筋、预埋件隐蔽工程验收记录 - 图文
- 2015年江西省人力资源管理师应试技巧最新考试题库(完整版)
- 科傻平差说明文件
- 四年级上册《生活、生命与安全》教案(全)
- “生存哲学”话题作文优秀范文及精彩片段
- 区域规划复习资料
- “太阳”也可以从西边升起
- OracleDBA性能优化8日游笔记
- 顺发平地10KV变电所安装工程竣工资料
- 钢结构施工组织设计(改好)
- 液压支架的实习报告
- 风筝节通讯稿
- 小学奥数知识框架与重点内容大全