SPSS实验报告5

更新时间:2024-03-16 23:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《统计分析软件》实验报告

实验序号:B0901153-5 实验项目名称:相关与回归分析 学 号 实验地点 姓 名 指导教师 专业、班级 时间 一、实验目的及要求 实验目的: (1)掌握相关分析的主要内容和方法; (2)掌握回归分析的主要方法和步骤。 实验要求: (1)了解双变量的相关分析过程、偏相关分析过程; (2)掌握线性回归过程、曲线配合过程、二项逻辑回归分析过程、概率回归过程以及非线性回归分析过程等。 (3)对各种回归输出结果作出正确的解释说明,进一步了解回归分析的基本步骤,明确各项检验的目的。 二、实验设备(环境)及要求 微型计算机,SPSS、EViews等统计分析软件 三、实验内容与数据来源 实验内容与数据来源均来自于《SPSS实验上机题<实验五>》及《试验5补充题》 四、实验步骤与结果 1.①打开SPSS,在变量视图中设置数据,在数据视图中输入数据,如下图 ②点击“分析”,将鼠标光标移动到“相关”,单击选择“双变量”,弹出“双变量相关”对话框,将“GDP”和“INV”都选中,在相关系数中勾选Pearson,单击“确定”按钮。如下图 ③点击“分析”,将鼠标光标移动到“回归”,单击选择“线性”,弹出“线性回归”对话框,选中INV作为因变量,GDP作为自变量,单击“确定”,如下图

相关性 GDP Pearson 相关性 显著性(双侧) N INV Pearson 相关性 显著性(双侧) N GDP 1 INV .985 .000 16 16 1 ** .985 .000 16 ** 16 **. 在 .01 水平(双侧)上显著相关。 通过图表可以看出在显著水平为0.01的情况下,GDP与固定资产之间的相关系数为0.985,说明两变量之间存在高度相关 系数 非标准化系数 模型 1 (常量) GDP B -89.941 .304 标准 误差 34.952 .014 标准系数 试用版 t -2.573 .985 21.309 Sig. .022 .000 a

a. 因变量: INV 分析:通过图表能够看出GDP与固定资产之间存在明显的相关性 方程为y=0.304x-89.941 2. ①打开SPSS,在变量视图中设置数据,在数据视图中输入数据,如下图 ②点击“分析”,将鼠标光标移动到“回归”,单击选择“曲线估计”,弹出“曲线估计”对话框,将“城镇储蓄y”选中作为因变量和“城镇人均收入x”作为自变量(变量),选中“年份”作为自变量(时间),将“模型”中所有模型全部勾选,单击“确定”按钮。如下图

模型描述

模型名称 因变量 方程

1 1 2 3 4 5 6 7 8 9 10 11

自变量 常数

其值在图中标记为观测值的变量 用于在方程中输入项的容差

a. 该模型要求所有非缺失值为正数。

MOD_4 城镇储蓄y 线性 对数 倒数 二次 三次 复合 幂 S 增长 指数 Logistic 城镇人均收入x 包含 年份

.0001 a

aaaa

a

个案处理摘要 个案总数 已排除的个案 已预测的个案 新创建的个案 aN 12 0 0 0 a. 从分析中排除任何变量中带有缺失值的个案。 变量处理摘要 变量 正值数 零的个数 负值数 缺失值数 用户自定义缺失 系统缺失 因变量 城镇储蓄y 12 0 0 0 0 自变量 城镇人均收入x 12 0 0 0 0 模型汇总和参数估计值 因变量:城镇储蓄y 模型汇总 方程 线性 对数 倒数 二次 三次 复合 幂 S 增长 指数 R 方 F df1 df2 1 1 1 2 3 1 1 1 1 1 1 10 10 10 9 8 10 10 10 10 10 10 Sig. 常数 参数估计值 b1 7.643 14794.310 b2 b3 .983 590.185 .893 83.560 .705 23.937 .992 578.612 .996 749.163 .878 72.034 .981 514.902 .969 314.196 .878 72.034 .878 72.034 .000 -5348.895 .000 -99938.172 .001 24146.304 -20427622.480 .000 -1845.504 .000 -6616.325 .000 .000 .000 .000 .000 .000 1153.663 .011 10.625 7.051 1153.663 .001 3.743 11.948 1.001 1.777 -2743.679 .001 .001 .999 .001 -.003 5.302E-7 Logistic .878 72.034 自变量为 城镇人均收入x。

②点击“分析”,将鼠标光标移动到“回归”,单击选择“二元Logistic”,弹出“Logistic回归”对话框,将“录取状态y”选中作为因变量和“考试总分数SCORE”和“D1”作为自变量,单击“保存”,勾选“概率”和“组成员”,单击“选项”,“统计量和图”全部勾选,单击“确定”按钮。如下图

迭代历史记录迭代 a,b,c 系数 常量 -2 对数似然值 1 步骤 0 2 3 a. 模型中包括常量。 59.338 59.295 59.295 -.880 -.944 -.944 b. 初始 -2 对数似然值: 59.295 c. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 3 处终止。 分类表 录取状态y 步骤 0 总计百分比 a. 模型中包括常量。 b. 切割值为 .500 录取 14 0 .0 72.0 未录取 已观测 已预测 录取状态y 未录取 36 录取 0 100.0 百分比校正 a,b

方程中的变量 步骤 0 常量 B -.944 S.E, .315 Wals 8.991 df 1 Sig. .003 Exp (B) .389 不在方程中的变量 变量 步骤 0 D1 总统计量 2.895 30.757 1 2 .089 .000 考试总分数SCORE 得分 30.284 df 1 Sig. .000 迭代历史记录迭代 -2 对数似然值 常量 a,b,c,d 系数 考试总分数SCORE D1 1 2 3 4 5 步骤 1 6 7 8 9 10 11 a. 方法: 输入 b. 模型中包括常量。 29.125 19.189 14.093 11.132 9.218 8.204 7.972 7.959 7.959 7.959 7.959 -19.915 -36.490 -57.901 -87.410 -130.676 -186.803 -228.516 -241.523 -242.453 -242.458 -242.458 .056 .101 .161 .243 .364 .521 .638 .674 .677 .677 .677 -.381 -.373 -.251 -.131 -.153 -.328 -.449 -.476 -.477 -.477 -.477 c. 初始 -2 对数似然值: 59.295 d. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 11 处终止。 模型系数的综合检验 步骤 步骤 1 块 模型 卡方 51.336 51.336 51.336 df 2 2 2 Sig. .000 .000 .000 = Hosmer 和 Lemeshow 检验 = 步骤 1 卡方 1.160 df 8 Sig. .997

模型汇总 步骤 1 -2 对数似然值 Cox & Snell R 方 Nagelkerke R 方 7.959 a.642 .924 a. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 11 处终止。 Hosmer 和 Lemeshow 检验的随机性表 录取状态y = 未录取 已观测 1 2 3 4 步骤 1 5 6 7 8 9 10 5 4 5 5 6 5 4 2 0 0 期望值 5.000 4.000 5.000 5.000 5.999 4.972 4.574 1.455 .000 .000 录取状态y = 录取 已观测 0 0 0 0 0 0 1 3 5 5 期望值 .000 .000 .000 .000 .001 .028 .426 3.545 5.000 5.000 5 4 5 5 6 5 5 5 5 5 总计 分类表 录取状态y 步骤 1 总计百分比 a. 切割值为 .500 录取 1 13 92.9 96.0 未录取 已观测 已预测 录取状态y 未录取 35 录取 1 97.2 百分比校正 a 方程中的变量 B S.E, Wals df Sig. Exp (B) EXP(B) 的 95% C.I. 下限 考试总分步骤 1 a上限 3.893 数SCORE D1 常量 .677 -.477 .348 2.985 3.785 .026 3.791 1 .052 1.968 1 .873 1 .052 .621 .000 .995 .002 215.525 -242.458 124.518 a. 在步骤 1 中输入的变量: 考试总分数SCORE, D1.

相关矩阵 常量 考试总分数SCORE 常量 步骤 1 考试总分数SCORE D1 1.000 -1.000 .034 -1.000 1.000 -.055 .034 -.055 1.000 D1 案例列表 案例 选定状态 ab已观测 录取状态y 已预测 预测组 临时变量 残差 ZResid 2.586 16 S 1** .130 0 .870 a. S = 已选定,U = 未选定的案例及 ** = 未分类的案例。 b. 列出学生化残差大于 2.000 的案例。 分析:加入D1变量的目的是考察考生为应届生或往届生是否也对录取产生影响,由于Y只有两种状态,所以应建立二元Logistic模型,如上,由D1的相伴概率可以看出,D1的参数没有显著性,说明考生的应届、往届特征对录取与否无显著性影响,可以从模型中剔除D1,重新估计。 5. ①打开SPSS,在变量视图中设置数据,在数据视图中输入数据,如下图 ②点击“分析”,将鼠标光标移动到“回归”,单击选择“Probit”,弹出“Probit分析”对话框,将“DEAD”选中作为“响应频率”,选中”OBSERVE”作为“观测值汇总”,选中“剂量DOSE”作为“协变量”,单击“转换”下拉框,选中“对数底为10”,其他保持默认,单击“确定”按钮。如下图

数据信息 有效 缺失 已拒绝 不能执行对数转换 响应数 > 主体数 控制组 个案数 7 0 0 0 0 收敛信息 PROBIT 迭代数 找到最优解 14 是 参数估计值 PROBIT 截距 -4.663 1.023 -4.556 .000 -5.687 -3.640 a. PROBIT 模型: PROBIT(p) = 截距 + BX(协变量 X 使用底数为 10.000 的对数来转换。) a参数 估计 标准误 z Sig. 95% 置信区间 下限 上限 8.579 剂量DOSE 5.952 1.340 4.441 .000 3.325

卡方检验 PROBIT Pearson 拟合度检验 卡方 .833 df 5 bSig. .975 aa. 由于显著性水平大于 .150,因此在置信限度的计算中未使用异质因子。 b. 基于单个个案的统计量与基于分类汇总个案的统计量不同。 单元计数和残差 数字 1 2 3 PROBIT 4 5 6 7 剂量DOSE 1.079 .954 .845 .778 .699 .602 .477 主体数 5 7 19 34 38 12 5 观测的响应 5 6 11 17 12 2 0 期望的响应 4.804 5.917 12.221 16.573 11.688 1.682 .171 残差 .196 .083 -1.221 .427 .312 .318 -.171 概率 .961 .845 .643 .487 .308 .140 .034 置信限度 .010 .020 .030 .040 .050 .060 .070 .080 .090 PROBIT .150 .200 .250 .300 .350 .400 .450 .500 .550 .600 4.067 4.386 4.679 4.958 5.232 5.506 5.785 6.073 6.376 6.699 3.020 3.434 3.825 4.200 4.559 4.901 5.222 5.521 5.803 6.076 4.641 4.922 5.189 5.460 5.748 6.070 6.440 6.873 7.379 7.967 .609 .642 .670 .695 .719 .741 .762 .783 .805 .826 .480 .536 .583 .623 .659 .690 .718 .742 .764 .784 .667 .692 .715 .737 .760 .783 .809 .837 .868 .901 .100 概率 剂量DOSE 的 95% 置信限度 估计 2.469 2.744 2.934 3.085 3.214 3.328 3.432 3.527 3.616 3.699 下限 1.256 1.514 1.704 1.863 2.002 2.129 2.247 2.357 2.462 2.562 上限 3.233 3.484 3.654 3.788 3.902 4.001 4.091 4.173 4.250 4.323 log(剂量DOSE) 的 95% 置信限度 估计 .393 .438 .467 .489 .507 .522 .535 .547 .558 .568 下限 .099 .180 .232 .270 .302 .328 .352 .372 .391 .409 上限 .510 .542 .563 .578 .591 .602 .612 .620 .628 .636 a

.650 .700 .750 .800 .850 .900 .910 .920 .930 .940 .950 .960 .970 .980 .990

a. 对数底数 = 10。

7.050 7.439 7.884 8.411 9.069 9.971 10.202 10.459 10.749 11.083 11.476 11.955 12.573 13.442 14.938 6.351 6.636 6.945 7.295 7.716 8.268 8.406 8.558 8.728 8.921 9.146 9.417 9.759 10.233 11.023 8.653 9.465 10.446 11.678 13.315 15.725 16.372 17.107 17.953 18.950 20.155 21.671 23.694 26.683 32.187 .848 .872 .897 .925 .958 .999 1.009 1.019 1.031 1.045 1.060 1.078 1.099 1.128 1.174 .803 .822 .842 .863 .887 .917 .925 .932 .941 .950 .961 .974 .989 1.010 1.042 .937 .976 1.019 1.067 1.124 1.197 1.214 1.233 1.254 1.278 1.304 1.336 1.375 1.426 1.508

分析:根据上图,可以写出Probit(P)=-4.663+5.952x,Pearson模型拟合优度检验,卡方等于0.833,P=0.975,反映拟合优度较差。

6. ①打开SPSS,在变量视图中设置数据,在数据视图中输入数据,如下图 ②点击“分析”,将鼠标光标移动到“回归”,单击选择“多项Logistic”,弹出“多项Logistic回归”对话框,将“听力低下程度”选中作为“因变量”,选中“性别”作为“因子”,选中“年龄”作为“协变量”,其他保持默认,单击“确定”按钮。如下图

案例处理摘要 轻 听力低下程度 中 重 性别 有效 缺失 总计 子总体 男 女 N 5 7 8 9 11 20 0 20 15 a边际百分比 25.0% 35.0% 40.0% 45.0% 55.0% 100.0% a. 因变量只有一个在 13 (86.7%) 子总体中观察到的值。 模型拟合信息 模型 模型拟合标准 -2 倍对数似然值 仅截距 最终 40.449 35.003 卡方 似然比检验 df 显著水平 5.445 4 .245 伪 R 方 Cox 和 Snell Nagelkerke McFadden .238 .269 .126 似然比检验 效应 模型拟合标准 简化后的模型的 -2 倍对数似然值 截距 年龄 性别 35.003 36.485 38.769 a似然比检验 卡方 df 显著水平 .000 1.482 3.765 0 2 2 . .477 .152 卡方统计量是最终模型与简化后模型之间在 -2 倍对数似然值中的差值。通过从最终模型中省略效应而形成简化后的模型。零假设就是该效应的所有参数均为 0。 a. 因为省略效应不会增加自由度,所以此简化后的模型等同于最终模型。

参数估计 听力低下程度 aB 标准误 Wald df 显著水平 Exp(B) Exp(B) 的置信区间 95% 下限 上限 截距 轻 [性别=1] [性别=2] 截距 中 [性别=1] [性别=2] a. 参考类别是: 重。 年龄 年龄 1.744 -.063 2.541 0 1.120 -.025 .783 0 bb3.080 .321 1 1 1 0 1 1 1 0 .571 .245 .083 . .669 .549 .487 . .939 12.698 . .845 .720 . 1.044 223.869 . .054 1.353 1.464 3.013 . 2.618 .042 1.127 . . .183 .359 .483 . .975 2.188 . .898 .240 . 1.059 19.924 . b. 因为此参数冗余,所以将其设为零。 分析:由上图可知,显著性水平并不是太高,不能够太好的反映年龄和性别对听力低下程度的影响,据上图可以得到表现它们关系的回归方程。 五、分析与讨论 通过该实验,我们掌握了建立各种回归模型的方法方法,能够通过建立回归模型分析各变量之间的关系,并对实验结果进行了正确的分析。 六、教师评语 该实验的目标非常明确,实验步骤详尽完全而且正确,实验结果正确,实验效果明显,实验目的已经达到。 签名:杨超

成绩 98

本文来源:https://www.bwwdw.com/article/bgi8.html

Top