统计学实验SPSS实习报告

更新时间:2024-04-21 19:00:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学实验SPSS实习报告

实验报告二

实验项目:描述性统计分析

实验的目的:1。掌握数据集中趋势和离中趋势分析方法

2.熟悉掌握各个分析过程的基本步骤以及彼此之间的联系和区别.

实验内容:

(1) (2) (3) (4)

Frequencies过程 Descriptives过程 Expiore 过程 Croostabs过程

一、数据和输入与保存

频率

[数据集1] E:\\案例数据资料\\数据集\\第五章\\5.1陕西省城市居民消费状况研究\\数据集\\陕西省城市居民消费状况研究.sav

实验数据的统计量数目为21 实际检验统计量数目为21 全部检验。

统计量

时间分组 N

有效 缺失

21 0 该组检验是我根据软件数据,依据年限的不同分为了一共4组数据的时间分组数据,从而大大的减少了数据的分析复杂性。最后得出的时间分组的表格如下。

时间分组

有效

1980以下 1980到1990 1990到1995 1995以上 合计

频率

3 10 5 3 21 百分比

14.3 47.6 23.8 14.3 100.0 有效百分比

14.3 47.6 23.8 14.3 100.0 累积百分比

14.3 61.9 85.7 100.0

描述统计分析

[数据集1] E:\\案例数据资料\\数据集\\第五章\\5.1陕西省城市居民消费状况研究

\\数据集\\陕西省城市居民消费状况研究.sav

[数据集1] E:\\案例数据资料\\数据集\\第五章\\5.1陕西省城市居民消费状况研究\\数据集\\陕西省城市居民消费状况研究.sav

有表格可以看出 数据数目一共21个 有小数据21个,其中极小值为1.00极大值为4.00.均值为2.3810.我们是以时间分组的一组描述数据量,既可以得出下列的数据分析表格。

描述统计量 时间分组 有效的 N (列表状态) N 21 21 极小值 1.00 极大值 4.00 均值 2.3810 标准差 .92066 如下为数据的执行命令。

EXAMINE VARIABLES=时间分组 /PLOT BOXPLOT STEMLEAF /COMPARE GROUPS

/STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

数据的游览分析

[数据集1] E:\\案例数据资料\\数据集\\第五章\\5.1陕西省城市居民消

费状况研究\\数据集\\陕西省城市居民消费状况研究.sav

通过时间的分组得出的下列数据分析表格。 案例处理摘要 案例 N 时间分组 有效 百分比 21 100.0% N 缺失 百分比 0 .0% N 合计 百分比 21 100.0% 描述

时间分组

均值

统计量 2.3810 标准误 .20090

均值的 95% 置信区间 下限 上限

1.9619 2.8000 2.3677 2.0000 .848 .92066 1.00 4.00 3.00 1.00 .387 -.456

.501 .972 5% 修整均值 中值 方差 标准差 极小值 极大值 范围 四分位距 偏度 峰度

时间分组

时间分组 Stem-and-Leaf Plot Frequency Stem & Leaf 3.00 1 . 000 .00 1 .

10.00 2 . 0000000000 .00 2 . 5.00 3 . 00000 .00 3 . 3.00 4 . 000 Stem width: 1.00 Each leaf: 1 case(s)

CROSSTABS

/TABLES=时间分组 BY 消费性支出(元) /FORMAT=AVALUE TABLES /CELLS=COUNT /COUNT ROUND CELL.

交叉表

[数据集1] E:\\案例数据资料\\数据集\\第五章\\5.1陕西省城市居民消费状况研究\\数据集\\陕西省城市居民消费状况研究.sav

数据的准确性,如下的案例处理摘要。 案例处理摘要 案例 N 时间分组 * 消费性支出(元) 有效的 百分比 21 100.0% N 缺失 百分比 0 .0% N 合计 百分比 21 100.0% 计数

时间分组 1980以下 1980到1990 1990到1995 1995以上 合计 268.00 1 0 0 0 1 302.00 1 0 0 0 1 371.00 1 0 0 0 1 379.00 0 1 0 0 1 393.00 0 1 0 0 1 417.00 0 1 0 0 1 457.00 0 1 0 0 1 585.00

最后实验总结:在该组的实验中,我们利用的是spss软件来实现的一系

列的数据分析与统计,我们选择的是数据中以自己独立的时间分组来实现数据的整理以及一系列的数据处理,最后得出了上面的一系列内容,这次实验内容我学到了很多,也从中学习到了spss软件的实际操作。

实验报告二

实验项目:均值比较 基本操作训练

实验的目的:学习利用SPSS进行样本以及成对样本的均值实验。 实验内容:

1. 描述统计(means过程)

2. 单样本T检验(0ne-Sample T Test过程)

3. 独立样本T检验(Independen-Sample T Test过程) 4. 配对样本T检验(Paired-Sample T Test过程) 实验1:描述统计(means过程)

根据大学生年级的不同队环境分数的影响进行频率描述分析,由此看大学生年纪是否影响环境分数。

数据来源:[数据集17] C:\\Users\\Administrator\\Desktop\\SPSS \\2013统计模拟实习资料\\统计\\第6章\\6.1 环境分数的分组汇总.sav

案例处理摘要 案例 N 环境 * 年级 已包含 百分比 431 96.6% N 已排除 百分比 15 3.4% N 总计 百分比 446 100.0%

说明:数据总计446,有效数据431,有效率96.6%。缺失数据15,缺失率3.4%。

报告

环境 年级 大一 大二 大三 大四 总计

均值 24.12 24.96 24.90 26.50 25.07 N 119 102 110 100 431 标准差 4.789 4.436 4.120 4.633 4.571

说明:不同的年级,得到的环境分数均值相差不大,其标准差值相差同样不大,则之间不存在相关性。 实验2:单样本T检验

对环境分数进行单样本T检验分析

数据来源:[数据集17] C:\\Users\\Administrator\\Desktop\\SPSS\\ 2013统计模拟实习资料\\统计\\第6章\\6.1 环境分数的分组汇总.sav

单个样本统计量 环境 N 431 均值 25.07 标准差 4.571 均值的标准误 .220 单个样本检验 检验值 = 25 t 环境 .316 df 430 Sig.(双侧) 均值差值 .752 .070 差分的 95% 置信区间 下限 -.36 上限 .50

说明:在检验值为25时,P=0.752..>0.05,则接受原假设。

实验3:独立样本T检验

采用独立样本T检验对两种激励方法的差异对业绩增长率的影响进行分析。

数据来源:[数据集13] C:\\Users\\Administrator\\Desktop\\SPSS \\2013统计模拟实习资料\\数据资料\\管理统计数据\\激励方法.sav

组统计量

业绩增长率

激励方法 A激励方法 B激励方法

N

7 7 均值 17.0143 16.5143 标准差 .63095 .50474 均值的标准误

.23848 .19077

独立样本检验 方差方程的 Levene 检验 均值方程的 t 检验 差分的 95% 置信区间 F 业绩增长率 假设方差相等 假设方差不相等 .121 Sig. .734 t 1.637 df 12 Sig.(双侧) 均值差值 .128 .50000 标准误差值 .30539 下限 上限 -.16540 1.16540 1.637 11.448 .129 .50000 .30539 -.16897 1.16897

说明:业绩增长率在方差相等的情况下,P=0.128>0.05,则激励效果A与激励效果B之间无多大差异,其效果基本一致。

实验4:配对T检验:

对员工技术培训前后收到的效果进行配对T检验分析,由此得出技术培训效果如何。

成对样本统计量 对 1 培训前 培训后 均值 23.67 25.57 N 76 76 标准差 4.924 4.529 均值的标准误 .565 .520

成对样本相关系数

对 1

培训前 & 培训后

N

76 相关系数

.463 Sig. .000 成对样本检验 成对差分 均值 对 1 培训前 - 培训后 -1.895 标准差 4.911 均值的标准误 .563 差分的 95% 置信区间 下限 -3.017 上限 -.772 t -3.363 df 75 Sig.(双侧) .001

说明:P=0.001<0.05,则拒绝原假设,技术培训前后存在较大的差异,此次培训效果是显著地并且达到培训目的。

实验报告四

实验项目:相关与回归分析 实验的目的:

系统的介绍相关分析方法,并运用示例和实例来介绍几个常用的相关分析方法。目的使学生明白运用SPSS软件进行相关分析的意义。并运用示例和实例来介绍一元线性回归、多元线性回归和非线性回归模型。目的使学生明白运用SPSS软件进行回归分析。 实验内容:

1. 两变量的相关分析(Bivariate过程) 2. 偏相关分析(Partial过程) 3. 距离分析(Distances过程) 4. 线性回归分析(Linear过程)

一、 双变量的相关分析(Bivariate过程)

相关性

Educational

Educational Level (years)

Pearson 相关性

显著性(双侧) N

Beginning Salary

Pearson 相关性

显著性(双侧) N

**. 在 .01 水平(双侧)上显著相关。

预测文化水平与人们的起始工资是否存在相关性: H0:文化水平与起始工资不相关; H1:文化水平与起始工资相关; P=0.00<0.01

所以拒绝原假设,接受备择假设;

得出结论:文化水平与起始工资相关;且是正相关,说明文化水平越高,起始工资越高。 二、 偏相关分析(Partial 过程) 先做双变量分析:

相关性

.000 474

474

474 .633 **

Level (years)

1 Beginning Salary

.633 .000 474 1 **

名次

Pearson 相关性

显著性(双侧) N

长兵器得分 Pearson 相关

显著性(双侧) N

分析长兵器对名次的影响:

长兵器得

名次

1 10 -.455 .186 10 10 分 -.455 .186 10 1 假设:H0:长兵器得分与名次不相关; H1:长兵器得分与名次相关; P=0.186>0.05

所以接受原假设,得出:长兵器得分与名次不相关 再做偏相关分析:

相关性

长兵器得

控制变量 长拳得分 名次

相关性 显著性(双侧) df

长兵器得分 相关性

显著性(双侧) df

名次 1.000 . 0 .264 .492 7 分 .264 .492 7 1.000 . 0

分析长兵器对名次的影响:

控制长拳得分对名次的影响,只考虑长兵器与名次的相关性;

H0:长兵器得分与名次不相关; H1:长兵器得分与名次相关;

P=0.492>0.05

所以接受原假设,说明在控制长拳得分对名次的影响时,长兵器得分与名次也不相关; 三、 距离分析(Distances过程)

案例处理摘要 案例 有效 N 12

近似矩阵

1: 1 2: 2 3: 3 4: 4

Euclidean 距离

1: 1

2: 2

3: 3

4: 4

5: 5

6: 6

7: 7

8: 8

9: 9

10:10

11:11

12:12

.000 20.625 31.370 84.306 251.395 82.033 96.697 276.925 181.347 53.449 30.075 13.119 20.625 .000 13.643 65.355 250.380 74.608 93.849 275.436 185.339 50.584 12.562 8.133 百分比 100.0% N 0 缺失 百分比 .0% N 12 合计 百分比 100.0% 31.370 13.643 .000 53.519 240.772 63.611 84.606 265.681 178.508 42.982 16.531 20.341 .000 229.420 60.163 86.040 251.844 183.967 65.851 60.010 72.472 .000 181.061 159.440 28.105 87.001 201.677 253.940 251.042 .000 26.306 204.992 125.821 30.477 75.039 77.050 .000 183.767 100.010 43.822 95.916 94.599 .000 111.824 226.551 278.517 276.198 .000 136.857 190.254 183.976 .000 53.690 50.877 .000 17.687 .000 84.306 65.355 53.519 5: 5 251.395 250.380 240.772 229.420 6: 6 7: 7

82.033 74.608 63.611 60.163 181.061 96.697 93.849 84.606 86.040 159.440 26.306 8: 8 276.925 275.436 265.681 251.844 28.105 204.992 183.767 9: 9 181.347 185.339 178.508 183.967 87.001 125.821 100.010 111.824 10:10 53.449 50.584 42.982 65.851 201.677 30.477 43.822 226.551 136.857 11:11 30.075 12.562 16.531 60.010 253.940 75.039 95.916 278.517 190.254 53.690 12:12 13.119 8.133 20.341 72.472 251.042 77.050 94.599 276.198 183.976 50.877 17.687 这是一个不相似性矩阵

从举例分析可以看出:一月、二月、三月、四月、十二月很接近,可以采用相类似的培育方法;

四、 线性回归分析(Linear过程) 输入/移去的变量 模型 1 输入的变量 移去的变量 国民收入(亿元) a. 已输入所有请求的变量。 b. 因变量: 城乡居民储蓄存款余额

方法 . 输入 b

模型汇总 调整 R 模型 1 R .976 a标准 估计的误差 5.26218 R 方 .953 方 .951 a. 预测变量: (常量), 国民收入(亿元)。 Anova 模型 1 回归 残差 总计 平方和 14032.045 692.264 14724.308 df 25 26 均方 27.691 F Sig. .000 ab1 14032.045 506.745 a. 预测变量: (常量), 国民收入(亿元)。 b. 因变量: 城乡居民储蓄存款余额 系数 非标准化系数 标准 误模型 1 (常量) 国民收入(亿元) B -14.001 .219 差 1.608 .010 试用版 .976 t -8.706 22.511 Sig. .000 .000 标准系数 aa. 因变量: 城乡居民储蓄存款余额

研究国民收入对城乡居民储蓄存款余额的影响: 假设 Y=β0+β1X+ε H0:β0=β1=0

H1:β0、β1不全为零; P=0.00<0.05

所以拒绝原假设,接受备择假设; 得出结论:β0、β1不全为零; Y=-14.001+0.219X

镇:其工资收入、经营收入、财产收入、转移收入、可支配收入、及总体收入都是最低。由此这些城镇的发展水平相对落后缓慢。

每个聚类中的案例数

聚类

1 2 3

有效 缺失

3.000 6.000 22.000 31.000 .000

说明:第一类城镇分了3个,第二类城镇分了6个,第三类城镇分了22个。有效数据31,均有效无缺失。

实验六:因子分析和主成分分析

一、实验目的

因子分析是降维所采用的主要方法之一,基 于对原始变量的相关系数矩阵内部结构的研究,通过导出非观测综合变量去描述原始的多个变量之间的相关关系。

二、实验原理:

主成分分析原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。

基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。

三、实验内容

图4.1 因子分析对话框

图4.2因子分析:描述统计对话框

图4.3 因子分析:抽取对话框

图4.4 因子分析:旋转

表4.5

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验

近似卡方 df Sig.

.747 73.085 6 .000

表4.6 公因子方差

公因子方差 sex age height weight 初始 1.000 1.000 1.000 1.000 提取 1.000 1.000 1.000 1.000 提取方法:主成份分析。

表4.7 解释的总方差 解释的总方差 初始特征值 成份 1 2 3 4 合计 2.858 1.007 .074 .061 方差的 % 71.452 25.172 1.839 1.537 累积 % 71.452 96.624 98.463 100.000 合计 2.858 1.007 .074 .061 提取平方和载入 方差的 % 71.452 25.172 1.839 1.537 累积 % 71.452 96.624 98.463 100.000 合计 2.849 1.012 .078 .062 旋转平方和载入 方差的 % 71.222 25.288 1.940 1.550 累积 % 71.222 96.509 98.450 100.000 提取方法:主成份分析。

表4.8 碎石图

表4.9

成份矩阵 a sex age height weight 成份 1 -.082 .974 .977 .974 2 .996 -.061 .060 .084 3 .030 .216 -.065 -.148 4 .002 .044 -.193 .149 提取方法 :主成份。 a. 已提取了 4 个成份。

表4.10

旋转成份矩阵 a sex age height weight 成份 1 -.024 .961 .982 .981 2 1.000 -.108 .001 .023 3 -.011 .255 -.072 -.084 4 -.001 .002 .176 -.176 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 4 次迭代后收敛。

表4.11

成份转换矩阵 成份 1 2 3 4 1 .998 .059 -.031 -.006 2 -.058 .998 .040 .002 3 .034 -.038 .977 .206 4 .001 -.006 .206 -.979 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。

分析:由表4.5可知bartlett球度检验量为73.085,相应的概率Sig.为0.747,因此可认为相关系数矩阵与单位阵无显著差异。

表4.9

成份矩阵 a sex age height weight 成份 1 -.082 .974 .977 .974 2 .996 -.061 .060 .084 3 .030 .216 -.065 -.148 4 .002 .044 -.193 .149 提取方法 :主成份。 a. 已提取了 4 个成份。

表4.10

旋转成份矩阵 a sex age height weight 成份 1 -.024 .961 .982 .981 2 1.000 -.108 .001 .023 3 -.011 .255 -.072 -.084 4 -.001 .002 .176 -.176 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 4 次迭代后收敛。

表4.11

成份转换矩阵 成份 1 2 3 4 1 .998 .059 -.031 -.006 2 -.058 .998 .040 .002 3 .034 -.038 .977 .206 4 .001 -.006 .206 -.979 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。

分析:由表4.5可知bartlett球度检验量为73.085,相应的概率Sig.为0.747,因此可认为相关系数矩阵与单位阵无显著差异。

本文来源:https://www.bwwdw.com/article/u0op.html

Top