spss实验报告
更新时间:2024-01-31 08:10:01 阅读量: 教育文库 文档下载
《统计分析与SPSS的应用》
学院(系) 专业名称 班姓学
级 名 号
实习地点 起止时间
2015年 5月至 2015 年 7月
实验内容:
1统计数据的收集与预处理
1.1数据文件的编辑 1.1.1数据文件的合并
数据文件的合并是把外部数据与当前数据合并成一个新的数据文件,SPSS提供两种形式的合并:一是横向合并,指从外部数据文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件增加观测数据到当前文件中。横向合并即增加变量,而增加变量有两种方式:一是从外部数据文件中获取变量数据,加入当前数据文件中;二是按关键变量合并,要求两个数据文件有一个共同的关键变量,而且两个数据文件的关键变量中还有一定数量相同值的观测值。 1.1.2数据文件的拆分
拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据进行分组,为以后的分组统计提供便利。例2-2实验步骤:打开data2-2.sav→点击菜单栏的数据,拆分文件,弹出“分割文件”→按照产品类型拆分数据,选择“比较组”,激活“分组方式”栏。选中“产品”变量移入其中,单击“确定”按钮结束。点击菜单“分析→描述性统计→描述?”,弹出“描述性”对话框,选择变量“金额”,“数量”进行分析,单击“选择”按钮设置要计算的统计量,统计金额和数量的和,设置好后单击确定按钮,得到表1所示的统计量:
表1描述统计量 产品 彩电 数量 金额 空调 数量 金额 热水器 数量 金额 微波炉 数量 金额 洗衣机 数量 金额 N 4 4 1 1 2 2 2 2 2 2 极小值 极大值 12 3 9600 11 1 5 50 3 9600 24 24 48 和 144 3 9600 35 25 53 均值 36.00 3.00 9600.00 17.50 12.50 26.50 标准差 16.573 . . 9.192 16.263 30.406 38400 160000 460800 115200.00 53033.826 有效的 N (列表状态) 4 有效的 N (列表状态) 1 25300 55200 80500 40250.00 21142.493 有效的 N (列表状态) 2 2100 50400 52500 26250.00 34153.258 有效的 N (列表状态) 2 11000 105600 116600 58300.00 66892.302 有效的 N (列表状态) 2 从表1可以得出彩电、空调、热水器、微波炉、洗衣机的数量、金额的极大值、极小值、和、均值标准差这四个描述性统计量是多少。
1.1.3数据的加权
SPSS的观察量加权功能是在数据文件中选择一个变量,这个变量力的值是相应的观测量出现的次数,这个变量叫做权变量,经过加权的数据文件叫做加权文件。例2-3实验步骤:打开data2-3.sav→选择数据,加权个案→选择“加权个案”,激活“频率变量”矩形框,把“工人数”变量移入框中。选择“分析”,描述统计→描述,进行产品数量总和的统计,统计结果如表2所示:可以看出产品数量的极大值、极小值、和、均值、标准差这四个描述性统计量。
表2描述统计量 产品数量 有效的 N (列表状态) N 118 118 极小值 20 极大值 30 和 2854 均值 24.19 标准差 3.883 1.2SPSS数据加工 1.2.1变量的计算
例2-4实验步骤:打开data2-4sav→选择“转换”,计算变量,弹出“计算变量”窗口→在“目标变量”框中输入目标变量名“总分”→从左边的变量列表窗口中选择用于计算的变量并加入“数学表达式”框中,并乘以相应的系数即可。
图1变量计算后的结果
图1是变量计算后的结果:根据计算公式:总分=实验准备*0.15+讲解示范*0.15+实验指导*0.2+教学方法*0.15+语言文字*0.05+教学手段*0.1+课堂管理*0.2.,可以得出教师的综合评价分。
2图表的创建与编辑
2.1使用图表构建程序创建
使用图表构建程序创建图表,是SPSS现在推崇的主要操作方式,该方式使用预览模式通过图库或基本元素设计图表,让用户所见所得,可以提高创建图形的效率,减少一些不可预见的错误。例3-1实验步骤:打开data3-1.sav→选择菜单:“图形”,图表构建程序,弹出“图表构建程序”对话框→选择“库”选项卡,点击“条(B)”中第二项“群集条形图”图标→把年份拖入“是否为X轴”虚线框中作为条形图的X轴;把指标值“是否为Y轴”虚线框,作为条形图的Y
轴;把指标拖入“X轴上的分群:设置颜色”虚线框中,作为复合分类变量→选择标题/脚注,点击标题1,设置标题“第一、二、三产业各年产值比较图”→点击确定按钮。得到如图2:可以从图中得到信息:自1978年以来,这三种产业的产值都在增加;每年第二产业的产值都是最高,第三产业次之,第一产业的产值最少。
图2第一、二、三产业各年产值比较图
2.2使用图形画板模板选择程序创建
打开data3-1.sav→选择菜单:图形,点击“图形画板模板选择程序”→在“基本”选项卡中,同时选中年份和指标值进行可视化表示,在摘要中选择“均值”→在“详细”选项卡中,X轴设置为“年份”,Y轴设置为“指标值”,面板横跨中选择“指标”→单击确定按钮,如图3:
图3可视化输出图形结果
2.3使用旧对话框创建
和前面两种创建图形方式相比,旧对话框方式缺少灵活性和直观性,但可以对生成的图形进一步编辑。例3-2实验步骤:打开data3-2.sav→选择“图形”,旧对话框,线图中的多线线图→单击“定义”,在弹出的对话框中,指标值放入“变量(V)”中,“年份”放入“类别轴(X),“指标分类”放入“定义线的方式(D)→确定,得到图4:
图4结果图形
从图4可以得到如下信息:从1990年开始,特快专递、移动电话业务呈逐年上升的趋势,特别是特快专递到2006-2007年期间,业务增长迅猛。固定电话业务在1990-2006期间呈上升趋势,但2006-2007年期间有下降趋势。
3描述性统计分析
描述集中趋势的统计量有均值、中位数、众数、总和、百分位数;描述离散程度的统计量有样本方差、样本标准差、均值标准误差、极差;描述总体分布形态的统计量有偏度、峰度。
3.1频率分析
例4-1实验步骤:打开data4-1.sav→选择菜单,“分析-描述性统计-频率→在弹出的“频率”对话框中,把收入、教育放入“变量(V)”框中→点击统计量,在百分位值中选择百分位数,在百分位数中添加30、60、90;集中趋势中选择“众数”统计量,点击继续→点击图表,选中直方图,同时选中“在直方图上显示正太曲线”,点击继续→确定得到以下图表:
表3统计量
N 众数 百分位数
30 60 90
有效
0 1 2 3 4 5 6 7
频率 2 87 152 157 137 88 85 52
百分比 .2 10.4 18.2 18.8 16.4 10.5 10.2 6.2
有效 缺失
收入 836 0 3 3.00 4.00 7.00
有效百分比
.2 10.4 18.2 18.8 16.4 10.5 10.2 6.2
教育 835 1 5 4.00 5.00 5.00 累积百分比
.2 10.6 28.8 47.6 64.0 74.5 84.7 90.9
表4变量“收入”的频率分布标表
8 9 10 11 合计
27 9 8 32 836
3.2 1.1 1.0 3.8 100.0
3.2 1.1 1.0 3.8 100.0
94.1 95.2 96.2 100.0
表5变量“教育”频率分布表
有效
1 2 3 4 5 6 合计
缺失
系统 合计
频率 8 39 114 165 456 53 835 1 836
百分比 1.0 4.7 13.6 19.7 54.5 6.3 99.9 .1 100.0
有效百分比
1.0 4.7 13.7 19.8 54.6 6.3 100.0
累积百分比
1.0 5.6 19.3 39.0 93.7 100.0
图5变量“收入”的直方图
图6变量“教育”的直方图
表4变量“收入”的频率分布标表可以看出受访者家庭收入在“2000-2999”的人最多。从图5和图6,受访者教育程度同正态分布相比左偏,受访者家庭收入的分布右偏,都不是明显的正态分布。 3.2描述性分析
描述性分析主要是用于计算并输出变量的各类描述性统计量,和频率分析相
比,没有图形功能,也不能生成频率表,但它可以将原始数据标准化,以便后续分析时应用。例4-2实验步骤:打开data4-2.sav→依次点击分析、描述统计、描述,打开“描述性”主对话框→把身高作为变量移入候选变量框中,在“选项”子对话框中选择均值、标准差、最大值、最小值、峰度、偏度这几个描述性性统计量→确定得到表6
表6描述统计量 极小 N 统计量 体重 有效的 N (列表状态) 96 96 值 统计量 13 极大值 统计量 30 均值 统计量 标准差 统计量 偏度 统计量 标准误 峰度 统计量 标准误 18.23 3.007 1.163 .246 1.849 .488 表6包括了身高的个数、极值、均值、标准差、偏度和峰度信息,输出的统计量中,方差和标准差越小越好,说明该组数据趋于稳定。
4参数估计与假设检验
4.1单样本T检验
单样本T检验利用来自某总体的样本数据,推断该总体的均值与指定的检验值之间是否存在显著性差异,它是对总体均值的假设检验。例5-2的实验步骤:打开data5-1.sve→选择菜单“分析→比较均值→单样本T检验(S)”,打开 “单样本T检验” 对话框,将变量“weight”移入”检验变量”列表框,并输入检验值500→打开“单样本T检验:选项”对话框 ,设置置信区间为95%(缺省为95%)→确定。运行结果如表7和表8所示:
表7单个样本统计量 Bootstrap Statistic weight N 均值 标准差 均值的标准误 10 500.8000 5.39135 1.70489 偏差 -.0810 -.38267 标准 误差 1.6784 .97486 95% 置信区间 下限 497.4533 2.99815 上限 504.1467 6.95100 a表8单个样本检验 检验值 = 500 t weight .469 df 9 Sig.(双侧) 均值差值 .650 .80000 差分的 95% 置信区间 下限 -3.0567 上限 4.6567 表7给出了单样本T检验的描述性统计量,包括样本数(N)、均值、标准差、
均值的标准误。表8:当置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P值为0.650,大于0.05,故原假设成立,也就是说,抽样袋装食盐的质量与500克无显著性差异,有理由相信生产线工作状态正常。 4.2独立样本T检验
单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。例5-3实验步骤:打开data5-2.sav→选择菜单 “选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“产量” 作为要进行
T检验的变量,将“品种”字段作为分组变量,定义分组变量的两个分组分别为“a”和“b”→打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同→确定得到表9和表10:
表9组统计量 单位面积产量 玉米品种 品种A 品种B 方差方程的 Levene 检验 均值方程的 t 检验 差分的 95% 置信区Sig.(双均值差F Sig. 单位面积产方差相等 假设方差等 1.004 13.642 .333 5.50000 5.47560 -6.27297 17.27297 t df 14 侧) 值 假设.104 .752 1.004 标准误差值 下限 间 上限 N 8 8 均值 81.2500 75.7500 表10独立样本检验 标准差 11.80496 10.02497 均值的标准误 4.17368 3.54436 .332 5.50000 5.47560 -6.24398 17.24398 量 不相根据表10“方差方程的 Levene 检验”中的sig.为0.752,远大于设定的显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本T检验的结果应该看上表中的“假设方差相等”一行,第5列为相应的双尾检测概率(Sig.(双侧))为0.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。
5方差分析
5.1单因素方差分析
单因素方差分析检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来源来同一总体。例6-1实验步骤:①、方差相等的齐性检验:选择菜单“分析→均值比较→单因素ANOVA”,打开“单因素方差分析”对话框→把猪重作为因变量,饲料品种作为控制变量→点击选项,弹出选项对话框,选择“方差同质性检验”→确定得到表和表。②多重比较分析、:单击“两两比较(H)按钮,弹出两两比较对话框,选择LSD最小显著性差异→确定得到表
表11方差齐性检验猪重
Levene 统计量 .024 df1 3 df2 15 显著性 .995 方差齐性检验的H0假设是:方差相等。从表11可看出相伴根据Sig.=0.995>a(0.05)说明应该接受H0假设(即方差相等)。故下面就用方差相等的检验方法。
表12ANOVA猪重 组间 组内 总数 平方和 20538.698 652.159 21190.858 df 3 15 18 均方 6846.233 43.477 F 157.467 显著性 .000 表12是几种饲料方差分析的结果,组间平方和为20538.698,自由度(df)为3,均方为6846.233;组内平方和为652.159,自由度为15,均方为43.477;F统计量为157.467。由于组间比较的相伴概率Sig.(p值)=0.000<0.05,故应拒绝H0假设(四种饲料喂猪效果无显著差异),说明四种饲料对养猪的效果有显著性差异。
表13多重比较猪重LSD (I) 饲料品种 1 (J) 饲料品种 2 3 4 均值差 (I-J) ***95% 置信区间 标准误 显著性 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 下限 上限 -27.5687 -9.7913 -65.2487 -47.4713 -96.8428 -77.9872 9.7913 27.5687 -46.5687 -28.7913 -78.1628 -59.3072 47.4713 28.7913 77.9872 59.3072 65.2487 46.5687 96.8428 78.1628 -18.68000 4.17024 -56.36000 4.17024 -87.41500 4.42321 18.68000 ***2 1 3 4 4.17024 -37.68000 4.17024 -68.73500 4.42321 56.36000 37.68000 ***3 1 2 4 4.17024 4.17024 4.42321 4.42321 -31.05500 4.42321 87.41500 68.73500 **-40.4828 -21.6272 4 1 2
3 *. 均值差的显著性水平为 0.05。 31.05500 *4.42321 .000 21.6272 40.4828 表13反映出来四种饲料相互之间均存在显著性差异,从效果来看是第4种最好,其次是第3种,第1种最差。 5.2协方差分析 协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。例6-3实验步骤:选择菜单“分析→一般线性模型→单变量→数学成绩作为因变量,分组作为固定变量,入学成绩移入协变量→打开“模型”对话框,把“entrance”、“group”和entrance*group移入模型中,在类型中选择“交互”→打开“选项”对话框,选中“方差齐性检验”复选框,点击确定按钮结果如下表14所示:
表14误差方差等同性的 Levene 检验 因变量:数学成绩 F 2.337 df1 2 df2 15 Sig. .131 a检验零假设,即在所有组中因变量的误差方差均相等。 a. 设计 : 截距 + group + entrance + group * entrance 表15主体间效应的检验 因变量:数学成绩 源 校正模型 截距 group entrance group * entrance 误差 总计 校正的总计 III 型平方和 3757.122 862.817 104.163 .467 61.932 1492.878 112898.000 5250.000 adf 5 1 2 1 2 12 18 17 均方 751.424 862.817 52.082 .467 30.966 124.406 F 6.040 6.935 .419 .004 .249 Sig. .005 .022 .667 .952 .784 表16
Tests of Between-Subjects EffectsDependent Variable: 数学SourceCorrected ModelIntercept入学成绩组别ErrorTotalCorrected TotalType III Sumof Squares3695.190a1387.8248.8573364.0831554.810112898.0005250.000df3112141817Mean Square1231.7301387.8248.8571682.041111.058F11.09112.496.08015.146Sig..001.003.782.000a. R Squared = .704 (Adjusted R Squared = .640)
表14是方差的齐性检验结果,由于其相伴概率值Sig.=0.131>0.05,因此认为各组的方差具有齐性。表15是检验控制变量与协变量是否具有交互作用,
从其中可看出group与entrance的交互作用项Sig.=0.784>0.05,因此认为它们之间没有交互作用。 可以看出入学成绩的影响是不显著的,而教学方法的影响是显著的。
6相关分析
6.1两变量相关分析
二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。例7-1实验步骤:选择菜单“分析→相关→双变量”,打开“双变量相关”对话框→将“father”和“son”移入变量框中,选择双侧检验,相关系数选择“person”→在选项对话框中选择均值和标准差、叉积偏差和协方差→确定,得到表17:
表17相关性
父亲身高
Pearson 相关性 显著性(双侧) 平方与叉积的和
协方差 N
儿子身高
Pearson 相关性 显著性(双侧) 平方与叉积的和
协方差 N
*. 在 0.05 水平(双侧)上显著相关。
父亲身高
1 84.667 7.697 12 .703 .011 40.333 3.667 12
*
儿子身高 .703 .011 40.333 3.667 12 1 38.917 3.538 12
*
从表17中可看出,相关系数为0.703>0,说明呈正相关,而相伴概率值Sig.=0.005<0.05,因此应拒绝零假设(H0:两变量之间不具相关性),即说明儿子身高是受父亲身高显著性正影响的。 6.2偏相关分析
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。例7-3实验步骤:选择菜单“分析-相关-双变量”,打开“偏相关”对话框→ 把 “hgrow”和“temp”作为 分析变量,“rain”、“hsun”、“humi”设为控制变量→确定,得到表18:
表18相关性 控制变量 月降雨量 & 月平均日照时数 & 月平均湿度 生长量 相关性 显著性(双侧) df 生长量 1.000 . 0 月平均气温 .977 .000 7
月平均气温 相关性 显著性(双侧) df .977 .000 7 1.000 . 0 从表18可以看出,月降雨量、月平均日照时数和月平均湿度为控制变量,生长量与月平均气温关系密切,偏相关系数为0.977,双尾检测的相伴概率为0.000(表示趋近于0的正数),明显小于显著性水平0.05。故应拒绝原假设,说明中山柏的生长量与气温间存在显著的相关性。
7回归分析
7.1一元线性回归分析
线性回归假设因变量与自变量之间为线性关系,用一定的线性回归模型来拟合因变量和自变量的数据,并通过确定模型参数来得到回归方程。根据自变量的多少,线性回归可有不同的划分。当自变量只有一个时,称为一元线性回归,当自变量有多个时,称为多元线性回归。
例8-1实验步骤:①作散点图,观察两个变量的相关性:依次选择菜单“图形→旧对话框→散点/点状→简单分布”,并将“国内生产总值”作为x轴,“财政收入”作为y轴,得到图。②选择菜单“分析→回归→线性”,打开“线性回归”对话框,将变量“财政收入”作为因变量 ,“国内生产总值”作为自变量。③打开“统计量”对话框,选上“估计”和“模型拟合度”。④单击“绘制(T)?”按钮,打开“线性回归:图”对话框,选用DEPENDENT作为y轴,*ZPRED为x轴作图。并且选择“直方图”和“正态概率图” ⑤作相应的保存选项设置,如预测值、残差和距离等。
图7 表19方差分析表 模型 1 回归 残差 总计 平方和 1.557E9 34187286.770 1.592E9 df 1 13 14 均方 1.557E9 2629791.290 F 592.250 Sig. .000 aa. 预测变量: (常量), 国内生产总值。b. 因变量: 财政收入 表20回归系数表
非标准化系数 模型 1 (常量) 国内生产总值 B -4993.281 .197 标准 误差 919.356 .008 标准系数 试用版 .989 t -5.431 24.336 Sig. .000 .000 从表19中可以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“H0:回归系数B = 0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。
从表20中可看出,回归模型的常数项为-4993.281,自变量“国内生产总值”的回归系数为0.197。因此,可以得出回归方程:财政收入=-4993.281 + 0.197 *国内生产总值。回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回归系数的显著性,说明建立线性模型是恰当的。 实验体会:
这几周对SPSS统计软件的学习,使我更好的掌握了统计学的知识。SPSS统计软件为统计数据处理,图表的创建与编辑、描述性统计分析、参数估计与假设检验、方差分析、相关分析和回归分析等带来了极大的方便,相对与EXCEL对数据的处理功能。操作上更加简便,也通俗易懂。
这段时间的学习,让我对于学习态度有很大的改变。当遇到繁琐的问题,老师总是不厌烦给我们重新讲统计学的知识,在EXCEL为我们演示计算的每个步骤。我们缺少的就是这种耐心和严谨的治学态度,这点值得我们去学习。还有遇到不懂的问题,主动去书本上寻找知识,做到查漏补缺。
正在阅读:
spss实验报告01-31
银行客户经理个人业务汇报05-05
商业银行中小额信用贷款全流程外包研究12-06
试题精选复习测试强化训练六年级上学期小学语文期末真题03-30
小学二年级数学考试卷 - 图文04-20
使用导学案进行有效教学-最新教育资料04-13
江南大学食品化学考博历年题收集11-29
华东理工大学化工原理简答题真题汇总11-15
关于地下停车场可行性研究报告 - 图文03-11
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 实验
- 报告
- spss
- 厨师考核管理办法
- 食品营养学题库
- 华南农业大学食品化学11年真题
- 2015年12月09日1640524593的初中数学组卷八上几何难题
- 初中生物光合作用专题及答案 - 图文
- 风电项目水土保持监理总结报告
- 环境管理体系程序文件合集(23个)(内含全套表格) ISO14001 GBT24001 管理体系2018年新版资料 - 图文
- 大型深基坑施工与周边环境相互影响分析
- 实验小学校长与各处室负责人签订的安全责任书
- 植物组织培养实验指导书
- 《三国演义》阅读测试题及阅读答案
- oracle试题答案解释版
- 四年级奥数乘除法巧算 周期试题
- 水利造价员继续教育考试及答案2016
- 六年级数学培优补差工作总结
- 上海拆迁政策
- 南农大2009年植物生理学考研试题
- Z05 精通急救培训船员去回车
- 鄂教版小学五年级科学下册复习题
- 制冷系统加氨安全管理规定