SPSS17.0统计软件使用指导 全面的指导

更新时间:2024-03-05 05:37:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPSS统计软件使用指导

1 SPSS简介

SPSS的全称是:Statistical Program for Social Sciences,即社会科学统计程序。该软件是公认的最优秀的统计分析软件包之一。从最初的SPSS/PC for DOS到SPSS6.0、8.X、9.0、10.X、11X与12.0、13.0 、14.0、15.0 for Windows。随着版本的不断更新,软件功能不断改善,操作越来越简便,与其他软件的接口也越来越多。SPSS软件不仅能执行统计功能,还能将分析结果用数种清晰简练的表格与数十种栩栩如生的2D、3D图形来显示,SPSS强调其社会科学应用的层面,使用统计学与概率论的理论进行研究,同时它在自然科学、经营管理、金融、医疗卫生、体育等各个领域中都能发挥巨大的功能,是统计、企业规划、企业管理等部门执行系统化管理决策的有力工具。

1.1 SPSS的基本功能

1.SPSS的数据编辑功能

利用SPSS的数据编辑器窗口,可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作,还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时指定打开该集合,而不必打开整个数据文件。

2.表格的生成和编辑

利用SPSS可以生成数十种风格的表格,利用编辑窗口或监视器可以编辑所要生成的表格。在SPSS的高级版本中,统计成果多被归纳为表格或图形的形式。

3.图形的生成和编辑

利用SPSS可以生成数十种基本图形和交互式图形。其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC曲线图、P-P概率图、Q—Q图、序列图和时间序列图等。交互式图形比基本图形更漂亮,可有不同风格的2D、3D图形。交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。

4.SPSS的统计功能

(1) 摘要性分析 摘要性分析是对原始数据进行描述性分析,是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。SPSS统计软件通过调用摘要性分析,可完成均数、标准差、标准误差等指标的计算,对于计数和一些等级资料,

2?可完成构成比率等指标的计算和检验。SPSS的摘要性分析包括以下几个过程:

1) Frequencies(频数)过程 调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。

2) Descriptives(描述)过程 调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存人数据库。

3) Explore(探索)过程 调用此过程可对变量进行更为深入详尽的描述性统计分析,即探索性统计。它是在一般描述性统计指标的基础上,增加有关数据其他特征文字与图形描述,有助于思考对数据进行分析的方案。

(2)平均水平的比较 在正态或近似正态分布的计量资料中,经常在使用前面介绍的摘要性分析后,还要进行组与组之间平均水平的比较,也就是要进行常用的t检验和单因素方差分析。在SPSS统

1

计软件中实现这一功能可调用以下几个过程:

1) Means(平均数)过程 与摘要性分析中的Descriptives(描述)过程相比,若仅仅计算单一组别的均数和标准差,Means(平均数)过程并无特别之处;但在指定条件分组计算均数和标准差时,如分性别同时分年龄计算各组的均数和标准差,则用Means(平均数)过程更显简单快捷。

2) One-Samples T Test(单一样本T检验)过程 调用此过程可完成样本均值与总体均值的比较。 3) Indendent-Samples T Test(双样本T检验)过程 调用此过程可完成两样本均数差别的显著性检验,即两组资料的t检验。

4) Paired-Samples T Test(配对样本T检验)过程 调用此过程可完成配对资料的显著性检验,即配对t检验。用于同对或同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。

5) One-Way-ANOVA(单因素方差分析)过程 调用本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。

(3)方差分析 方差分析主要用于: 1)均数差别的显著性检验。

2)分离各有关因素并估计其对总变异的作用。 3)分析因素间的交互作用;④方差齐性检验。

SPSS软件除上面介绍的One-Way-ANOVA(单因素方差分析)过程外,可调用以下过程:Simple Factorial(单一因素)过程、General Factorial(综合因素)过程、Multivariate(多变量)过程等实现方差分析的功能。

(4)相关分析 相关分析是判定变量间相互依存关系的统计方法,借助于Statistics(统计)菜单的Correlate(相关)选项完成的。包括Bivariate(两个变量之间相关分析)过程、Partial(偏相关分析)过程、Distances(距离相关分析)过程。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来。

(5)回归分析 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。用于说明这种依存变化的数学关系。SPSS软件通过Linear(线性回归)过程、Curve Estimation(曲线估计)过程、Binary Logistic(二值逻辑回归)过程、Probit(概率回归)过程、Nonlinear(非线性回归)过程等实现回归分析功能。

(6)对数线性模型 对数线性模型是用于离散型数据或整理成列联表格式的统计资料的统计分析工具。SPSS软件通过General(一般对数线性分析)过程、Logit(分对数线性分析)、Model Selection(选择模型的对数线性分析)过程实现这一功能。

(7)分类分析 分类分析方法主要是聚类分析与判别分析。通过Twostep Cluster(两步聚类)过程、K—Means Cluster(快速聚类)过程、Hierarchical Cluster(分层聚类)和Tree(树状分析)过程、Discriminant(判别分析)过程实现。

(8)因子分析 多元分析处理的是多指标的问题,由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又会让人陷入混乱不清的状态。在实际工作中,由于指标间经常具备一定的相关性,所以希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。调用Data Reduction(数据缩减)菜单的Factor(因子分析)命令,可对多指标或多因素资料进行因子分析。

(9)可靠性分析 可通过调用Reliability(信度)过程完成。

(10)非参数检验 许多统计分析方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐。这些方法常用来估计或检验总体参数,但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计。通过调用Chi-Square(卡方检验)过程、

2

Binomial(二项分布检验)过程、Runs(游程检验)过程、1-Sample K-S过程(单样本K-S检验)、2 1ndependent Samples(两独立样本非参数检验)过程、k lndependent Samples(多独立样本非参数检验)过程、2 Related Samples(两配对样本非参数检验)过程、K Related Samples(多配对样本非参数检验)过程,可实现非参数检验功能。

(11)生存分析 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况。为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。利用SPSS系统的Life Tables(生存)过程、Kaolan-Meier(考拉迈尔)过程、Cox Regression(考克斯回归)过程等可以进行生存分析。

1.2 SPSS的启动与主窗口

1.SPSS的启动

SPSS安装完毕后,系统会自动在Windows(窗口)菜单中创建快捷方式。单击Windows的“开始”按钮,在“程序”菜单的SPSS for Windows中找到SPSS l3.0 for Windows并单击,即可启动SPSS。

2.SPSS数据编辑窗口

SPSS主界面有两个,一个是SPSS数据编辑窗口,另一个是SPSS结果输出窗口。

SPSS的数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名称栏、内容区、窗口切换标签页和状态栏组成(如图12-1所示)。

标题栏 菜单栏 工具栏 编辑栏 变量名称表格 内容窗口切换 状态区 3

图12-1数据编辑窗口

(1)标题栏中显示编辑的数据文件名称。

(2)菜单栏中列出了SPSS的命令菜单,每个菜单对应一组相应的功能。其中File(文件)是对SPSS文件的操作;Edit(编辑)是SPSS文件的编辑菜单;View(视图)是用户界面设置菜单;Data(数据)是数据文件的建立和编辑菜单;Transform(转换)是数据基本处理菜单;Analyze(分析)是统计分析菜单,主要统计功能都集中在该菜单中;Graphs(图表)是统计图形菜单;Utilities(工具)是相关应用和设置菜单;Windows(窗口)是SPSS各窗口切换菜单;Help(帮助)是SPSS帮助菜单。

(3)工具栏中列出了一些常用的快捷按钮。 (4)编辑栏中可以输入数据。

(5)变量名称栏中列出了该编辑文件中所含有的变量名称SPSS自动命名变量名称为var0001、var0002等。

(6)内容区列出了各个个案在变量中的取值。SPSS中每一行表示一个个案。内容区的最左边是行的标号。

该窗口下方有两个标签:Data View(数据视图) 和Variable View(变量视图)。这两种视图提供了一种类似于电子表格的方法,用以产生和编辑SPSS数据文件中的变量和数据。Data View(数据视图)显示具体的数据内容,可以输入编辑数据。Variable View(变量视图),可以看到它显示的是数据文件中变量的定义,包括变量的名称、类型、宽度、小数点位数等(如图12-2所示)。此时可以根据需要对数据文件中的变量进行增删或修改。数据视图和变量视图可看作是数据编辑窗口的两个方面。

4

图12-2变量视图

3.SPSS结果输出窗口

结果输出窗口是另一个十分重要的窗口,它在完成Analyze(分析)菜单中的某个统计分析过程后,就会将分析结果呈现出来(如图12-3所示)。只有当完成一项处理后,才在该窗口显示处理过程和计算结果。

图12-3结果输出窗口

结果输出窗口包括标题栏、菜单栏、工具栏、索引区、内容区以及状态栏6个部分。结果输出窗口第一次出现时标题名称是Outputl.spo-SPSS Viewer,第二次出现时标题名称是Output2.spo-SPSS Viewer,依次类推。

5

(4)结果解读(如图12-9所示)

图12-9

从结果中可以看出,此公司20名职工的基本工资Mean(均值)3337.90元、Std.Error of Mean(平均标准误差) 262.42174、Median(中位数)3589.00元、Mode(众数)4800.00元、Std.deviation(标准差)1173.586元、Variance(方差)1377303元、Skewness(偏度)-0.116元、Std.Error of Skewness(偏度标准误差) 0.512元、Kurtosis(峰度)-1.369元、Std.Error of Kurtosis (峰度标准误差) 0.992元、Range(全距)3460元、Minimum(最小值) 1540元、Maximum(最大值) 5000元、Sum(合计)66758元。

3.求Quartiles (四分位数)、Deciles (十分位数) 和Percentiles (百分位数)

11

(1)Quartiles (四分位数)基本原理 四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。

(2)Deciles (十分位数) 基本原理 十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为Dl,D2,……,D9,表示10%的数据落在Dl下,20%的数据落在D2下,……,90%落在D9下。

(3)Deciles (百分位数) 基本原理 百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,……,P99,表示1%的数据落在P1下,2%的数据落在P2下,……,99%落在P99下。

现利用SPSS求四分位数、十分位数和百分位数。以某公司20名员工的收入资料为例,求“基本工资”的四分位数、“奖金”的十分位数和“分红”的百分位数。

(4)SPSS实现过程

1)同求均值的操作步骤(1)。 2)同求均值的操作步骤(2)。

3)单击下方的Statistics(统计)按钮,弹出 Frequencies(频数): Statistics(统计)对话框,选择要统计的项目:①Quartiles复选框:四分位数,输出25%,50%,75%的分位数值;②Cut points for n equal groups复选框:十分位数。将数据按大小顺序排序后,平均分成n等份,输出相应数据。如果选择此项,要求在右侧的编辑框输入一个整数数字。若输入数字n=10,即平均分成10等份;③Percentile(s) 复选框:是自定义百分位数。依次键入一系列按大小排列的整数,键入值通过左侧的Add(增加)、Change(更改)、Remove(移除)按钮进行编辑。也可以自定义百分位数,若键入35,可求出在35%状态下的分红值。

(5)结果解读

1)求“基本工资”的四分位数(如图12-10、12-11所示)

图12-10

12

图12-11

从结果中可以看出,此公司员工基本工资的第一四分位差Q1=2170.00元,第二四分位差Q2=3589.00元,第三四分位差Q3=4528.00

Q3?Q1元,Q=24528?21752==1176.5元。

2)求“奖金”的十分位数(如图12-12、12-13所示)

图12-12

13

图12-13

从结果中可以看出,此公司员工奖金的Dl……D5=1000元,D6=1260元,D7、D8=1300元,D9=1480元。

3)求“分红”的百分位数(如图12-14、12-15、12-16、12-17所示)

图12-14

14

图12-15

从结果中可以看出,此公司员工分红的百分位数是P1…P30=400元,P30…P40=430元,P40…P70=500元,P70…P80=580元,P80…P100=800元。

若自定义百分位数是35,求出的在P35状态下的分红值为500元。

图12-16

15

图12-17

2.2描述性分析

1.描述性分析的基本原理

描述性统计分析过程就是计算并列出一系列描述性统计量指标。这与前面讲的频数分析过程相同,但它可以将原始数据转换成标准化值,并以变量的形式存入数据库,供进一步分析。将原数据变量X转化成新的标准化值变量Z。我们称为Z分数。

Z分数定义:从平均数为?,标准差为?的总体中抽出一个变量值X,Z分数表示的是此变量大于或小于平均数几个标准差。计算公式:

Z?x???

将原始数据直接转换为Z分数时,常会出现负数和带小数点的值,实际使用起来很不方便。因此,可以对Z分数进一步加以线性转换,使之成为正的数值。最典型的一种Z分数线性转换就是T分数。计算公式: T?10Z?50

2.SPSS的实现过程

现利用SPSS以表12-2“基本工资”变量为例,求它的Z分数。步骤如下:

(1)单击Analyze(分析)菜单Descriptive Statistics(描述统计)项中的Descriptives(描述)命令。(如图12-18所示)

16

图12-18

(2)弹出Descriptives(描述)对话框。在对话框左侧的变量列表中选择“基本工资”,单击“→”按钮使之添加Variable(s)(变量)框中,同时选中对话框左下方的Save standardized values as variables(把标准化后的值保存为变量)项。

(3)单击右下方的Options(选项)按钮,出现Descriptives(描述):Options(选项)对话框,在此选择Mean(均值)、Std. deviation(标准差)、Variance(方差)、3项统计量。(如图12-19所示)

图12-19

17

选好后单击Continue(继续)按钮返回Frequencies(频数)对话框,单击OK按钮,SPSS即开始计算。

3.结果解读

在数据编辑窗口中。新变量“Z基本工资”表示“基本工资”Z分数。(如图12-20、12-21所示)

图12-20

图12-21

18

4.Z分数转换为T分数

由于Z分数有正有负,而且小数点位数较多,因此可以把它通过线性转换为T分数。在SPSS中的转换步骤:

(1)在Transform(转换)菜单中选择Compute(计算)(如图12-22所示)

图12-22

(2)在弹出的Compute Variable(计算变量)对话框中,在Target Variable(目标变量)文本框中输入目标变量t,接着在Numeric Expression(数值表达)文本框中输入“10×Z基本工资+50”。单击Type & Label(类型和标签)按钮,出现Compute Variable:Type and Label(类型和标签)对话框。在Type and Label(类型和标签)对话框中的Label(标签)框中输入“T分数”,作为变量t的中文注解(如图12-23所示)。

图12-23

19

(3)单击Continue(继续) 按钮,返回。单击OK按钮,SPSS立即算出学生数学成绩Z分数的线性转换后的T分数(如图12-24所示)。

图12-24

结果数据编辑窗口中新产生变量“t”来储存这些员工基本工资的T分数。

2.3基本统计分析的报表制作

SPSS的基本统计功能中还提供了基本统计分析的报表制作功能,根据报表制作的侧重点不同,可以分为3种:①Cases Summary (个案简明统计报表):主要是计算指定变量的分组统计量;②Report

Summaries in Rows (行形式报表):是以行为对象生成各种统计结果。例如一个公司有男性员工和女性员工,可以以性别为分组变量(Break Variables)提供不同性别员工的基本信息,如基本工资;③Report Summaries in Colums (列形式报表):是以列为对象生成各个列相应的统计信息。

1.个案简明统计报表在SPSS中实现过程

例12-3 以例12-2的20名员工的基本工资、奖金和分红等统计信息为例,生成个案简明统计报表。SPSS操作步骤:

(1)在Analyze(分析)菜单Reports(报告)中选择Case Summaries(观测量概要)命令(如图12-25所示)。

图12-25

20

本文来源:https://www.bwwdw.com/article/mqoa.html

Top