SPSS20使用教程

更新时间:2023-10-21 16:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPSS应用软件试验指导手册

SPSS工具简介

统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。

常见的统计软件有SAS,SPSS,MINITAB,EXCEL等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS在各类院校以及科研机构中更为流行。

SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows大同小异,在本试验课程中我们选择PASW Statistics 20.0作为统计分析应用试验活动的工具。 1. SPSS的运行模式 SPSS主要有三种运行模式: (1) 批处理模式

这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2) 完全窗口菜单运行模式

这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。

(3) 程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。

本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS的启动

(1) 在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS 12.0 for

Windows”即可启动SPSS软件,进入SPSS for Windows对话框,如图1.1,图1.2所示。

1

SPSS应用软件试验指导手册

图1.1 SPSS启动

图1.1 PASW Statistics 启动对话框

3. SPSS软件的退出

SPSS软件的退出方法与其他Windows应用程序相同,有两种常用的退出方法: ? 按File→Exist的顺序使用菜单命令退出程序。

? 直接单击SPSS窗口右上角的“关闭”按钮,回答系统提出的是否存盘的问题之

后即可安全退出程序。 4. SPSS的主要窗口介绍

2

SPSS应用软件试验指导手册

SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,最主要的界面有三个:数据编辑窗口、结果输出窗口和语句窗口。 (1) 数据编辑窗口

启动SPSS后看到的第一个窗口便是数据编辑窗口,如图1.3所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。

标题栏 菜单栏 工具栏 编辑栏 观测序号 变量名栏 状态栏 窗口切换标签

图1.3 数据浏览界面

? 标题栏:显示数据编辑的数据文件名。

? 菜单栏:通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。

为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的工具栏设置不满意,也可以用[视图]→[工具栏] →[设定]命令对工具栏按钮进行定义。

? 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。 ? 变量名栏:列出了数据文件中所包含变量的变量名

3

SPSS应用软件试验指导手册

? 观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。

? 窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。

? 状态栏:用于说明显示SPSS当前的运行状态。SPSS被打开时,将会显示“PASW Statistics Processor”的提示信息。 (2) 结果输出窗口

在SPSS中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的SPSS输出结果文件来打开该窗口。

4

SPSS应用软件试验指导手册

试验1 数据文件管理

一、试验目的与要求

通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等等。

二、试验原理

SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。

表2.1 SPSS数据文件结构

变量 姓名 张三 李四 性别 1 2 年龄 45 23 ? ? ? 数据内容 观测 … … … … ……2 ……王五 SPSS变量的属性

SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。

45 ? 5

SPSS应用软件试验指导手册

试验5:相关分析与回归分析

一、试验目标与要求

本试验项目的目的是学习并使用SPSS软件进行相关分析和回归分析,具体包括:

(1) 皮尔逊pearson简单相关系数的计算与分析

(2) 学会在SPSS上实现一元及多元回归模型的计算与检验。 (3) 学会回归模型的散点图与样本方程图形。 (4) 学会对所计算结果进行统计分析说明。 (5) 要求试验前,了解回归分析的如下内容。 ? 参数α、β的估计

? 回归模型的检验方法:回归系数β的显著性检验(t-检验);回归方程

显著性检验(F-检验)。

二、试验原理

1.相关分析的统计学原理

相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Pearson简单相关系数。

2.回归分析的统计学原理

相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。

线性回归数学模型如下:

yi??0??1xi1??2xi2????kxik??i

在模型中,回归系数是未知的,可以在已有样本的基础上,使用最小二乘法对回归系数进行估计,得到如下的样本回归函数:

????x???x?????x?e yi??01i12i2kiki回归模型中的参数估计出来之后,还必须对其进行检验。如果通过检验发现模型有缺陷,则必须回到模型的设定阶段或参数估计阶段,重新选择被解释变量和解

46

SPSS应用软件试验指导手册

释变量及其函数形式,或者对数据进行加工整理之后再次估计参数。回归模型的检验包括一级检验和二级检验。一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。

三、试验演示内容与步骤

1.连续变量简单相关系数的计算与分析

在上市公司财务分析中,常常利用资产收益率、净资产收益率、每股净收益和托宾Q值4个指标来衡量公司经营绩效。本试验利用SPSS对这4个指标的相关性进行检验。操作步骤与过程: ?

打开数据文件“上市公司财务数据(连续变量相关分析).sav”,依次选择“【分

析】→【相关】→【双变量】”打开对话框如图,将待分析的4个指标移入右边的变量列表框内。其他均可选择默认项,单击ok提交系统运行。

图5.1 Bivariate Correlations对话框

结果分析:

表给出了Pearson简单相关系数,相关检验t统计量对应的p值。相关系数右上角

47

SPSS应用软件试验指导手册

有两个星号表示相关系数在0.01的显著性水平下显著。从表中可以看出,每股收益、净资产收益率和总资产收益率3个指标之间的相关系数都在0.8以上,对应的p值都接近0,表示3个指标具有较强的正相关关系,而托宾Q值与其他3个变量之间的相关性较弱。

表5.1 Pearson简单相关分析

Correlations

每股收益率

Pearson Correlation Sig. (2-tailed) N

净资产收益率

Pearson Correlation Sig. (2-tailed) N

资产收益率

Pearson Correlation Sig. (2-tailed) N

托宾Q值

Pearson Correlation Sig. (2-tailed) N

** Correlation is significant at the 0.01 level (2-tailed).

每股收益率

1 . 315 .877(**) .000 315 .824(**) .000 315 -.073 .199 315

净资产收益率 .877(**) .000 315 1 . 315 .808(**) .000 315 -.001 .983 315

资产收益率

.824(**) .000 315 .808(**) .000 315 1 . 315 .011 .849 315

托宾Q值

-.073 .199 315 -.001 .983 315 .011 .849 315 1 . 315

2.一元线性回归分析

实例分析:家庭住房支出与年收入的回归模型

在这个例子里,考虑家庭年收入对住房支出的影响,建立的模型如下:

yi????xi??i 其中,yi是住房支出,xi是年收入 线性回归分析的基本步骤及结果分析:

(1)绘制散点图 打开数据文件,选择【图形】-【旧对话框】-【散点/点状】,如图5.2所示。

48

SPSS应用软件试验指导手册

图5.2 散点图对话框

选择简单分布,单击定义,打开子对话框,选择X变量和Y变量,如图5.3所示。单击ok提交系统运行,结果见图5.4所示。

图5.3 Simple Scatterplot 子对话框

从图上可直观地看出住房支出与年收入之间存在线性相关关系。

49

SPSS应用软件试验指导手册

图5.4 散点图 (2)简单相关分析

选择【分析】—>【相关】—>【双变量】,打开对话框,将变量“住房支出”与“年收入”移入variables列表框,点击ok运行,结果如表5.2所示。

表5.2 住房支出与年收入相关系数表

Correlations 住房支出(千美元) 年收入(千美元) Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 住房支出(千美元) 1 . 20 .966(**) .000 20 年收入(千美元) .966(**) .000 20 1 . 20 ** Correlation is significant at the 0.01 level (2-tailed). 从表中可得到两变量之间的皮尔逊相关系数为0.966,双尾检验概率p值尾0.000<0.05,故变量之间显著相关。根据住房支出与年收入之间的散点图与相关分析显示,住房支出与年收入之间存在显著的正相关关系。在此前提下进一步进行回归分析,建立一元线性回归方程。 (3) 线性回归分析

步骤1:选择菜单“【分析】—>【回归】—>【线性】”,打开Linear Regression 对话框。将变量住房支出y移入Dependent列表框中,将年收入x移入Independents列表框中。在Method 框中选择Enter 选项,表示所选自变量全部进入回归模型。

50

本文来源:https://www.bwwdw.com/article/vqgf.html

Top