《统计软件应用实训》指导手册

更新时间:2023-10-17 17:56:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

工商管理专业

《统计软件应用实训》指导手册

黄 璟 编

姓名 班级 序号

长江大学工程技术学院

说 明

工商管理专业的学生通过几年系统的专业理论课学习,掌握了一定的理论知识,但面对大量的数据信息如何实现真正的定量分析,就需要借助某个或某些统计分析软件进行计算机化处理以简化管理工作。因此开展统计软件应用实训,就是同学们从理论走向实践并以实践升华理论的一个起步。本实习指导手册正为指导统计软件应用而编写的,同学可按照本指导手册的要求完成每个阶段的实训练习,并最终提交规范的实训大作业分析报告,使其每一阶段的活动均有章可循并养成良好的思考问题、分析问题和勇于实际动手解决问题的习惯。

本指导手册是为SPSS初学者提供的一本简明教程,软件操作以SPSS13. 0为主,每章包括实训目的、原理介绍、案例分析、要点提示和实训练习五个部分。

由于编者水平水平有限,时间仓促,本手册中疏漏和错误之处在所难免,望不吝赐教。

编 者

2010.6

1

目 录

第一部分 实训安排 ........................................................................................................ 1 第二部分 实训主要内容 ................................................................................................ 3

第1章 SPSS for Windows 简介................................................................................. 3

1.1 实训目的 .......................................................................................................... 3 1.2 原理介绍 .......................................................................................................... 3 1.3 案例分析 .........................................................................................................12 1.4 要点提示 .........................................................................................................13

第2章 统计图表 ........................................................................................................14

2.1 实训目的 .........................................................................................................14 2.2 原理介绍 .........................................................................................................14 2.3 案例分析 .........................................................................................................17 2.4 要点提示 .........................................................................................................20 2.5 实训练习 .........................................................................................................20

第3章 描述统计分析 ................................................................................................22

3.1 实训目的 .........................................................................................................22 3.2 原理介绍 .........................................................................................................22 3.3 案例分析 .........................................................................................................22 3.4 要点提示 .........................................................................................................25 3.5 实训练习 .........................................................................................................25

第4章 相关分析与回归分析 ....................................................................................26

4.1 实训目的 .........................................................................................................26 4.2 原理介绍 .........................................................................................................26 4.3 案例分析 .........................................................................................................26 4.4 要点提示 .........................................................................................................31 4.5 实训练习 .........................................................................................................31

第5章 聚类分析 ........................................................................................................32

5.1 实训目的 .........................................................................................................32 5.2 原理介绍 .........................................................................................................32 5.3 案例分析 .........................................................................................................32 5.4 要点提示 .........................................................................................................36 5.5 实训练习 .........................................................................................................36

第6章 因子分析 ........................................................................................................37

6.1 实训目的 .........................................................................................................37 6.2 原理介绍 .........................................................................................................37 6.3 案例分析 .........................................................................................................37 6.4 要点提示 .........................................................................................................42 6.5 实训练习 .........................................................................................................42

第三部分 综合实训实例 ...............................................................................................43

1

第一部分 实训安排

一、实训要求

本次实训是在专业老师指导下,应用统计学的理论知识学习SPSS统计软件的操作运用,并完成一份合格的SPSS统计软件实训报告。为了能够顺利完成这项任务,达到实训效果,提出以下基本要求:

1、 通过为期两个星期的实训安排,学会熟练操作SPSS软件进行简单的数据处理; 2、掌握原始调研数据的录入、EXCELL与SPSS数据的转换,锻炼将不同统计软

件相互兼容转换的基本能力;

3、掌握简单的频数分析的分析方法,实现对数据的初步整理;

4、学会操作SPSS完成相关分析、回归分析、因子分析以及聚类分析的操作步

骤,理解每一步所运用的原理;

5、通过给予的实训综合练习数据及分析要求,自行应用SPSS软件解决实际管

理问题;

6、导出相关成果图表,学会解释说明各图表所表示的经济、管理含义,用书

面报告的形式进行展示;

7、使学生在操作应用SPSS统计软件的整个过程中得到一次专业的训练。

二、实训方式、实训内容安排

1、实训方式

分小组进行,3人/组,各小组成员间互助学习,分别提交一份实训报告。 2、实训内容安排 第一周:

(1)了解本次实训的任务与时间安排,学习SPSS的基本操作原理,学习SPSS

的数据录入与整理以及简单的描述统计分析,完成实训练习; (2)学习SPSS的相关分析与回归分析,完成实训练习;

1

(3)学习SPSS的方差分析,完成实训练习; (4)学习SPSS的聚类分析,完成实训练习; (5)学习SPSS的因子分析,完成实训练习。 第二周:

(1)布置实训综合练习题,讲解作业要求;

(2)根据练习要求,初步数据处理,试应用所学分析方法进行第一次试分析; (3)处理实训综合练习题原始数据; (4)解释数据分析处理结果; (5)编写《SPSS统计软件学习报告》。

三、成绩考核与评定

实训成绩实行百分制计分。 考核方式:

1.实训练习(40分):每小题10分; 2.统计软件应用大作业(60分):

(1)按顺序依次对所提供的数据进行处理 (10分) (2)选择正确的图表进行分析 (20分) (3)分析、说明有逻辑性,简洁明了 (20分) (4)得出正确结论 ( 5分) (5)作出深刻的心得体会 ( 5分) 字数在3000—5000字左右。

注:实训练习,必须提交电子文档;大作业,必须提交打印文档及电子文档 。 最后由指导老师综合评定。

本实训课程没有补考,凡属编列了该实训课的专业的学生必须认真参加实训,圆满完成教学大纲所要求的任务。因特殊原因不能参加者,随下一届学生进行。

2

第二部分 实训主要内容

第1章 SPSS for Windows 简介

1.1 实训目的

作为数据处理和分析技术的统计方法已越来越广泛地应用于自然科学和社会科学研究、生产和经营管理及日常生活中。但在进行统计分析时,涉及变量和样本数据常常很多,计算量也很大。为了提高统计分析的效率,必须依靠计算机和计算机软件,它使得复杂的数据处理工作变得非常容易。

通过本实训项目,旨在使学生理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,剪成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理和交换,包括数据的格式转换、合并、行列转置、和分类汇总等等。

1.2 原理介绍

1.2.1 SPSS概述

SPSS是国际著名统计软件包之一。SPSS原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。2000年,随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司正式将其英文全称改为Statistical Product and Service Solutions,新的意思是“统计产品与服务解决方案”。 SPSS目前广泛应用于经济学、管理学、法学、社会学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域。

1.2.2 SPSS的启动、主要窗口 1、SPSS的启动

单击“开始”→[程序]→[SPSS for Windows]→[SPSS 13.0 for Windows]。 2、SPSS的主要窗口

SPSS主要有Data Editor数据编辑窗、SPSS Viewer结果输出窗、Draft Viewer草稿浏览窗、Pivot Table Editor表格编辑窗、Chart Editor图编辑窗、Text Editor文本编辑窗。

⑴Data Editor数据编辑窗

启动SPSS后,出现SPSS数据编辑器,见图1.1。

3

图1.1数据编辑、数据定义窗口

该窗口有两个界面,一是Data View数据编辑窗口,另一个是Variable View数据定义窗口。

①Data View数据编辑窗口的主菜单共有10个选项,如表1.1:

表1.1 主菜单项说明

1 2 3 4 5 6 7 8 9 10 File Edit View Data 文件管理菜单 文件编辑 视图编辑 数据管理菜单 有关文件的调入、存储、显示和打印等 有关文本内容的选择、拷贝、剪贴、寻找和替换等 数据编辑、数据定义窗口的转换、控制 有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等 数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等 有关一系列统计方法的应用 统计图表的建立与编辑 有关命令解释、文件信息、定义输出标题、窗口设计等 有关窗口的排列、选择、显示等 有关帮助文件的调用、查寻、显示等 Transform 数据转换 统计分析 Analyze Graphs 作图菜单 Utilities 实用程序 Windows 窗口控制 Help 帮助 ②Variable View数据定义窗口的各变量功能:

? Name:变量名称,其总长度不能超过64个字符(32个汉字)。 ? Type:变量类型。单击变量类型(Type),弹出如图1.2所示对话框。

? Numeric:数值型,同时定义数值的宽度(Width),包括整数部分+小数点+

小数部分的位数。

? Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余同数值型。 ? Scientific notation:科学记数型,

4

同时定义数值宽度(Width)和小数位数(Decimal Places),在数据管理窗口中以指数形式显示。如定义数值宽度为9,小数位数为2,则345.678 显示为3.46E+02。

图1.2变量类型选择

5

? Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。

如选择mm/dd/yy形式,则2005年6月25日显示为06/25/2005

? Custom currency:用户自定义型,显示为整数部分每3位加一逗号,

用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。

? String:字符型,用户可定义字符长度(Characters)以便输入字符。 ? Width:变量长度。当变量为某些特定类型如日期变量,该设置无效。 ? Decimals:变量取值的小数点位数。当变量为某些特定类型(如字符型变量),该设置无效。

? Label:变量标签,这是对变量的进一步描述。变量一般根据其含义来命名,但变量命名一般不能太长,否则用户使用时显得太罗嗦,且变量名称的长度有限(64个字符或32个汉字),此时变量标签就显得比较重要。

? Values:变量值标签,对变量取值的进一步描述。一般说明变量取某个值的含义,变量值标签不超过60个字符长。如在统计中经常以1代表“male”,2代表“female”。变量值标签在定性或有序变量时常被采用。单击变量值标签(Values),弹出图1.3。

在图中上方有一个“Value”编辑框,在这里输入变量的取值为1,下一个“Value”编辑框输入该变量值的标签“male”,然后单击“Add”,在图中下部的显示框中就出现了文本“1.00=“male””。

? Missing:缺失值。表格区中任意一个空的数字单元都被认为是缺失值,一点号“.”表示。单击缺失值(Missing),弹出如图1.4所示对话框。

图中有3个单选钮,默认值为最上方的“No missing values”表示无缺失值;第二项为“Discrete missing values”,表示对不连续缺失值,可定义1-3个,如测量身高(厘米)的资料,可定义999为缺失值;性别的资料(男为1、女为2),可定义-1为缺失值;最后一项为“Range of missing values”,表示可定义一个缺失值的范围,同时定义一个不在这一范围的缺失值,如定义0~9为脉搏的缺失值,同时定义999为脉搏的缺失值。

6

图1.3 变量值标签设置 图1.4缺失值的定义方式

? Measure:变量的测量精度。可划分为定性变量(Nominal)、有序变量(Ordinal)和比例变量(Scale)。

1.2.3 SPSS数据的预处理

1、转换Excel格式文件为SPSS数据集

(1)选择[File] →[Open] →[Data]或选择“打开” 图标,系统会弹出一个“Open File”对话框。在对话框中选择“文件类型”为ALL Files,并输入或选择相应的Excel格式文件名。

(2)点击打开按钮,对弹出的对话框不做任何修改,直接点击“OK”。 注意:Excel文件必须保存为2003版本;在打开Excel文件所对应的SPSS文件前,必须先关闭该Excel文件。

2、合并数据集

合并文件的功能是某处外部文件与当前数据合并成一个新工作数据,新工作数据包括样本或变量的增加。注意,增加变量时,外部文件与当前数据必须是升序排列文件。

从[Data] →[Merge files]可以看到下一级菜单中有两个命令项Add Cases(数据纵向合并)和Add Variables(数据横向合并)。

点击[Add Cases]进入Add case :read file读取外部文件增加样本(数据纵向合并)对话框,如图1.5所示

图1.5 Add case :read file读取外部文件增加病例对话框

文件名栏,放入外部文件名。文件类型栏,选择外部文件类型。

从外部选择一个数据文件,点击[打开]按钮,进一步弹出Add cases from增加样本对话框,如图1.6所示。

7

图1.6 Add cases from增加样本对话框

Unpaired variable:不匹配变量栏。指变量名相同而变量定义不同的变量,或变量名不同的变量。

Variables in new working data:新工作数据变量栏

Indicate case source as variable:指示样本来源的变量选项。数值0表示源工作数据的样本,数值1表示外部文件的样本。选择该项后,也可以输入任一变量名作为指示样本来源的变量,系统默认值的变量名为source01。

(*)=Working Data File:星号表示工作数据文件。 (+)=E:\\chengxu\\spss\\cars.sav:加号表示外部文件。

从[Data] →[Merge files] →[ Add Variables]进入Add Variables:Read File读取外部文件增加变量(数据横向合并)对话框,如图1.7所示。

图1.7 Add Variables:Read File对话框

文件名栏:放入外部文件名。文件类型栏:选择外部文件类型。

选择一数据文件,点击[打开],弹出ADD Variables from增加变量对话框,如图1.8所示。

8

图1.8 ADD Variables from增加变量对话框

Excluded Variables:拒绝变量栏.外部文件与当前数据的同名变量,拒绝加到新工作区中。

New Working Data:新工作数据变量栏。

Match Case on Key Variable in Sort:排序文件中按关键变量匹配样本选项。 Both files provide case:由外部文件和当前数据两者提供样本。

External file is keyed table:外部文件为关键表,以当前数据为基准,外部文件匹配当前数据的关键变量值,如果匹配成功,外部文件的新变量值加入到当前数据的新变量中,匹配不成功则不加入。

Working Data File is keyed table:当前数据为关键表,以外部文件为基准,当前数据匹配外部文件的关键变量值,如果匹配成功,外部文件的新变量值加入到当前数据的新变量中,匹配不成功则舍去当前数据的该样本。

Key Variables:关键变量栏,在拒绝变量栏选择某变量作为关键变量。 Indicate case source as variable:指示病例来源的变量选项。数值0表示原工作数据的样本,数值1表示外部文件的样本,选择该项可以输入任意变量名作为指示样本来源的变量,系统默认值的变量名为source01。

(*)=Working Data File:星号表示工作数据文件 (+)=E:\\chengxu\\spss\\cars.sav:加号表示外部文件 3、行列转置

选择菜单:[Data]→[Transpose],Transpose行列转置过程的功能是将数值型变量的数据旋转90度。进行行与列变量的互换,如图1.9所示。

9

图1.9 Transpose行列转置对话框

Variable(s)栏放入将要行列转置的变量名在数据文件中未放入栏中的变量会遗失字串变量不能转置如果强迫转置变量值转变为系统缺失值。

Name variable变量命名栏在左侧源变量栏选择一个变量放入name variable栏,即该变量的数据作为转置后的变量名。

4、分类汇总

对数据进行分类汇总就是按指定的分类变量值观测量进行分组,对每组观测量的各变量求描述统计量。生成新数据文件。在新数据文件中应分类变量的每个值产生一个观测量。

(1)打开[data]菜单选择[Aggregate]展开[Aggregate Data]对话框如图1.10所示

图1.10 Aggregate Data对话框

(2)在左侧的源变量框中选择一个或多个变量作为分类变量进入分类变量(Break Variable[s])框中。

10

(3)在左侧的源变量框中选择一个或多个变量作为要求汇总的变量进入汇总变量Aggregate Variable(s))框中即要求对这些变量的值进行分类汇总。

(4) name&label(名称与标签):单击此按钮可以修改组合后所生成的新变量的名称以及标签。可以在Name后面的矩形框中输入新变量名。在Label后面的矩形框中输入新变量的标签。单击Continue按钮继续。

如果不选择该选择项则系统对每个新变量赋予的变量名均为对应的原始变量名后面加下划线和数字1。

(5) Function函数选择此项可以确定汇总变量的描述内容系统的默认函数为平均数。单击此按钮,展开Aggregate Data:Aggregate Function对话框,如图1.11所示。

第一组包括八个单选项。八个单选项中只能择其一: Mean of values 源变量分组中的算术平均数。 Fist Value 源变量分组中的第一个观测值。 Last value 源变量分组中的最后一个观测值。 Number of cases 源变量分组中加权观测量的数目。 Standard deviation源变量分组中的标准值。 Mininum value 源变量分组中最小的观测值。 Sum of values 源变量分组中所有观测量的和。 Maximum Value 源变量分组中最大的观测值。

图1.11 Aggregate Data Aggregate Function对话框

选择函数完成后,单击[Continue]按钮,返回主对话框。

11

(6)Save number of cases in break group sa variable:选择此项,各分组的观测量的数目作为一个新的变量保存在生成的新数据文件中。在接下来的框中键入你为该变量取的变量名。

(7)Create new data file:选择此项,新变量存储与新文件中。选择此项激活[File]按钮,单击[File]按钮展开对话框。在对话框中指定保存新数据文件的存储路径和文件名。操作与打开数据文件的操作相同。单击[Continue]按钮返回主对话框,指定的数据文件的文件名和存储路径显示在[File]按钮后面。

Replace working data file:选择此项,包含汇总变量的新数据文件替代当前工作文件。

(8)单击[OK]按钮执行汇总功能。

1.3 案例分析

1.3.1 [例1-1]根据下面的调查问卷,建立一个SPSS数据集,并进行数据的预处理。

关于本科生逃课情况的调查

①您每周逃课的频率

A.从不 B.1次 C.2次 D.2次以上 ②你逃课后的主要活动

A.上网 B.睡觉 C.自习 D.其它 ③你对逃课的看法

A.无所谓B.有点在意C.过后会自责D.下不为例 ④您认为逃课是否会对学习成绩存在较大的影响 A.会B.不会 再次感谢您的合作! 1、设计编码明细表 序号 1 2 3 12

Name number gender houmuch Type Numeric Numeric Numeric Lable 序号 性别 逃课频率 Values None 1=男,2=女 1=从不,2=1次,3=2次,4=3次以上 Measure Ordinal Nominal Nominal

2.3.1条形图 操作步骤与过程:

1)选择[Graph]→[Bar],打开Bar Charts对话框;选择Clustered及Summaries of separate variables选项,单击[Define]打开对话框,如图2.5所示

2)将左边的“体重”、“身高”变量选入右边Bar Represent框内,“年龄”选入右边Category Axis框内,单击[OK]。输出结果,如图2.6所示

2.3.2线图

操作步骤与过程:

1)选择[Graph]→[Line],弹出Line Charts对话框,如图2.7所示。选择Summaries for groups of cases选项,单击[Define]打开对话框。

2)将左边的“身高”变量选入右边Variable框内,“年龄”选入右边Category Axis框内,单击[OK]。输出结果,如图2.8所示。

2.3.3面积图

原始数据为2-2.sav。 操作步骤与过程:

1)选择[Graph]→[Area] →[Simple] →[Summaries for groups of cases],如图

18

2.9所示。

2)单击[Define]打开对话框,选择“月份”加入Category Axis框内。单击[OK],输出结果,如图2.10所示。

2.3.4饼图

使用SPSS自带car.sav数据,用饼图描述出各种汽缸的汽车各占多少。 操作步骤与过程:

1)选择[Graph]→[Pie] → [Summaries for groups of cases],如图2.11所示。 2)单击[Define],选择“cylinder”进入Define Slices by框中。单击[OK],输出结果,如图2.12所示。

2.3.5直方图

原始数据文件为2-3.Sav。 操作步骤与过程:

1)选择[Graph]→[Histogram] ,如图2.13所示。

2)选择“年龄”进入对话框中,选择Display normal curve。单击[OK],输出

19

结果,如图2.14所示

2.3.6散点图

仍以2-1.sav为数据源。操作步骤与过程:

1)选择[Graph]→[Scatter] →[Simple],如图2.15所示。

2)单击[Define],将左边的“身高”变量选入右边X栏内,“年龄”选入右边Y栏内,单击[OK]。输出结果,如图2.16所示。

2.4 要点提示

SPSS的输出结果界面,从英语使用者的角度来看,是十分美观的,但中文使用者可能觉得并不自然,且常常需要将SPSS分析结果转换成为word文档。

从前面的介绍我们已知道,统计图表种类繁多,各有其特点,如何根据具体情况,作出正确而恰当的选择,还需要同学们不断地进行总结。

2.5 实训练习

调查问卷:

网上购物调查问卷

您好!为了进一步了解网上购物消费情况,特做此问卷,还希望您能认真填写。 非常感谢您在百忙之中填写这份问卷。 20

性别: 年龄: 职业:

1、您是否在网上购买产品( )

□买过 □没买过

2、您在网上购买过何种商品( )

□饰品 □电子产品 □书籍 □化妆品 □服装

□食品 □其它 3、您认为目前在网上销售的商品中,最热销的产品是( )

□饰品 □电子产品 □书籍 □化妆品 □服装 □食品 □其它 4、您在网上购买的频率是( )

□一星期一次 □一月一次 □一年一次 □不定期购买 5、您每次购买的平均消费是( )

□10元以内 □10-50元 □50-100元 □100-500元 □500以上 6、您在网上购买的因素是( )

□商品丰富 □知名度高 □价格低 □信用好 □购买方便 □质量 □其它 7、您购买商品时选择何种物流方式( ),该种物流方式的平均价格是( ) □平邮 □快递 □EMS

□自己提货 □其它 8、您购买商品的支付方式是( )

□邮政汇款 □支付宝 □财付通 □银行转账 □其它 9、您对卖家信用的评价( )

□非常好 □好 □一般 □不好 □非常不好 10、您是否还会继续选择网上购物( ) □会 □不会 11、您对网上购物的意见和建议?

再次十分感谢!

要求:1.设计编码明细表,并用Excel录入数据(数据自行设计);

2.对SPSS数据集进行简单的预处理,如合并数据集、行列转置、分类

汇总;

3.对数据集进行条形图、线图、饼图的输出。

21

第3章 描述统计分析

3.1 实训目的

本实训旨在引导学生利用正确的统计方法对数据进行适当的整理和显示,描述并碳素出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推论统计方法及应用各种统计方法解决实际问题打下坚实基础。

3.2 原理介绍

3.2.1 统计学原理

我们平时所用到的描述统计量只要有以下几类:

集中趋势指标:算术平均数、调和平均数、几何平均数、众数、中位数、分位数等。其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。

离散趋势指标:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差只适用于正态分布资料,标准误实际上反映了样本均数的波动程度。

百分位数指标:包括四分位数、各个百分位数等,适用于任何分布类型资料。 分布指标:偏度系数、峰度系数,它们反映了数据偏离正态分布的程度。 3.2.2 操作原理

1、Frequencies频数分析过程:会产生频数分布表,利用这些频数分布表可以方便的对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表和图形,以便对各变量的数据特征和观测量分布状况有个概括的认识。

2、Descriptives描述统计量分析过程:通过平均数、算数和、最大值、最小值、全距和均值标准误差等统计量对变量进行描述,且可将原始数据转换成标准Z分值并存入数据库。

3.3 案例分析

使用SPSS自带coffee.sav数据,绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M。

1)选择Analyze→Descriptive Statistics→Frequencies,进入Frequencies对话框,将“brand”选入Variables框,如图3.1所示。

22

图3.1 Frequencies对话框

Display frequency tables复选框:确定是否在结果中输出频数表。

2)单击Statistics钮进入Stataistics对话框,选中Mean、 Std.deviation、Median复选框。单击Continue按钮返回Frequencies对话框。

图3.2 Statistics对话框

现将各部分解释如下:

Percentile Values复选框组:定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。

Central tendency复选框组:用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。

Dispersion复选框组:用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。

23

Distribution复选框组:用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。

Values are group midpoints复选框:当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。

3)单击Charts按钮,进入Charts对话框,选中Bar charts。单击Continue按钮返回对话框,单击OK可得到结果。

Chart type单选钮组定义统计图类型有四种选择:无、条图Bar chart、圆图(Pie chart)、直方图Histogram,其中直方图还可以选择是否加上正态曲线(With normal curve)。

Chart Values单选钮组定义是按照频数还是按百分比做图(即影响纵坐标刻度)

图3.3 Frequencies Charts对话框

得出结果后手工计算出CV。 输出结果如下:

表3.1 统计结果

Statistics brand N Valid Missing Mean Median Std. Deviation Variance 4662 0 3.3606 3.0000 1.73786 3.020

24

表3.2 频数分布表

brand Valid Frequency AA BB CC DD EE FF Total 1012 611 862 753 709 715 4662 Percent 21.7 13.1 18.5 16.2 15.2 15.3 100.0 Valid Percent 21.7 13.1 18.5 16.2 15.2 15.3 100.0 Cumulative Percent 21.7 34.8 53.3 69.5 84.7 100.0

3.4 要点提示

使用SPSS软件进行数据描述,熟练掌握Frequencies过程和Descriptives过程是非常重要的若仅要求计算几个单变量描述统计指标,则选择Descriptives过程,若需进行较全面的描述分析,则选择Frequencies过程。

3.5 实训练习

对第二章实训练习所生成的数据集进行频数分析、交叉分析。

25

第4章 相关分析与回归分析

4.1 实训目的

本实训项目的目的是学习并使用SPSS软件进行相关分析和回归分析,具体包括:

1、皮尔逊积矩相关系数、Spearman相关系数的计算与分析; 2、简单线性回归分析。

4.2 原理介绍

1、相关分析的统计学原理

皮尔逊相关系数应用较广,r =COV(x,y)/

?x?y。当r=0时表示不存在线性

相关,但不意味着y与x无任何关系;当0<|r|≤0.3时为微弱相关;当0.3<|r|≤0.5时为低度相关;当0.5<|r|≤0.8时为显著相关;当0.8<|r|≤1时为高度相关;当|r|=1时为完全线性相关。

2、回归分析的统计学原理

回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。

4.3 案例分析

例1.请计算SPSS自带的样本数据judges.sav中意大利(judge1)和韩国法官(judge2)得分的相关性。

解:由于judge1和judge2的数据分布不太好,这里同时计算Pearson相关系数和Spearman相关系数。操作如下:

1. Variables框:选入judge1、judge2 2. Pearson复选框:选中 3. Spearman复选框:选中 4. 单击OK钮

输出结果如下所示:

Correlations

26

表4.1

在上表4.1的结果中,变量间两两的相关系数是用方阵的形式给出的。每一行和每一列的两个变量对应的格子中就是这两个变量相关分析结果结果,共分为三列,分别是相关系数、P值和样本数。由于这里只分析了两个变量,因此给出的是2*2的方阵。由上表可见judge1、judge2自身的相关系数均为1(of course),而judge1和judge2的相关系数为0.91,P<0.001,有非常显著的统计学意义。

上表的标题内容翻译如下:

表4.2 相关系数表

Italy South Korea .910 .000 300 1.000 . 300 Pearson积距相关系数 1.000 Italy P值(双侧) 样本数 South . 300 .000 300 Pearson积距相关系数 .910 P值(双侧) Korea 样本数

Nonparametric Correlations

27

本文来源:https://www.bwwdw.com/article/b3vf.html

Top