STATISTICA8.0 统计分析-案例实例集 - 图文

更新时间:2024-01-27 17:49:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Basic Statistical Analysis

统计分析

STATISTICA 8.0案例实例集

目录

第 1章基本统计与表

格 ..........................................................................................1

1.1描述统计,T检验和相关分

析......................................................................1

1.1.1开启基本统计/表格模块 .......................................................................1 1.1.2相关分析 ................................................................................................2 1.1.3均值(t检验)间的差异 ..........................................................................6 1.1.4对于方差差异的检验 ...........................................................................10 1.1.5考察分布(通过描述统计)...................................................................12 1.1.6图形选项 ..............................................................................................13 1.2分割表格与单因子方差分

析.......................................................................13

1.2.1概述 ......................................................................................................13 1.2.2均值的摘要表格...................................................................................14 1.2.3单因子方差分析和均值的多重比较 ....................................................14

1.2.4分析结果的图形展

示 ...........................................................................15

1.2.5组内相关分析.......................................................................................16 1.2.6分类散点图 ..........................................................................................17 1.3频率

表 .........................................................................................................18 1.3.1概述 ......................................................................................................18 1.3.2数据文件 ..............................................................................................19 1.3.3频率表 ..................................................................................................19 1.3.4生成直方图 ..........................................................................................20 1.3.5图形选项 ..............................................................................................21 1.3.6摘要 ......................................................................................................23 1.4二维

表 .........................................................................................................23 1.4.1概述 ......................................................................................................23 1.4.2进行分析 ..............................................................................................24 1.4.3表格的结构 ..........................................................................................24 1.4.4阅读表格 ..............................................................................................25 1.4.5统计量 ..................................................................................................27 1.4.6选择一个表格.......................................................................................27 1.4.7查看其他表格.......................................................................................30 1.4.8摘要 ......................................................................................................30 1.5交叉

表 .........................................................................................................30 1.5.1概述 ......................................................................................................30 1.5.2进行分析 ..............................................................................................30 1.5.3交叉表的图形呈现方

式 .......................................................................32

1.5.4摘要 ......................................................................................................32 1.6为多重响应和二分变量制

表.......................................................................33

1.6.1数据文件的描述...................................................................................33 1.6.2数据文件 ..............................................................................................34 1.6.3制定一个简单的分类变量和多重响应变量 ........................................35

1.6.4查看多重响应因子的频率表................................................................37 1.6.5查看一个多重二分变量的频率表........................................................40 1.6.6为多重响应和二分变量制作交叉表 ....................................................42

1.6.7相对频率:响应百分比和受访者百分比 ............................................45 1.6.8查看一个三维表...................................................................................46

1.6.9结论 ......................................................................................................47 第 2章多元回归分

析 ............................................................................................48 2.1标准回归分

析..............................................................................................48 2.1.1数据来

源 ................................................................................................48 2.1.2研究问

题 ................................................................................................48 2.1.3开始分

析 ................................................................................................49 2.2逐步回归分

析..............................................................................................58 2.2.1数据来

源 ................................................................................................58 2.2.2研究问

题 ................................................................................................58 2.2.3开始分

析 ................................................................................................58 2.2.4定义逐步回归分

析.................................................................................58 第 3章方差分析 ....................................................................................................62

3.1因子方差重复量测方差分析.......................................................................62 3.1.1启动方差分析模块.................................................................................62 3.1.2设计........................................................................................................62 3.1.3制定设计(变量)......................................................................................63 3.1.4重复量测设计.........................................................................................64 3.1.5设定重复量测因子.................................................................................64 3.1.6执行分析 ................................................................................................65 3.1.7查看方差分析结果.................................................................................66 3.1.8 STATISTICA交互数据分析..................................................................69 3.1.9自动分析(宏和 STATISTICA Visual Basic) ..........................................69 3.2 2 X 3的组间方差分析设计 ..........................................................................70 3.2.1数据文件 ................................................................................................70 3.2.2设定分析 ................................................................................................70

3.2.3制定设计 ................................................................................................71 3.2.4查看结果. ...............................................................................................71 3.2.5平均数的事后比较.................................................................................74 3.2.6检验假设 ................................................................................................75 3.2.7方差齐性 ................................................................................................77 3.2.8摘要........................................................................................................77 3.3组间 2水平与组内 4水平之重复量测设计 ...............................................78 3.3.1简介........................................................................................................78 3.3.2研究课题 ................................................................................................78 3.3.3数据文件的准备.....................................................................................78 3.3.4制定设计 ................................................................................................79 3.3.5查看结果 ................................................................................................79 3.3.6事后检验 ................................................................................................83 3.3.7多变量方法 ............................................................................................84 3.3.8摘要........................................................................................................85 3.4方差分析/多变量方差分析语法实例..........................................................85

第 4章非参数统

计................................................................................................87

4.1 2 X 2列联表 .................................................................................................87 4.1.1分析详述 ................................................................................................87 4.1.2检查摘要数据表.....................................................................................87 4.2符号检验......................................................................................................89 4.2.1检查数据 ................................................................................................89 4.2.2分析详述 ................................................................................................90 4.3卡方的观测值与期望值...............................................................................91 4.3.1分析详述 ................................................................................................92 4.3.2检查分析结果.........................................................................................92 4.4相关性研究..................................................................................................93 4.4.1分析详述 ................................................................................................94 4.4.2检查结果 ................................................................................................95 4.4.3肯德尔 tau和伽玛相关系数...................................................................96

4.5 WALD-WOLFOWITZ连续检验.......................................................................97 4.5.1分析详述 ................................................................................................97 4.5.2检验结果 ................................................................................................98 4.6 KRUSKAL-WALLIS秩和检验的方差分析和中位数检

验 ............................100

4.6.1分析详述 ..............................................................................................100 4.6.2检查分析结果.......................................................................................101 4.7 FRIEDMAN方差分析与 KENDALL协同系

数...............................................103

4.7.1分析目的 ..............................................................................................104 4.7.2分析详述...............................................................................................104 4.7.3检查统计结果 .......................................................................................105 4.8 WILCOXON配对检验..................................................................................106 4.8.1分析详述 ..............................................................................................107 4.8.2检验分析结果.......................................................................................107 4.9 COCHRAN Q检验........................................................................................108 4.9.1分析详述 ..............................................................................................109 4.9.2检验分析结果.......................................................................................110 4.10描述统计..................................................................................................111 4.10.1分析详述 ............................................................................................112

4.10.2检查统计结

果.....................................................................................113 第 5章连续分布的拟合 ......................................................................................114

5.1连续型分布的拟合 ....................................................................................114 5.1.1进行分析...............................................................................................115 5.1.2检验统计量...........................................................................................116

第一章基本统计与表格

1.1描述统计, T检验和相关分析

本例中的数据来自于 STATISTICA软件自带的范例数据文件 Adstudy.sta。该数据包含了 25个变量和 50个样本。这些 (虚构的)数据取自一项广告研究,在该研究中,男性和女性参与者需要对两条广告进行评价。将参与者的性别设为第一个变量(GENDER:1=MALE, 2=FEMALE)。每名参与者被随机安排观看两条广告中的一条(ADVERT:1=COKE,2=PEPSI)。之后他们需要从 23个方面对所看广告的吸引力分别进行评价(作为变量 MEASURE01至 MEASURE23)。在每一个方面,参与者的打分范围是从 0到 9。

1.1.1开启基本统计 /表格模块

打开 STATISTICA软件,并通过文件-打开范例文件菜单打开数据文件

Adstudy.sta;该文件位于 Datasets文件夹下。你也可以利用每个统计模块下的大部分启动面板将数据文件打开。例如,在统计菜单下选择基本统计/表格时,开启基本统计和表格分析启动面板。

单击开启文件按钮,开启选取数据来源对话框;在该对话框下单击文件…按钮,选择要打开的数据文件。

1.1.2相关分析

首先,考察每一方面的打分之间是否是相关的(或者说,一些方面衡量的是否是“同一件事”)。在基本统计和表格分析启动面板中,选择相关系数矩阵并单击确定按钮(你也可以直接双击相关系数矩阵)。

案例集第 2 页 Basic Statistical Analysis

屏幕出现积乘动差与偏相关系数对话框。

你既可以选择同一个列表中的变量 (即一个正方形矩阵),也可以选择两个列表中的变量 (长方形矩阵)。对于本例,单击单一变量表列按钮,开启一般的变量选取对话框。取消对仅显示适当的变量选框,然后选择全部的变量(即单击变量选择对话框中的选择全部按钮),单击摘要按钮。由于此分析只用于连续型变量,而我们的选择中包含了文本型的变量,程序接下来会针对可能出现的意外结果对使用者进行提醒。包含文本值 /文本卷标对话框被开启。对于本例我们希望保留这些文本型变量。单击继续目前的选取条件按钮,生成一个带有相

关分析的结果表格。

高亮显示显著的相关关系

在结果表格中,所有 p<.05(双尾)的显著的相关系数都将被默认的使用另外一种颜色(高亮)显示。你可以自己定义表格中高亮显示相关系数的显著性水平(alpha)。要更改这一显著性水平,再次开启积乘动差与偏相关系数对话框,单击选项活页,将统计显著之 p-值改为

0.01(举例)。再次单击摘要按钮,查看更新后的分析结果表格,这时所有符合这一显著性标准的相关性将被高亮显示。这样也是这些强相关性很容易就被发现(如在此表中,变量 MEASURE05和 MEASURE09的相关性的显著性水平为-.47)。这一强相关性说明这两个评分的方面可能衡量的是观看者对于广告的感知的相同方面(尽管其中一个是该方面的正向指标,另一个是反向指标)。 积乘动差与偏相关系数对话框中有两个选项,可以使生成的结果表格即包含相关系数,又包含一些更详细的统计量 (如:p-值、样本数、r2、t-值等)。当你在选项活页下选中包含 r, p-值以及样本数选项钮时,p-值和成对样本数会和相关系数一起在表格中出现(前提是你在积乘动差与偏相关系数对话框中选择了缺失值删除-成对样本;否则案例数将在结果表格的标题处被显示)。

积乘动差与偏相关系数对话框中选项活页下的详细表格结果选项钮,只有在分析中选择的变量数小于等于 20时才可以使用,这是由于对于每一个相关关系,都有大量的信息会被自动生成。由于之前选择的变量有 25个,这一选项目前无法使用。因此,单击积乘动差与偏相关系数对话框中的单一变量表列按钮,选中 MEASURE01到 MEASURE23。现在在选项活页下选中详细表格结果选项钮。单击摘要按钮,生成包含了相关描述统计量的结果表格,在相关分析中的每一个变量的相关系数、p-值、成对样本数,以及回归方程的斜率和

截距都将被显示出来。

这一选项只能被用于考察具体的相关关系(且不是用于探索性数据分析 ),原因是在此格式下,每个相关系数将占据 22个表格单元;因此这个 20x20的相关系数矩阵,将会生成一个包含 8,800个单元的结果表格。就像上面所看到的,MEASURE05和 MEASURE09的相关关系式高度显著的(p=.0006),这说明接受二者相关这一结果的出错可能为 10000次中会有 6次。技术上说,如果一个人可以随机的从一个这两个变量不相关的总体中抽取一个相同样本容量的样本,那么每 10000次抽取中获得的样本中,将有 6次这两个变量的相关性的显著性水平为-.47或者更高(即在本例中这一可能性更小)。 生成一个散点图

为了更形象的查看变量间的相关关系,再次开启积乘动差与偏相关系数对

话框,单击进阶/图标活页,并单击 2D散点图按钮。然后在变量选取对话框中选择变量 MEASURE05至MEASURE09,生成其散点图。所生成的散点图包含了所选择的相关关系的系数、回归线、 95%置信水平下的置信带,以及回归方程(位于标题位置)。

通过分析生成散点图,通过图形目录选项生成散点图 .

请注意这个散点图是根据当前在积乘动差与偏相关系数对话框中的设置生成的;即由此分析中设定的案例选择条件决定数据点是否被带入计算中,并使用当前设定的缺失值删除方法(如:整笔案例、成对删除、均值替代)。因此,如果你要生成一个 MEASURE05和 MEASURE09的散点图,而整个分析中还包含其它的变量 (如 MEASURE01),那么如果选择按整笔案例删除缺失值,那么只有在当前分析中的任何一个变量(如 MEASURE01)包含缺失值,该笔案例都将在分析时被剔除,即使对于 MEASURE05和 MEASURE09这两个变量的散点图来说所有数据都是存在的。因此,当在不同的变量中或对于不同的案例,存在着很多缺失值的情况下,通过分析选项 (如积乘动差与偏相关系数对话框中的 2D散点图按钮)所生成的图形,可能与通过单独的图形菜单选项所生成的图形有所不同。

1.1.3均值(t检验)间的差异

在下一步的分析中,将会研究男性和女性在响应模式中存在差异的可能性。具体来说,男性在对某些方面评分时与女性不同,导致在一些方面的评分更高或更低。独立样本的 t检验可用来确认这些潜在的差异。男性和女性的样本在每个范围上的平均分将被进行比较。返回基本统计与表格分析启动面板,

选择独立样本 t-检验,根据分群定义,开启独立样本 t检验,根据分群定义对话框。接下来单击变量按钮,开启标准的变量选取对话框。在这里,你既可以选择独立变量(群)用于分析,也可以选择反应变量。对于本例,选择 (设为高亮显示)MEASURE01到 MEASURE23(所有包含响应情况的变量)作为分群变量,变量性别 (GENDER)作为反应变量。

一旦你设定了分群变量, STATISTICA软件会自动对将要进行比较的分群变量进行编码 (本例中的编码为男性和女性)。你可以双击第一分群或是第二分群的输入框,以开启变量编码对话框,在这里你可以查看和选取每一个分群的编码。在独立样本 t-检验,根据分群定义对话框的进阶活页下,还有许多分析过程可以使用。在进行这些分析之前,你可以利用此对话框中图形选项,通过图形对变量的分布情况进行观察。例如,单击盒须图按钮,生成一个根据分群变量进行分类的盒须图,每个分群变量生成一个图形。相似的,单击分类直方图按钮,生成一个分类的 (根据分群变量)直方图。

你还可以选用分类正态概率图、分类递减趋势概率图和分类散点图,以查

看每一群内变量的分布情况。在选项活页下,将进行高亮显示的 p-值界限设置为 0.05。现在,单击摘要按钮,以开启 t-检验的分析结果表格。 查看 t检验的输出结果

分析表格的最快方法是查看第五列(p-值),并找出小于通常采用的显著性水平 0.05的 p值。对绝大多数分群变量来说,两组(MALE和 FEMALE)中的均值都十分接近。只有一个变量的 t-检验结果达到了通常采用的显著性水平 0.05,变量 MEASURE07的 p-值为 0.0087。通过观察均值的两列(表格的前两列)可以发现,男性对于该方面的评分(5.46)远高于女性 (3.63)。获得的这一差异是偶然现象的可能性仍是存在的,尽管在该检验有效的假设下(见下文),这看起来不太可能,因为该显著性水平上的差异偶然出现的可能性(大约)仅是 1000次中出现 9次(不足 100次中出现 1次)。这一结果将被进一步检查,但现在,首先看一下该变量的盒须图。

返回你之前生成的盒须图(显示在上面的工作簿中,也可以通过单击对话框中的盒须图按钮重新进行生成 )。然后选择图形中的变量 MEASURE07,双击图形以开启所有选项对话框,选择图形:盒形/须线,并在虚线数值的下拉菜单中将虚线数值设置为标准差。

现在单击确定按钮,生成更新后的图形:

此表格显示出了一些意外的情况:女性分群中的波动程度远大于男性。如果两个分群中数值的波动程度确实不同,那么就违背了 t-检验的其中一条理论假设,而你就要在对待均值的差异时格外小心。而且,波动程度的差别一般也与均值的大小有关,也就是说,均值较高的分群通常具有更大的波动程度。然而,本例中的情况恰恰相反。在这种情况下,有经验的研究者将对变量 MEASURE07的分布是否为正态分布产生怀疑(对于男性分群、女性分群或二者)。然而,为验证图形上看到的差异是否是可靠的,首先看一下对方差的检验。

1.1.4对于方差差异的检验

现在,返回结果表格,并滚动到能够看到 F-检验结果的位置。F-检验的结果确实达到了通常采用的显著性水平 0.05,这说明变量 MEASURE07在男性分群和女性分群中的方差确实存在差异。然而,方差的差异水平接近了显著性水平的边界(p-值为 0.29)。大多数研究者并不会因此而完全否定 t-检验对于均值差异的有效性,尤其是考虑到均值差异检验所得到的相对很高的显著性水平 (p=0.0087)。现在,看一下根据反应变量性别进行了分类的的变量 MEASURE07的分布情况。 分类直方图.

用鼠标右键选中结果表格,在快捷菜单中选择输入数据图表 -2D直方图选项。屏幕将出现一个对话框,让你选择直方图的分类变量(选择变量性别),以及该变量所使用的分类编码(选择全部)。然后单击确定按钮,生成相应的图形。

1.1.5考察分布(通过描述统计 )

现在,返回基本统计与表格分析启动面板并选择描述统计,开启描述统计对话框。在此对话框中,单击变量按钮,并选中数据文件中的所有变量。描述

统计结果表格默认包含所选变量的平均、有效样本数、标准差以及最大和最小

值。在进阶活页下选择需要计算的统计量类型。

对于本例,接受关于统计量的默认选项并单击摘要按钮,生成分析结果表格。

1.1.6图形选项

描述统计对话框提供了很多图形选项,用来从图形上查看变量的分布和相关性。在此对话框中可以使用的大多数图形类型,也可以通过图形菜单中的命令生成。举例来说,通过正态性活页下的选项生成的直方图将只包含在当前分析中被选中的那些案例。

1.2分割表格与单因子方差分析

1.2.1概述

通过分割表格与单因子方差分析过程,你可以计算被一个或多个分类变量(如性别或地区)所分割的数据的各种描述统计量 (如均值、标准差、相关系数、四分位数等),并进行单因子的方差分析。该过程的位于基本统计与表格分析 -

分割表格与单因子方差分析。本例使用的数据文件是 Adstudy.sta(通过文件-开启范例文件菜单可将其打开,它位于 Datasets文件夹下)。在开启该过程之后,选择分割表格统计量对话框下的个别表格活页,并单击变量按钮,选择 MEASURE01至 MEASURE23作为反应变量,性别(受访者的性别,男性或女性)和广告(受访者所观看的广告类型,可口可乐或百事可乐)作为两个用于分组的分群变量。

单击分群变量编码按钮,对两个分组变量均选择全部编码。

对一个变量选择全部编码时,你可以在编辑框中分别输入编码,对每个变量分别单击全部按钮,或者在编辑框中分别输入一个﹙*﹚。如果未作任何定义,直接单击确定按钮,也等同于选择了全部变量的全部取值。在此对话框中单击确定按钮,然后在分割表格统计量对话框中单击确定按钮,开启分群统计量 -结果对话框。此对话框为分组数据提供了很多选项和分析过程,使你可以更好的了解变量在不同类别间的区别。

1.2.2均值的摘要表格

你可以对在摘要:统计量或详细二维表格中显示哪些统计量进行选择,单击描述统计活页,并选中统计量选框中的所有选项。现在,单击详细二维表格按钮,开启分析结果表格。

此结果表格显示了所选择的描述统计量,它们来自那些被特定分组变量所分割的变量 (滚动结果表格,可以看到其它变量的分析结果 )。例如,看一下表格中各组的组内均值,你可以发现对于变量 MEASURE01来说,男性组和女性组的均值略有差异。现在,进一步考察这一均值差异,你可以看到在每一性别的组内, PEPSI和 COKE的均值间都存在一定的差异,因此在这一方面,性别所起的作用是相同的。

1.2.3单因子方差分析和均值的多重比较

通过单击方差分析按钮,你可以很容易的对这些差异的显著性进行检验,它位于结果对话框中的方差分析与检验活页下。单击该按钮可生成结果表格,其中包含了对于每个反应变量进行单因子方差分析的结果。

单因子方差分析过程所给出的结果显示变量 MEASURE05、 MEASURE07、 MEASURE09是统计意义上显著的。这说明组间的均值在数量上存在差异。现在,返回结果对话框并单击事后比较活页,对各组(均值)间的显著差异进行多重比较分析。对于本例,单击变量按钮选择 MEASURE07。你可以在几种多重比较检验中进行选择;对于本例,单击 LSD检验或计划性检

验按钮。

LSD检验与独立样本 t-检验等价的,它以进行比较的各组的案例数 N为基础。例 1中展示的独立样本 t-检验结果说明对于 MEASURE07来说,男性和女性的响应存在着显著差异。利用分割表格与单因子方差分析过程,你可以通过 LSD检验的结果发现,只有当女性观看可口可乐(COKE)的广告时,这种显著的差异才会发生。

1.2.4分析结果的图形展示

通过分群统计量-结果对话框中的许多图形选项,可以通过图形对这些差异进行查看。例如,为了比较各组中所选变量的分布情况,单击描述统计活页下的分类盒须图按钮,并在盒须图类型对话框中选择中位数/四分位数/全距按钮。然后,单击确定按钮并选择用于生成图形的变量。变量 MEASURE07的盒须图显示如下。

如同你在 MEASURE07的盒须图中看到的,与 MALE-COKE相比,FEMALE-COKE的取值的分布确实有所不同。

1.2.5组内相关分析

现在看一下各组内变量间的相关性。返回分群统计量-结果对话框,单击相关系数活页。请注意在此活页下有许多选项,可用来在显示相关系数矩阵(组内)的同时,显示各种的统计量和一些辅助信息。对于本例,将统计显著之 p-值变更为 0.001。然后单击组内相关系数与协方差按钮,并在选取分群对话框中选

择其中一组(或全部分群),生成相关系数矩阵。

在例 1中生成的相关系数矩阵中,变量 MEASURE05和 MEASURE09间的相关 (r = -.47)高度显著(p<.001)。分割表格与单因子方差分析过程可以使你通过计算被特定分组变量所分

案例集第 16 页 Basic Statistical Analysis

割的各组之内的相关,进一步探究这一显著关系。现在,在选取分群对话框中选择全部分群并单击确定按钮,生成全部四个相关系数矩阵。

如你所看到的,结果显示不同组之间的相关性特征是不同的(FEMALE/COKE的相关性很高,而其它三组低了很多)。MEASURE05和 MEASURE09间的全部相关性都不在

1. 001的水平上显著;然后,如果将结果对话框中相关系数活页下的统计显著

之 p-值更改为

2. 05,然后再次单击组内相关系数与协方差按钮,你可以发现在 0.02的水平

上, FEMALE/COKE中 MEASURE05和 MEASURE09间的相关性是显著的。请注意,你可以使用基本统计与表格分析启动面板下的差异性检验:r,百分比,平均数选项,对相关系数的差异进行检验。

1.2.6分类散点图

通过使用分群统计量 -结果对话框中相关系数活页下的分类散点图按钮,组内相关性可以通过图形显示出来。单击此按钮时,你将被提示选择用于分析的变量。在第一列变量中选择 MEASURE05,在第二列变量中选择 MEASURE09,然后单击确定按钮,生成相应的图形。

上面的分类散点图清晰的显示出了对于 FEMALE/COKE一组,MEASURE05和 MEASURE09间强烈的负相关性。

1.3频率表

1.3.1概述

本范例的数据来自于一项意见调查(虚构的)的结果。假设在你所在城市中,你拥有几个 “健身俱乐部”,每个俱乐部中都有两到三个大屏幕电视,播放着各种各样的体育赛事。由于你不可能同时播放所有电视上正在转播的体育赛事,你需要知道哪些体育项目是你的客户最感兴趣的。

你进行了一次有 100名客户(他们是在不同时间、不同俱乐部中被随机选择的 )参与的调查,让他们说出在电视上播放的不同种类体育比赛中,对哪些最有兴趣。具体来说,发给每名参与者一个包含 14项体育运动的单子,然后让他们分别对收看每种体育赛事的兴趣进行评价(共 4个选项)。这四个选项分别代表:(1)总是感兴趣(Always),(2)通常感兴趣(Usually),

(3)有时感兴趣(Sometimes),和(4)从不感兴趣(Never)。在下面变量规格编辑器中所显示的是此次调查中涉及的 14项体育运动(可以通过选择数据菜单下的全

部变量规格进入该编辑器)。

案例集第 18 页 Basic Statistical Analysis

1.3.2数据文件

调查结果被保存在范例文件 Sports.sta中。文件中的每个变量代表一项体育运动(见上图),每一列代表对单个参与者的调查结果。对于每一项运动,参与者对其感兴趣程度以 1到 4的范围被记录,并输入文本值与调查结果进行对应。通过菜单中的文件-打开范例文件打开该数据文件,它被存放在 Datasets文件夹下。

1.3.3频率表

你可以先看一下那些热门体育项目所引起的兴趣如何,如橄榄球(Football)、棒球 (Baseball)和篮球(Basketball)。从统计菜单下的选择基本统计/表格开启基本统计与表格分析启动面板;然后双击频率表,开启频率表对话框。在此对话框中,单击变量按钮并选择前三个变量(即橄榄球、棒球、篮球)。单击进阶活页,可以看到有关表格生成方式的各种选项。频率表对话框显示如下:

此对话框包含了许多选项,可以用来调整频率表的显示方式和分类情况;在另外的活页下,有多种正态性检验和用于观察正态性的图形可供使用。例如,选择程序默认的分类方法 (即所有区别值,包含文本卷标 ),单击摘要:频率

表按钮开启频率表,每个被选择的变量均生成一个频率表。

在变量橄榄球的输出结果中你可以看到,39%的参与者表示他们对于收看橄榄球赛事总是感兴趣;16%表示他们通常感兴趣。总体上,合计 81%的参与者选择了总是、经常或有时感兴趣;只有 19%表示他们从不感兴趣。

1.3.4生成直方图

请注意所有被选择变量的直方图都很容易生成,方法是返回频率表对话框,并单击直方图按钮。

现在看一下变量 2(棒球)的输出结果。

这里,你可以看到大多数的参与者(37%)对收看棒球赛事仅有时感兴趣。然而,28%的参与者仍表示他们总是感兴趣。

1.3.5图形选项

在实际应用中,通过结果对话框中可选的图形选项,以上这些分析结果都可以通过图形被展示出来。单击描述统计活页,并单击所有变量之盒须图按钮。接下来,盒须图类型对话框将被打开;选择平均数/标准误/标准差选项按钮作为盒须图类型,并单击确定按钮生成图形。

对于每一个变量的响应情况,其变异性看起来是相似的;然而,就像其较小的均值所反映的,人民对于收看橄榄球赛事的兴趣要更大一些(记住,1代表最有兴趣而 4代表最没有兴趣)。当你比较反映这三个变量情况的频率表时,也同样可以发现这一结果。

现在看一下二变量之 3D直方图。当选择二变量之 3D直方图按钮时,你将被提示选择用于此图形的变量。对于本例,将橄榄球选入第一变量表列,将棒球选入第二变量表列,并单击确定按钮(请注意,如果你在一个表列中选择了多于一个的变量,那么将会生成若干个 3D直方图,每个直方图对应一对被选择的变量 )。

通过图形观察此二变量分布,发现对于变量橄榄球和棒球的响应之间存在着相关性。的确,如果你进行一个相关分析,你将会发现两个变量的斯皮尔曼(Spearman)相关系数为.6785,这可以说明喜欢收看橄榄球的人同样喜欢收看棒球赛事。

1.3.6摘要

通过以上的分析你可以了解到,不出意外,此样本中橄榄球和棒球在所有的观赏性运动中名列前茅。下一个感兴趣的问题是找出体育运动中重叠的部分。例如,如果你的客户中有一部分是愿意收看任何橄榄球、棒球和篮球的“体育狂”,也许你只需要播放这些运动中的一项,留出其他的电视播放一些完全不同的运动项目,如网球或马拉松。然而,你首先会希望知道这些运动之间到底存在多大程度的重合,以及哪些运动将会吸引那些与喜欢收看橄榄球 (Football)的观众不同的观众们。

1.4二维表

1.4.1概述

二维表是一个同时反映多个二维表格的十分经济的方法。为了继续之前的频率表分析,需要我们了解在调查中对收看橄榄球(Football)赛事表示出最大兴

趣的参与者,是否同样会对棒球(Baseball)和篮球(Basketball)表现出最大的兴趣。就像之前所提到的,如果确实如此,那么也许在一个电视上播放这几项运动中的一项就足够了,在其他电视上播放一些完全不同的运动,你可以吸引新的和不同的客户。为了考察不同运动间的重合程度,也就是参与者对于收看橄榄球的兴趣与收看其他运动兴趣的相关程度,生成一个二维表。

1.4.2进行分析

本例中使用的数据文件为 Sports.sta。在统计菜单下选择选择基本统计/表格,开启基本统计与表格分析启动面板。然后双击交叉表开启交叉表对话框,并单击二维表格活页。

1.4.3表格的结构

二维表基本上是由一些二维表格合成在一起组成的。查看一个典型的二维表,可以最好的解释这些表格是如何被排列的。因此,在交叉表对话框中,单击制定表格 (选取变量)按钮,你将被提示为表格选择变量。

对于本例,将变量 2(Baseball)至变量 14(Wrestling)选入第一表列,作为表格的行变量,将变量 1(Football)选入第二表列,作为表格中的列变量。

单击确定按钮完成变量选择,然后单击交叉表对话框中的确定按钮,开启交叉表表格结果对话框。在此对话框中,单击快速活页下的分支表格按钮,生成分析结果表格。

1.4.4阅读表格

你可以将这个表格再次看做是不同的二维表格的组合。例如,表格的前四行显示了橄榄球与棒球二维表格中的频数。换句话说,你可以看到来自于 100个参与者的 4*4=16个单元的(联合)分布,它们是由参与者收看橄榄球的兴趣与收看棒球的兴趣的交叉表形成的。现在我们尝试用其他的方法来显示分析结果。 原始频数

如上图所示,默认情况下二维表包含原始频数。因此你可以看到 24个参与者(100个参与者中)表示既经常有兴趣收看橄榄球,又经常有兴趣收看棒球。观察最右面一列的前三行数据,你可以发现表示从没有兴趣收看橄榄球的参与者中,只有 7人(0+1+6)表示对于收看棒球有兴趣:总是(0人)、经常(1人)及有时(2人)。因此,看起来橄榄球和棒球这两项运动在很大程度上所吸引的是同一类人。 百分比

现在返回交叉表表格结果对话框。此对话框包含的选项可以让你通过列百分比、行百分比或总百分比来显示表格中的数据。你也可以选择将期望次数和/或残差次数包含到二维表中。现在,单击选项活页,选中行百分比选框,并再次单击快速活页下的分支表格按钮。

当你选中行百分比选框时,位于进阶活页下的于个别表格中显示对应之百分比选框变为可选状态。由于一个表中可以包含的信息太多,选中该选框可以将来自原始频数的行百分比信息显示在一个单独的表格中。现在,看一下上表中的第一行。你可以发现在那些对于收看棒球总是有兴趣的参与者中(所有参与者均在第一行),85.71%的人表示他们同样对于收看橄榄球总感兴趣。 寻找一项与橄榄球不相关的运动

现在,看一下总百分比,以找到一项与橄榄球不相关的运动。返回交叉表表格结果对话框并选中选项活页下的占全部计数之百分比选框(为简单起见,取消对行百分比选框的选中)。再一次,单击快速活页下的分支表格按钮,生成分

析表格。

滚动表格直至看到有关体操的计数情况(如上图)。现在表格中显示的数据是总百分比。因此有 14%的参与者表示在对于橄榄球总是感兴趣的同时对于体操也总是感兴趣。仅 7%的参与者表示他们对于橄榄球和体操都从不感兴

趣。与此同时,12%(2+2+8)的参与者表示他们对橄榄球从不感兴趣,但对于体操总是(占 2%)、经常(占 2%)或有时(占 8%)感兴趣。因

案例集第 26 页 Basic Statistical Analysis

此,在橄榄球、棒球和篮球以外,体操(Gymnastic)看起来是个不错的节目替代方案(用于你的俱乐部中第二大的电视屏幕),它可以至少招揽来一些完全不同的顾客。

1.4.5统计量

一些通常用于表示两个分类型变量间的独立性和关系的统计量,在交叉表表格结果对话框中也被列了出来,请见选项活页下的二维表格统计量选框。最常用的表示两个分类型变量间的独立性的统计量是卡方检验;因此,选中 Pearson卡方与最大概似卡方选框。

Spearman R作为对于相关性的度量,与 Pearson r相似。这一度量假定变量的取值至少包含了关于排名顺序的信息。在本例中,一个表示总是对收看橄榄球感兴趣的参与者的对该运动的喜爱程度很可能大于一个仅表示经常感兴

趣的参与者,因此这一假定是成立的。因而同样选中 Spearman排序等级相关系数选框。

1.4.6选择一个表格

现在对于统计量的选择已经完成,单击进阶活页下的详细二维表格按钮,以选择用于分析的表格。请选取您欲查看之表格对话框将被打开,所有可能的二维表格均在此被列出。

你可以在列表中选择想要查看的表格,也可以使用所有表格选项生成全部的二维表格。对于本例,选择 Baseball Football,并单击对话框中的确定按钮。程序将生成两张表格。第一张表格包含了观察(原始)频数,和交叉表表格结果 -快速活页下选中的其他表格内容相同 (如:占全部计数之百分比);第二张表格包含了卡方检验和 Spearman相关分析的结果。

此二维表格的 Pearson卡方为 72.95,说明它在统计意义上是显著的;Spearman Rank R相关系数为 0.6785,它反映出在此样本中人们对于橄榄球 (Football)和棒球(Baseball)的兴趣间存在着很大的相关性。请注意,除了以前提到的这些方法以外,你还可以通过图形查看此二维表的结果,方法是在交叉表表格结果对话框的进阶活页下,单击特定次数之交互作用图。当单击该按钮时,请选取您欲查看之表格对话框再次出现。选择 Baseball Football表并单击确定按钮,生成交互作用图。

你也可以使用交叉表表格结果对话框中进阶活页下的分类直方图按钮,

或 3D直方图按钮,

以通过图形查看所选二维表格中的频数。

本文来源:https://www.bwwdw.com/article/vpkw.html

Top