SPSS软件讲座1
更新时间:2024-06-09 09:05:01 阅读量: 综合文库 文档下载
- SPSs软件推荐度:
- 相关推荐
SPSS软件讲座
第一章、基本了解,引入
例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同?
患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
让我们把要做的事情理理顺:首先要做的肯定是打开计算机,在进入SPSS后,具体工作流程如下:
1. 将数据输入SPSS,并存盘以防断电。
2. 进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。 3. 按题目要求进行统计分析。 4. 保存和导出分析结果。 下面就按这几步依次讲解: §1.1 数据的输入和保存 1.1.2 定义变量
需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。
第一列的名称“group” 第二列变量名改为X 1.1.3 输入数据 1.1.4 保存数据 §1.2 数据的预分析 1.2.1 数据的简单描述
需要知道数据的基本情况,如均数、标准差等。选择Analyze==>Descriptive Statistics==>Descriptives菜单,系统弹出描述对话框如下:
只需要描述X,用鼠标选中X,单击中间的单击OK按钮
系统会弹出一个新的界面如下所示:
,变量X的标签就会移入右侧,
该窗口上方的名称为SPSS for Windows Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。
看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data==>Split File菜单,系统弹出文件分割对话框如下:
选择单选按钮Organize output by groups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。
1.2.2 绘制直方图
选择Graphs==>Histogram,系统会弹出绘制直方图对话框如下:
将变量X选入Variable选择框内,单击OK按钮。
取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”,单击OK按钮就可以了。 §1.3 按题目要求进行统计分析
用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>Compare Means==>Independent-Samples T test,系统弹出两样本t检验对话框如下:
将变量X选入test框内,变量group选入grouping框内,注意这时下面的Define Groups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:
该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等,然后是t检验的结果如下:
Independent Samples Test 该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。 §1.4 保存和导出分析结果 1.4.1 保存结果文件 1.4.2 导出分析结果
写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?没关系,SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==>Export,系统会弹出Exprot Output对话框如下:
最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的Exprot File对话框则填入输出的目标文件名;左下方的Export What单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。
第二章:SPSS统计绘图功能
§5.1 常用统计图
统计绘图功能均放置在graph菜单中.
? 我们最为常用的普通统计图,具体来说有:
条图 直方图 箱式图
质量控制图 高低图 频谱图
散点图 饼图
正态Q-Q图 Pareto图
交互相关图
误差线图
线图 面积图
正态P-P图
自回归曲线图 序列图
其中后面几种图形用于时间序列分析 5.1.1 操作界面介绍(条图) 5.1.1.1 条图的通用界面
例5.1:选择graphs==>bar后,系统首先会弹出一个简单的导航对话框如下所示:
绘制简单条图(单式条图) 绘制复式条图
绘制堆积条图(分段条图) 定义统计图中数据的表达类型:
条图反映了同一变量若干条记录的分组汇总 条图反映了不同变量的汇总 条图反映了个体观察值
5.1.1.2 复式条图与分段条图的界面
?
5.1.2 其他常用统计图 5.1.2.1 散点图 5.1.2.2 线图 5.1.2.3 饼图 5.1.2.4 面积图 5.1.2.5 直方图 5.1.2.6 其他
P-P图和Q-Q图都是用来观察变量是否服从正态分布的;质量控制图则用来观察个体值是否有超过正常值范围的情况出现;箱式图的作用和它类似,只是换了一种表达方式;其余的几种图几乎都是用与时间序列模型的。
第三章 均数间的比较 --Compare Means菜单
在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之,另外80%的复杂指令只完成20%的不常用任务。
好了,言归正传。现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用中同样有效!仅以Analyze菜单为例,其中最常用的子菜单为:
? Discriptive Statistics ? Compare Means
? General Linear Model(第一项) ? Correlate
? Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用SPSS解决80%的统计学难题。 §7.1 Means过程
Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果。 7.1.1 界面说明
【Dependent List框】
用于选入需要分析的变量。 【Independent List框】 用于选入分组变量。 【Options钮】
弹出Options对话框,选择需要计算的描述统计量和统计分析:
o Statistics框 可选的描述统计量。它们是: 1. sum,number of cases 总和,记录数
2. mean, geometric mean, harmonic mean 均数,几何均数,修正均数
3. standard deviation,variance,standard error of the mean 标准差,均数的标准误, 方
差
4. median, grouped median 中位数,频数表资料中位数(比如30岁组有5人,40岁组
有6人,则在计算grouped median时均按组中值35和45进行计算)。 5. minimum,maximum,range 最小值,最大值,全距
6. kurtosis, standard error of kurtosis 峰度系数,峰度系数的标准误 7. skewness, standard error of skewness 偏度系数,偏度系数的标准误
8. percentage of total sum, percentage of total N 总和的百分比,样本例数的百分比 o Cell Statistics框 选入的描述统计量。 o Statistics for First layer复选框组
1. Anova table and eta 对分组变量进行单因素方差分析,并计算用于度量变量相关程度
的eta值。
2. Test for linearity 检验线性相关性,实际上就是上面的单因素方差分析。 7.1.2 结果解释
以第一章的数据为例,输出如下: Means
上表还是缺失值报告。
常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。
上表为单因素方差分析表。在选择了Anova table and eta或Test for linearity复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将在单因素方差分析一节中解释。
相关性度量指标,给出Eta值以及Eta值的平方根。 §7.2 One-Samples T Test过程
One-Samples T Test过程用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,该对话框的界面非常简单。
One-Samples T Test过程的输出也是比较简单的,由描述统计表和t检验表组成,比如要检验数据li1_1.sav中血磷值的总体均数是否等于1,则输出如下: T-Test
所分析变量的基本情况描述,有样本量、均数、标准差和标准误。
上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。由上表可知:t=2.975,P=0.007。因此可以认为血磷值的总体均数不等于1。 §7.3 Independent-Samples T Test过程
Independent-Samples T Test过程用于进行两样本均数的比较。 7.3.1 界面说明 【Test Variables框】
用于选入需要分析的变量。 【Grouping Variable框】
用于选入分组变量。注意选入变量后还要定义需比较的组别。 【Define Groups框】
用于定义需要相互比较的两组的分组变量值。
可以这样来理解:如果分组变量有3个取值(即有三组),而我们做t检验是比较其中的某两组,这时就可以用Define Groups框来指定需比较的两组。当然,如果分组变量只有2个取值时,我们仍然要再该框中进行定义,这也算是SPSS对话框存在的一个小缺陷吧。 【Options钮】
和One-Samples T Test对话框的Options钮完全相同,此处不再重复。 7.3.2 结果解释
比如要检验数据li1_1.sav中克山病患者与健康人的血磷值是否相同,用Independent-Samples
T Test过程的结果输出如下: T-Test
两组需检验变量的基本情况描述。
可见该结果分为两大部分:
第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,P = 0.860,可见在本例中方差是齐的;
第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,P=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。 §7.4 Paired-Samples T Test过程
该过程用于进行配对设计的差值均数与总体均数0比较的t检验,他的功能实际上是和One-Samples T Test过程相重复的(等价于已知总体均数为0的情况),但Paired-Samples T Test过程使用的数据输入格式和前者不同,即我们所称的统计表格格式,因此仍然有存在的价值。
7.4.1 界面说明
整个界面上只有一个Paired Variable框需要介绍,他用于选入希望进行比较的一对或几对变量--注意这里的量词是对而不是个。选入变量需要成对成对的选入,即按住Ctrl键,选中两个成对变量,再单击
将其选入。如果只选中一个变量,则
按钮为灰色,不可
用。
7.4.2 分析实例
例7.1 某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别?
大白鼠对号 正常饲料组 维生素E缺乏 1 2 3
3550 2000 3000
2450 2400 1800
4 5 6 7 8
3950 3800 3750 3450 3050
3200 3250 2700 2500 1750
解:为了说明问题,此处假设输入数据时就按照上表格式输入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为G2。操作如下:
1. 同时选中G1、G2:选入Paired Variables框 2. 单击OK钮 7.4.3 结果解释
以例7.1为例,其输出结果如下: T-Test
配对变量各自的统计描述,此处只有1对,故只有Pair 1。
此处进行配对变量间的相关性分析。等价于Analyze==>Correlate==>Bivariate。
配对t检验表,给出最终的检验结果,由上表可见P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。 上表的标题内容翻译如下: §7.5 One-Way ANOVA过程
One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析。 7.5.1 界面说明
【Dependent List框】
选入需要分析的变量,可选入多个结果变量(应变量)。 【Factor框】
选入需要比较的分组因素,只能选入一个。 【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。
o Polynomial复选框 定义是否在方差分析中进行趋势检验。
o Degree下拉列表 和Polynomial复选框配合使用,可选则从线性趋势一直到最高五
次方曲线来进行检验。
o Coefficients框 定义精确两两比较的选项。这里按照分组变量升序给每组一个系数
值,注意最终所有系数值相加应为0。如果不为0仍可检验,只不过结果是错的。比如说在下面的例7.2中要对第一、三组进行单独比较,则在这里给三组分配系数为1、0、-1,就会在结果中给出相应的检验内容。
【Post Hoc钮】
弹出Post Hoc Multiple Comparisons对话框,用于选择进行各组间两两比较的方法,有:
o Equar Variances Assumed复选框组 一组当各组方差齐时可用的两两比较方法,共有
14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
o Equar Variances Not Assumed复选框组 一组当各组方差不齐时可用的两两比较方
法,共有4种,其中以Dunnetts's C法较常用。
o Significance Level框 定义两两比较时的显著性水平,默认为0.05。 【Options钮】
弹出Options对话框,用于定义相关的选项,有:
o Statistics复选框组 选择一些附加的统计分析项目,有统计描述(Descriptive)和方
差齐性检验(Homogeneity-of-variance)。
o Means plot复选框 用各组均数做图,以直观的了解它们的差异。
o Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的
变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。
7.5.2 分析实例
例7.2 某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?
石棉肺患者 可疑患者 非患者 1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0
2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4
2.9 3.2 2.7 2.8 2.7 3.0 3.4 3.0 3.4 3.3 3.5
解:设数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为X。此处先进行单因素方差分析,然后进行两两比较,这里选择S-N-K法进行两两比较。操作如下:
o Dependent List框:选入X o Factor框:选入group
o Post Hoc钮:选中S-N-K复选框:单击Continue钮 o 单击OK钮
7.5.3 结果解释
上题的输出结果如下: Oneway
上面实际上是一个典型的方差分析表。给出了单因素方差分析的结果,可见F=84.544,P<0.001。因此可认为三组矿工用力肺活量不同。上表的标题内容翻译如下: Post Hoc Tests
Homogeneous Subsets
上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,石棉肺患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1.000(自己和自己比较,当然绝对不会有差异了)。
第四章:征服一般线性模型
――General Linear Model菜单详解(上)
§8.1 两因素方差分析
例8.1 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?
区组号 A营养素 B营养素 C营养素
1 2 3 4 5 6 7 8
50.10 47.80 53.10 63.50 71.20 41.40 61.90 42.20
58.20 48.50 53.80 64.20 68.40 45.70 53.00 39.80
64.50 62.40 58.60 72.50 79.30 38.40 51.20 46.20
根据统计分析的要求,我们建立了三个变量来包括上述信息,即group表示区组,food代表使用的营养素,weight表示最终的重量,即:
group food weight 1 1
1 2
50.01 58.20
依此类推。
8.1.1 univarate对话框界面说明
这里只有一个结果变量weight,要采用univarate对话框,如下所示:
在上面的这些框框钮钮中,最常用的有:Dependent Variable框、Fixed Factors框、Model钮、Post Hoc钮,下面我们来一一解释。 【Dependent Variable框】
选入需要分析的变量(应变量),只能选入一个。这里我们的应变量为weight,将他选入即可。
【Fixed Factors框】
即固定因素,说的通俗一些,就是--哎呀,我都不知道怎么解释好了,这样,如果你搞不明白,那么绝大多数要分析的因素都应该往里面选。这里我们要分析的是group和food两个变量,把他们全都给我抓进去!
固定因素指的是在样本中它所有可能的取值都出现了,比如例中的food,只可能有1、2、3这三个值,并且都出现了,就被称作固定效应;而相对应的随机效应的因素指的是所有可能
的取值在样本中没有都出现,或不可能都出现,如本例中的group,实际上总体中当然不可能只有这8窝,因此要用样本中group的情况来推论总体中group未出现的那些取值的情况时就会存在误差,因此被称为随机因素。我这里让group也选入固定框是基于下面的事实:这样做统计分析的结论是完全相同的。不同的只是推论的那部分。 【Random Factors框】
用于选入随机因素,如果你弄不明白,假装没看见他就是了。 【Covariate框】
用于选入协方差分析时的协变量,现在还用不到,不过下一个例子我们就要给他送礼了。 【WLS Weight框】
即用于选入最小二乘法权重系数。别理他,根据我的理解,只有统计分析的变态狂才会想起来用他! 【Model钮】
单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Full factorial,即分析所有的主效应和交互作用。我们这里没有交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的custum,这时中部的Build Term下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。这里我们只能分析主效应:选择main,再用黑色箭头将group和food选入右侧的model框中,如果对这段叙述不太清楚,请参考下面的动画。
该对话框中还有两个元素:左下方的Sum of squares框用于选择方差分析模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可。 【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少,反正我都没用过,就干脆就不介绍了。
【Plots钮】
用于指定用模型的某些参数作图,比如用food和group来作图,用的也比较少(指国内,因为它主要是用来做模型诊断用的)。 【Post Hoc钮】
该按钮弹出的两两比较对话框和第7章单因素方差分析中的一模一样,不再重复。本题对food作两两比较,方法为SNK法。 【Save钮】
将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保存的东东有预测值、残差、诊断用指标等。 【Options钮】
当然是定义选项啦!可以定义输出哪些指标的估计均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。
好了,都解释完了,再重复以下,我们所作的操作为:
1. Analyze==>General Lineal model==>Univariate 2. Dependent Variable框:选入weight 3. Fixed Factors框:选入group和food 4. Model钮:单击
5. Custom单选钮:选中
6. Model框:选入group和food 7. 单击OK
8. Post Hoc钮:单击
9. Post Hoc test for框:选入food 10. SNK复选框:选中 11. 单击OK 12. 单击OK 8.1.2 结果解释
按照上题的操作,结果输出如下: Univariate Analysis of Variance
这是一个所分析因素的取值情况列表,没有什么不好懂的。
现在大家看到的是一个典型的方差分析表,只不过是两因素的而已,
解释一下:首先是所用方差分析模型的检验,F值为00.517,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量GROUP,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的FOOD,非常遗憾,它的P值为0.084,还没有统计学意义。尽管不太愿意,我们的结论也只能是:尚不能认为三种营养素喂养的小白鼠体重增量有差别。 Post Hoc Tests FOOD
Homogeneous Subsets
现在是两两比较的结果,方法为SNK法,由于前面总的比较无差异,所以这里三种食物均在一个亚组内,检验无差异,P值为0.121。
前面方差分析FOOD的P值不是0.084吗?这里又是0.121,究竟哪个为准?两两比较只是近似的比较结果,应以前面方差分析的P为准,不过这两个P值不会在检验结果上发生质的冲突,一般只是大小不同而已。
好了,上面是正确的结果,如果model选择是采用Full factor又如何呢?会得出方差分析表
如下:
看到了吗?由于所谓的交互作用将自由度给全部“吃”掉了,没有误差可用于统计分析,什么结果也做不出来。 §8.2 协方差分析
例8.2 某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量与年龄有关,资料见下表。
正常组 48 33 51 43 44 63 49 42 40 47 41 41 56
3.5 4.6 5.8 5.8 4.9 8.7 3.6 5.5 4.9 5.1 4.1 4.6 5.1
超重组 58 41 71 76 49 33 54 65 39 52 45 58 67
7.3 4.7 8.4 8.8 5.1 4.9 6.7 6.4 6.0 7.5 6.4 6.8 9.2
年龄(X1) 胆固醇(Y1) 年龄(X2) 胆固醇(Y2)
这里建立三个变量:GROUP表示组别,AGE代表年龄,CHOL则表示胆固醇。 8.2.1 分析步骤
由于协方差分析涉及到许多较深的统计理论,这里我只好采用照本宣科的方法,告诉大家如何作,而不作过多解释。
首先应进行预分析,了解资料是否符合协方差分析的要求,最重要的一点就是看age的影响在两组中是否相同,这可以用age与group是否存在交互作用来表示。对该问题,粗糙的方
法可以是作分组散点图,差不多就可以,也可以进行预分析,看交互作用有无统计学意义,这里用后一种方法中最为精确的步骤来讲解。 预分析步骤:
1. Analyze==>General Lineal model==>Univariate 2. Dependent Variable框:选入chol 3. Fixed Factors框:选入group 4. Model钮:单击
5. Custom单选钮:选中
6. Model框:选入group、age和group*age(后者用interaction方法就可选入) 7. Sum of squares列表框:改为Model I 8. 单击OK 9. 单击OK
该步骤用于判断group和age间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续。注意这里选择了Model I,从而拟合结果和模型中变量的引入顺序有关,即侧重点在group对chol的影响大小和交互作用上。 8.2.2 结果解释
预分析步骤的结果如下:
Univariate Analysis of Variance
上表显示交互作用无统计学意义,而且P值非常大,因此交换group和age多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。 正式分析步骤:
1. Analyze==>General Lineal model==>Univariate 2. Dependent Variable框:选入chol
3. Fixed Factors框:选入group 4. Model钮:单击
5. Custom单选钮:选中
6. Model框:选入group、age
7. Sum of squares列表框:改为Model III 8. 单击OK
9. Options钮:单击
10. Displsy means for框:选入group
11. Compare mean effects复选框:选中(下面的区间调整方法就用LSD(none)即可) 12. 单击OK 13. 单击OK
Univariate Analysis of Variance
这是正式的统计分析结果,显示group和age都对胆固醇含量有影响,P值分别为0.038和小于0.001。
Estimated Marginal Means
这是两组的修正均数及相应的可信区间,显然超重组的胆固醇均值较高。下方的提示表明该
修正均数是按年龄为50.2308岁的情形计算的。
第五章:征服一般线性模型
――General Linear Model菜单详解(下)
§8.4 多元方差分析 所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。 8.4.1 分析步骤
为了方便起见,我们这里直接利用SPSS自带的数据集plastic.sav,假设tear_res、gloss和opacity都使反应橡胶质量的指标(不要笑,是假设),现在要研究extrusn和additive对橡胶的质量影响如何,则应采用多元方差分析。
选择Analyze==>General Linear Model==>Multivariate,则弹出Multivariate对话框,请注意,除了没有random effect外,它的所有元素都是和univariate对话框相同的,里面的内容也相同,因此我们这里就不再重复了。
按照我们的分析要求,对话框操作步骤如下:
1. Analyze==>General Lineal model==>Multivariate
2. Dependent Variable框:选入tear_res、gloss和opacity 3. Fixed Factors框:选入extrusn和additive 4. 单击OK
此处两个自变量均是二分类变量,故无需选择两两比较方法。 8.4.2 结果解释
按上面的选择,分析结果如下: General Linear Model
这是引入模型的自变量的取值情况列表。
上表是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多元检验方法。一般他们的结果都是相同的,如果不同,一般以Hotelling's Trace方法的结果为准。可见在所用的模型中,extrusn和additive对结果变量是有统计学意义的,但交互作用无统计学意义。
上表实际上是四个一元方差分析表的合并,即分别考虑四个应变量时的方差分析结果。上面
的多元方差分析已经得知两自变量对应变量有影响,从现在的分析表就可以更清楚的知道是对那些自变量影响较大。对照可知,extrusn和additive对tear resistance和gloss都有较大影响,而他们的交互作用对gloss有影响,他们(及交互作用)对Opacity都没有影响。 §8.5 重复测量的方差分析
重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 8.5.1 Repeated measures对话框界面说明
实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?我们通过下面的例子来看看:
例8.3 在数据集anxity2.sav中判断:anxiety和tension对实验结果(即trial1~trial4)有无影响;四次试验间有无差异;试验次数和两个变量有无交互作用。
anxity2.sav和anxity.sav实际上是同一个数据,但根据不同的分析目的采用了不同的数据排列方式。如果采用anxity.sav进行分析,我们可以分析四次试验间有无差异的问题,但对另两个问题就无能为力了,因为用普通的方差分析模型,anxity和tension的影响被合并到了subject中,根本就无法分解出来进行分析,这时,我们就只能求助于重复测量的方差分析模型。
在菜单中选择Analyze==>General Lineal model==>Repeated measures,系统首先会弹出一个重复测量因子定义对话框如下:
因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量中,所以我们这里要自行定义应变量。默认的名称为factor1,我们将其改为trail,下面的因素等级数填入4(因一共测量了四次)。单击Add钮,则该变量被加入,我们就完成了模型设置的第一步:应变量名称和测量次数定义。单击define,我们开始进行下一个步骤:具体重复测量变量定义及模型设置,对话框如下:
这个对话框和我们以前看到的方差分析对话框不太一样:它没有应变量框,而是改为了组内效应框,实际上是一回事,上面我们定义了trial有四次测量,此处就给出了四个空让你填入相应代表四次测量的变量,选中trial1~trial4,将其选入;然后要选择自变量了(这里又将其称为了between subjects factor),将剩下的三个都选入即可。最后,根据题意,不需要检验anxity与tension的交互作用对试验次数有无交互作用,所以要在model中作相应设置,把那个东东拉出来。 详细的操作步骤如下:
1. Analyze==>General Lineal model==>Repeated measures 2. Within-subject factor name框:键选入trial 3. number of levels框:键入4 4. 单击ADD钮 5. 单击DEFINE钮
6. Within-subject variables (trial)框:选入trial1~trial4
7. between subjects factor框:选入subject、anxity和tension 8. 单击MODEL钮
9. Custom单选钮:选中
10. Within-subject Model框:选入trial
11. between subjects Model框:选入anxity和tension 12. 单击CONTINUE
13. 单击OK
请注意,这里没有选入变量subject,因为它实际上在这里成为了一个记录ID,要是将它选入,则什么都检验不了了。 8.5.2 结果解释
本题的分析结果如下: General Linear Model
上表给出了所定义的4次测量的变量名,在模型中它们都代表一个应变量trial,只是测量的次数不同而已。
这是引入模型的其它自变量的情况列表。
上表是针对所检验的结果变量trial,以及他和另两个引入模型的自变量间的交互作用是否存在统计学意义,采用的是四种多元检验方法。一般他们的结果都是相同的,如果不同,我一般以Hotelling's Trace方法的结果为准。可见在所用的模型中,trial的四次测量间的确是存在着统计学差异的,但它和另两个变量间的交互作用无统计学意义。
上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从一种叫做球形分布的东东。上面可能有些内容不好懂,不过没关系,只要看到近似卡方为9.383,自由度为5,P值为0.097就可以了。因此trial是勉强服从球形分布的,可以进行重复测量的方差分析。
上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布假设成立时的结果,就是我们所要看的。如果该假设不成立,则根据不同的情况可能看下面三种检验结果之一,或放弃该检验方法。
上表是非常重要的一部分:各次重复测量间变化趋势的模型分析,这里要求检验没有统计学
意义,否则说明变化趋势不服从该曲线。以trial为例,对Linear的检验P值小于千分之一,Quadratic的P值略大于0.05。只有Cubic的P值在0.5附近,因此最佳的拟合曲线应为Cubic(三次方曲线);但由于一共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上的知识,最终的拟和曲线应为Quadratic(二次方曲线)。
上表为最后一张,为组间效应的方差分析结果,可见anxiety和tension均无统计学意义。 最后,为了再确认一下几次测量间的变化趋势,我们另外用plots子菜单作出模型估计的四次测量均数值如下图:
可见四次测量均数实际上还是近似于直线趋势的,因此前面的模型应为线性最佳。
正在阅读:
SPSS软件讲座106-09
致远公司(2010)01-23
(语文S版)四年级语文上册:总复习题(14页,Word版)06-19
《连云港市发展和改革委员会主要职责内设机构和人员编制规定》09-24
实验2 函数的定义与使用10-22
士别三日(典故、出处、释读)06-08
超好用的美容小秘方11-06
检索作业03-06
长丰猎豹汽车空调系统的结构与检修09-04
胸腺素发酵工厂设计07-20
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 讲座
- 软件
- SPSS
- 酒厂记录控制程序
- TEFTCF考试比较与分析
- 液压与气动系统及维护习题答案
- 离散数学作业
- 高中通用技术粤教版《高中必修:技术与设计1》《第四章 设计的实
- 党课心得1
- 六上科学实验操作培训
- 中国梦,我的梦
- 八年级语文《石壕吏》
- 基于PLC升降横移式立体车库控制系统设计
- 2018最新作文我的梦想小学生-范文word版(3页)
- 辩论赛仰望星空与脚踏实地 理想比现实更重要一辩辩词
- 水污染控制工程各章习题
- 2018年3月17日宁夏回族自治区青铜峡市纪委监察委遴选公务员笔试
- 组织设计 - 图文
- 管理会计学模拟试题及答案
- SDH原理3
- 如何写好记事文的开头
- 2011年证券从业资格考试证券市场基础知识考前预测试题和答案解析
- 人教版五年级数学上册《第三单元过关检测卷》(附答案)