SAS方差分析(理论+程序实例)

更新时间:2024-05-03 16:24:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二十五课 方差分析

当影响观察结果的影响因素(原因变量或分组变量)的水平数大于2或原因变量的个数大于1个,一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。

一、 方差分析概述

方差分析(analysis of variance)又称变异数分析,可简记为ANOVA,主要用于检验计量资料中的两个或两个以上均值间差别显著性的方法。当欲比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方MS(mean square)。 1. 方差分析的基本思想

根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出各部分的均方,然后列出方差分析表算出F值,作出统计推断。

方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。方差分析表的一般形式见表25.1所示:

表25.1 方差分析表形式

变异来源 source 效应S1 效应S2 ?? 效应Sm 误差Se 总变异ST 离差平方和 SS SS1 SS2 ?? SSm SSe + SSm+ SSe 自由度 df df1 df2 ?? dfm dfe + dfm + dfe 均方 MS MS1= SS1/df1 MS2= SS2/df2 ?? MSm= SSm/dfm MSe= SSe/dfe MST= SST/dfT F统计量 F F1(df1, dfe)= MS1/ MSe F2(df2, dfe)= MS2/ MSe ?? Fm(dfm, dfe)= MSm/ MSe FT(dfT, dfe)= MST/ MSe P概率值 P P1 P2 Pm PT SST= SS1+ SS2+?dfT=df1+ df2+?

表中变异来源一栏,可分为总变异(total),误差(residual),各个效应(effect)相对应的项。效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。

当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为?情况下,由F(f1,f2)临界值表查得单侧F?界限值。当F?F?时,则P??,不拒绝原假设H0,说明不拒绝这个效应项的效应为0的原假设,也即这个效应项是可能对总变异没有实质影响的;如果F?F?,则

上海财经大学经济信息管理系IS/SHUFE

Page 1 of 30

P??,拒绝原假设H0,说明拒绝这个效应项的效应为0的原假设,也即这个效应项是很

可能对总变异有实质影响的。

2. 方差分析的试验设计

为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。在试验设计阶段常需要作主要四个方面的考虑: 1) 研究的主要变量

方差分析的主要变量,也称响应变量或因变量(dependent variable),它是我们试验所要观察的主要指标。一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进行分析。

2) 因素和水平

试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平(level)。在每一个因素下面可以分成若干水平。例如,某工厂的原料来自四个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,四个地区便是地区这一因素的四个水平。当某个主要因素的各个水平间的主要因变量的均值呈现统计显著性时,必要时可作两两水平间的比较,称为均值间的两两比较。 3) 因素间的交互影响

多因素的试验设计,有时需要分析因素间的交互影响(interaction),2个因素间的交互影响称为一级交互影响,例如因素A与因素B的一级交互影响可记为A×B,3个因素间的交互影响称为二级交互影响,例如因素A与因素B与因素C的二级交互影响可记为A×B×C。当交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断。

二、 单因素方差分析

单因素方差分析(one factor ANOVA 或one-way ANOVA)或称为完全随机设计的方差分析(completely random design ANOVA)。试验设计时按受试对象的抽取或分组的随机程度不同可细分为以下两类:

? 完全随机设计——从符合条件的总体中完全随机地抽取所需数目的受试对象,再

将全部受试对象完全随机地分配到k组中去。此时,受试对象与试验因素间无直接联系。

? 组内完全随机设计——按试验因素的k个水平将全部受试对象划分成k个子总体,

再分别从k个子总体中完全随机地抽取所需数目的受试对象。此时,试验因素的各水平决定了受试对象各自应该归属的组别。

设因素A有k个水平A1,A2,?,Ak,在每一个水平下考察的指标可以看成一个总体,现有k个水平,故有k个总体,并假定:

① 每一总体均服从正态分布; ② 每一总体的方差相同;

③ 从每一总体中抽取的样本相互独立。

我们要比较各个总体的均值是否一致,就是要检验各总体的均值是否相同,设第i个总体的均值为?i,那么就是要检验如下原假设:

上海财经大学经济信息管理系IS/SHUFE

Page 2 of 30

H0:?1??2????k

其备选假设为:

H1:?1,?2,?,?k不全相同。

设从第i个总体获得容量为ni的样本观察值为yi1,yi2,?,yini,i?1,2,?,k,各样本间还是相互独立的。样本观察值yij可看成是来自均值为?i的总体,这样yij就是其均值?i与随机误差?ij迭加而产生的。上面我们已经假定在Ai水平下的yij服从N(?i,?2)分布,则有

?ij~N(0,?2)。因此,我们有单因素方差分析的统计模型:

j?1,2,?,ni??yij??i??ij,i?1,2,?,k, ?2??各?ij相互独立,且都服从N(0,?)(25.1)

为了能更仔细地描述数据,常在方差分析模型中引人一般平均与效应的概念。称各个?i的加权平均

1k???ni?i

ni?1为总平均,其中n?(25.2)

?ni?1ki。称

ai??i??,i?1,2,?,k

(25.3)

为因素A在第i水平的主效应,也简称为Ai的效应,同时也表明第i个总体的均值是一般平均与其效应的迭加。容易看出效应间有如下关系式:

?naii?1ki?0

(25.4)

此时,单因素方差分析的统计模型可改写成包含效应的形式:

?yij???ai??ij,i?1,2,?,k,?k???niai?0?i?1?各?相互独立,且都服从N(0,?2)?ij所要检验的原假设也可改写成:

j?1,2,?,ni

(25.5)

H0:a1?a2???ak?0

现在,我们知道造成各yij间差异的原因可能有两个:一个可能是假设H0不真,即各水

上海财经大学经济信息管理系IS/SHUFE

Page 3 of 30

平下总体均值?i(或水平效应ai)不同,因此从各总体中获得的样本观察值也就有差异了;另一可能是H0为真,差异是由于随机误差引起的。为了进一步定量分析这些差异,我们需要把这些差异表达出来。由(25.1)可推导出:

yi???i??i?

其中yi??(25.6)

?yj?1niij/ni,?i????ij/ni。即组内样本观察值的平均值等于组内总体均值加上

j?1ni组内随机误差的平均值。还可由(25.5)推导出:

y???? 其中y?(25.7)

??yi?1j?1kniij/n,?????ij。即所有样本观察值的平均值等于总平均(各组均值的

i?1j?1kni加权平均)加上所有随机误差的平均值。这样,每一个观察值yij与总平均y的偏差可以分解成两部分:

yij?y?(yij?yi?)?(yi??y)

其中yij?yi?称为组内偏差,由(25.1)和(25.6)代入得到:

(25.8)

yij?yi??(?i??ij)?(?i??i?)??ij??i?

(3.2.9)

说明组内偏差仅仅反映了随机误差。而yi??y称为组间偏差,由(25.6)、(25.7)和(25.3)代入得到:

yi??y?(?i??i?)?(???)?ai??i???

说明第i组间偏差除了反映随机误差外还反映了第i个水平的效应ai。

各yij间总的差异大小可用总偏差平方和ST表示:

(25.9)

ST???(yij?y)2

i?1j?1kni(25.10)

由(25.9)随机误差引起的数据间的差异可以用组内偏差平方和表示,也称误差偏差平方和Se:

Se???(yij?yi?)2

i?1j?1kni(25.11)

由于组间偏差除了随机误差外,还反映了效应的差异,故由于效应不同引起的数据差异可以用组间偏差平方和表示,也称因素A的偏差平方和SA:

上海财经大学经济信息管理系IS/SHUFE

Page 4 of 30

SA??ni(yi??y)2

i?1k(25.12)

将表示总差异的平方和进行分解:

ST???(yij?y)???(yij?yi??yi??y)22i?1j?1knii?1j?1kknikni???(yij?yi?)???(yi??y)?2??(yij?yi?)(yi??y)22i?1j?1knii?1j?1ki?1j?1nikni (25.13)

???(yij?yi?)??ni(yi??y)22i?1j?1i?1?Se?SA其中

?(yj?1niij?yi?)?0。证明了:总的差异=组内差异+组间差异。由于

11?2?(yj?1niij?yi?)?2?2?(?j?1niij??i?)2~?2(ni?1)

(25.14)

又由?2分布的可加性可知

?1????2i?1??2Sekk?2(yij?yi?)??~?(?(ni?1))??2(n?k) ?j?1i?1?ni2(25.15)

还可证明,在H0为真时,即各组效应ai都为0

SA?因此可采用统计量

2~?2(k?1)

(25.16)

F?来假设检验。

SA/(k?1)~F(k?1,n?k)

Se/(n?k)(25.17)

三、 多重比较

当k组均值比较,如果经过F检验拒绝原假设,表明因素A是显著的,即k个水平对应的指标均值不全相等,但不一定两两之间都有差异。在一些实际问题中,当方差分析的结论是因素A显著时,还需要我们进一步去确认哪些水平间是确有差异的,哪些水平间无显著差异。同时比较任意两个水平均值间有无显著性差异的问题称为多重比较,即要以显著性水平

?,同时检验以下Ck2个假设:

上海财经大学经济信息管理系IS/SHUFE

Page 5 of 30

③ 嵌套模型

Model y=a b c(a b);

④ 包含嵌套、交叉和主效应的模型 Model y=a b(a) c(a) b*c(a); Model语句的选项列表有:

int——打印与截距有关的假设检验结果。anova过程总是把截距作为模型的一个效应进行处理,缺省时,不打印结果。

? nouni——不打印单变量分析结果。 4) means 语句。

该语句是用来计算在means语句后列出的每个效应所对应的因变量均值。Anova过程可以对出现在model语句等号右边的任一效应计算因变量的均值。不过这些均值没有针对模型中的效应进行修正。如果需要修正的均值,应该调用glm过程,使用其中的lsmenas语句。在anova过程里可以使用任意多个means语句,它们放在model语句后面。

Means语句的选项列表主要有两个内容,一是选择多重比较的检验方法,二是规定这些检验的细节,注意这些细节选项只能用于主效应。

① 多重比较的检验方法

? bon——对所有主效应均值之差进行Bonferroni的t检验。 ? duncan——对所有主效应均值进行Duncan的多重极差检验。

? dunnett<(‘格式化对照值’)>——进行Dunnett的双尾t检验。用以检验对所有主效应均值的某个水平作为对照,处理有无显著差异。为了规定这个对照效应的水平,在括号内用单引号把这个水平的格式化值括起来。缺省时,效应的第一个水平作为对照。

? dunnettl<(‘格式化对照值’)>——进行Dunnett的单尾t检验。它检验是否任一个处理显著地小于这个对照。

? dunnettu<(‘格式化对照值’)>——进行Dunnett的单尾t检验。它检验是否任一个处理显著地大于这个对照。

? gabriel——对所有主效应均值进行Gabriel的多重对比检验。

? regwf——对所有主效应均值进行Ryan-Einot-Gabriel-Welsch的多重F检验。 ? regwq——对所有主效应均值进行Ryan-Einot-Gabriel-Welsch的多重极差检验。 ? scheffe——对所有主效应均值进行Scheffe的多重对比检验。 ? sidak——对所有主效应均值水平依据Sidak不等式进行调整后,对其均值之差两两进行t检验。

? Smm|gt2——当样本量不等时,基于学生化最大模和Sidak不相关t不等式,等到Hochberg的GT2方法,对主效应均值进行两两对比检验。

? snk——对所有主效应均值进行Student-Newman-Keuls的多重极差检验。

? t|lsd——对所有主效应均值进行两两t检验,它相当于在单元观察数相等时Fisher的最小显著差(Fisher’s least-significant-difference)检验。

? tukey——对所有主效应均值进行Tukey的学生化极差检验。

? waller——对所有主效应均值进行Waller-Duncan的k比率(k-ratio)检验。 ② 多重比较的检验细节

? alpha=p——给出均值间对比检验的显著性水平。缺省值是0.05。 ? cldiff——要求把两两均值之差的结果用置信区间的形式输出。 ? clm——对变量的每个水平的均值按置信区间形式输出。

? e=效应——指定在多重对比检验中所使用的误差均方。如果缺省,使用残差均方(MS)。指定的效应必须是在model语句中出现过的效应。

上海财经大学经济信息管理系IS/SHUFE

Page 11 of 30

? kratio=值——给出Waller-Duncan检验的类型1/类型2的误差限制比例。Kratio的合理值为50、100、500,大约相当于两水平时alpha值为0.1、0.05、0.01。缺省值为100。

? lines——按下降次序列出所有检验方法产生的均值,并用一条线段在均值旁指出非显著的子集。

? hovtest——要求输出组间方差齐性的Levene检验。 5) test语句

? 在分析中,如果这个语句缺省,仍然使用残差均方(MS)作为误差项对所有平方和(SS)计算F值。但用户可以使用本语句要求使用其他效应作为误差项,得到另外的F检验。可以使用多个test语句,把它们放在model语句后面。Test语句的选项为:

? h=效应——规定模型里哪些效应用来作为假设的效应。

? e=效应——规定一个而且只能是一个效应用来作为误差项,这个说明项是必须的。 2. glm过程的语句格式

proc glm是分析符合一般线性模型(General Linear Models)的数据,因此取名GLM。它能被用在许多不同的分析中,如简单回归、多元回归、方差分析、协方差分析、加权回归、多项式回归、偏相关分析、多元方差分析等。

在glm过程中的大多数方差分析的语句和选项与anova过程中基本相同。用anova过程编写的程序几乎不用修改就可在glm过程中运行。glm过程仅仅是附加了三条语句:contrast、estimate和lsmeans。contrast和estimate语句允许你测试和估计均值的某种功能。lsmeans语句允许你计算调整后的均值。

glm过程的主要控制语句如下:

proc glm 输入数据集名 <选项列表> ;

class 变量列表 ;

model 因变量列表=自变量列表 ; contrast ‘标签’ 效应 值表 ; estimate ‘标签’ 效应 值表 ; lsmeans 效应列表 ; means 效应列表 ;

output <统计量关键字=变量名列表>; test E=效应列表; run ;

其中class语句、model语句是必需的,而且class语句必须出现model语句之前。其他语句必须放在model语句之后。下面主要介绍与anova过程相比不同的语句和新增加的语句。 1) model语句。

在glm过程的model语句中可以使用几种不同效应,下面是使用这些效应的几个例子,a、b和c代表分类变量;y1、y2、x1和x2代表连续变量。

Model y=x1; (简单回归) Model y=x1 x2; (多重回归) Model y=x1 x1*x1; (多项式回归) Model y1 y2=x1 x2; (多元回归)

Model y=a; (单因素方差分析) Model y=a b c; (主效应模型) Model y=a b a*b; (因素模型) Model y=a b(a) c(b a); (嵌套模型)

上海财经大学经济信息管理系IS/SHUFE

Page 12 of 30

Model y1 y2=a b; (多元方差分析模型) Model y=a x1 (协方差分析模型)

Model语句的主要选项有(与anova过程中的model语句选项相同不再列出): ? solution——打印正规方程的解,即参数估计值。

e1/e2/e3/e4——打印模型中每一效应的类型1/类型2/类型3/类型4的可估函数,并计算相应的平方和。

ss1/ss2/ss3/ss4——对每个效应,打印与类型1/类型2/类型3/类型4的可估函数相关的平方和。

alpha=0.01/0.05/0.1——指定置信区间的?水平。缺省值为0.05。

cli/clm——打印每一观察的预测值/预测均值的置信限,两者不能同时使用。 p——打印自变量没有缺失值的每一观察值、预测值和残差值。同时还打印Durbin-Waston统计量。

xpx——打印叉积矩阵X?X。

i——打印矩阵X?X的逆矩阵或广义逆矩阵。 2) contrast语句。

提供一种获得一般假设检验的技巧。其中,效应可以是截距,用字符intercept表示。通过规定L向量或M矩阵来构造一元假设检验L??0或多元假设检验L?M?0。例如,当发现某两个因素的交互作用项有显著性时,我们可用本语句来实现一个因素被控制在某水平上,对另一个因素的各水平间进行两两比较的目的。

设M因素有三个水平a、b、c,V因素有两个水平1、2,且M?V有显著性。如果我们要比较

?a?(?b??c)

的差异,那么有几种不同的比较方法:

① 在因素V的每一个水平上,分别比较因素M的三个水平a、b、c均值的之间的线

性关系假设是否显著。也即

12H0:?a1?0.5?b1?0.5?c1?0和H0:?a2?0.5?b2?0.5?c2?0。

② 在因素V平均的所有水平上,比较因素M的三个水平a、b、c均值的之间的线性

关系假设是否显著。也即

H0:0.5(?a1?0.5?b1?0.5?c1)?0.5(?a2?0.5?b2?0.5?c2)?0。

③ 在因素V平均的子集上,比较因素M的三个水平a、b、c均值的之间的线性关系

假设是否显著。也即

H0:(?a1?0.5?b1?0.5?c1)?(?a2?0.5?b2?0.5?c2)?0

glm模型为双因素试验设计的方差分析指定了下面的效应公式

?ij????i??j?(??)ij

(25.25)

其中?ij是因素Mi水平与因素Vj水平在ij单元上所有观察值的平均。?为总平均。?i是因素M在i水平上的主效应,?j是因素V在j水平上的主效应,(??)ij为因素M和因素V上海财经大学经济信息管理系IS/SHUFE

Page 13 of 30

在ij水平上的交互效应。因此,对任一观察值有

yijk??ij??ijk????i??i?(??)ij??ijk (25.26)

因此,根据单元均值给出的线性组合可以转换成效应模型的合并参数形式,即L??0,如

?a1?0.5?b1?0.5?c1????a??1?(??)a1?0.5??0.5?b?0.5?1?0.5(??)b1 ?0.5??0.5?c?0.5?1?0.5(??)c1??a?0.5?b?0.5?c?(??)a1?0.5(??)b1?0.5(??)c1同理

?a2?0.5?b2?0.5?c2??a?0.5?b?0.5?c?(??)a2?0.5(??)b2?0.5(??)c2

相应的glm过程的语句为

proc glm ;

class M V ; model Y=M V M*V;

contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 1 0 -0.5 0 -0.5 0; contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 0 1 0 -0.5 0 -0.5; run ;

Contrast语句中的可选项: e——打印整个L向量。

e=效应——规定模型中的某个效应作为误差项。过程将把这一效应作为单变量F检验的分母。如果缺省,过程把均方误差(MSE)作为误差项。

etype=n——指明e=效应的类型(1、2、3、4)。如果指明e=而没有指明etype=,则使用最高类型。

3) Estimate语句

可用来估计参数的线性函数,通过用参数的估计b乘以向量L来得到Lb。其中

b?(X?X)?X?Y。Estimate语句的使用格式同contrast语句。

estimate语句中的可选项: e——打印整个L向量。

divisor=数字——为简便地输入效应的系数而规定的一个值,用该值除以所有系数使得分数系数可以作为整数输入。例如

estimate ‘1/3(a+b)-2/3c’ M 1 1 -2 /divisor=3; 可替代

estimate ‘1/3(a+b)-2/3c’ M 0.33333 0.33333 -0.66667; 4) Lsmeans语句

计算列在语句中的每一效应的最小二乘均值(LSM)。最小二乘均值估计是针对非均衡数据设计的,而类和子类的算术平均值是针对均衡数据设计的。

lsmeans语句中的可选项:

cov——在选项out=指明的输出数据集中输出协方差。 e——打印用以计算最小二乘均值的可估函数。

上海财经大学经济信息管理系IS/SHUFE

Page 14 of 30

e=效应——规定模型中的某个效应作为误差项。 etype=n——指明e=效应的类型(1、2、3、4)。

out=输出数据集名——产生一个包含LSM值、标准差及协方差的输出数据集。 pdiff——打印假设检验H0:LSM(i)?LSM(j)的所有可能的概率值。 stderr——打印LSM的标准差和H0:LSM?0的概率值。

tdiff——打印假设检验H0:LSM(i)?LSM(j)的t值和相应的概率值。

pdiff=all/control/conroll/controlu——打印最小二乘均值之差的概率值。

adjust=bon/dunnett/scheffe/sidak/smm/gt2/tukey/t——要求多重比较对最小二乘均值之差的概率值和置信限进行调整。缺省值为t。

slice=效应——通过规定的这个效应来分开交叉的LSM效应。例如,假定交叉项A*B是显著的,如果想对B的每个效应检验A的效应,使用下面语句:

lsmeans A*B /slice=B;

八、 实例分析

1. 单因素试验设计的均值比较

例25.1 考虑在5种不同品牌的人工合成胶合板材料上进行磨损时间测试,每种品牌的材料做四次试验,且都是采用的同一种磨损措施,所有的试验都是在完全随机的顺序下在相同的机器上完成的。

程序如下:

data study.veneer;

input brand $ wear @@; cards;

ACME 2.3 ACME 2.1 ACME 2.4 ACME 2.5 CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6 AJAX 2.2 AJAX 2.0 AJAX 1.9 AJAX 2.1 TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7 XTRA 2.3 XTRA 2.5 XTRA 2.3 XTRA 2.4 ;

proc anova data=study.veneer;

class brand; model wear=brand; means brand;

means brand /hovtest; //方差齐性检验

run;

程序说明:因为数据仅仅是按照brand值分类,所以在class语句中这是仅有的一个变量。变量wear是被分析的因变量,故wear出现在model语句等号的左边。在方差分析表中,除了总方差和误差外,方差的来源仅仅是由于各种不同brand值的变异造成的,因此brand出现在model语句等号的右边。Means语句计算主效应brand不同水平所对应的因变量均值,选项hovtest计算不同品牌组方差齐性的假设检验。

上海财经大学经济信息管理系IS/SHUFE

Page 15 of 30

输出的结果见表25.4所示:

The SAS System Analysis of Variance Procedure Class Level Information Class Levels Values BRAND 5 ACME AJAX CHAMP TUFFY XTRA Number of observations in data set = 20//20个记录,自由度19 Analysis of Variance Procedure Dependent Variable: WEAR Source DF Sum of Squares//tss Mean Square F Value Pr > F Model 4 0.61700000//组间误差 0.15425000 7.40 0.0017 Error 15 0.31250000//组内误差 0.02083333 Corrected Total 19 0.92950000 R-Square C.V. Root MSE WEAR Mean 0.663798 6.155120 0.14433757 2.34500000 Source DF Anova SS Mean Square F Value Pr > F BRAND 4 0.61700000 0.15425000 7.40 0.0017 Levene's Test for Equality of WEAR Variance ANOVA of Squared Deviations from Group Means//齐性检验 Sum of Mean Source DF Squares Square F Value Pr > F BRAND 4 0.000659 0.000165 0.5310 0.7149 Error 15 0.00466 0.00031 Analysis of Variance Procedure 表25.4 单因素设计的方差分析结果

结果分析:anova过程总是输出两个基本的方差分析表。一个是总体模型的方差分析表,一个是包含模型中各个变量的方差分析。首先输出class语句中规定的每个变量(brand)、分类变量的取值数(5)、具体取值(ACME AJAX CHAMP TUFFY XTRA)以及数据集中的观察个数(20)。

接着anova过程对model语句中每个因变量输出方差分析表。包括:因变量的总平方和(0.9295)、属于模型部分的平方和(0.6170)、属于误差部分的平方和(0.3125)、自由度DF(4、5、19)、模型的均方MS(0.15425=0.617/4)、误差的均方MSE(0.02083333=0.3125/15)、模型的F值(7.40=0.15425000/0.02083333)、分布大于7.40的概率(0.0017)、R2(0.663798=0.617/0.9295)、变异系数CV(6.155120=100×0.0208333、因变量的/2.345)

上海财经大学经济信息管理系IS/SHUFE

Page 16 of 30

标准差(0.14433757=0.0208333)、因变量均值(2.345)。

对模型中的每个效应,anova过程还输出方差分析表。brand自由度DF(4)、平方和(0.617)、均方MS(0.15425=0.617/4)、F值(7.40=0.15425000/0.02083333)、分布大于7.40的概率(0.0017)。

总体F检验是显著的(0.0017<0.05),表明模型是有意义的。品牌brand的F检验也是显著的(0.0017<0.05),表明不同品牌的均值不全相等。这里两个F检验是完全相同的,这仅仅是因为在模型中只有一项brand。注意,我们可以用glm过程替代这个anova过程,能得到相同的方差分析结果。最大区别是glm过程将计算每个效应的类型1和类型3平方和,而anova只计算类型1的平方和。对于单因素和多因素平衡数据来说,anova过程的SS1、glm过程的SS1和SS3都相同。

Levene的 方差齐性检验结果表明:不能拒绝(0.7149>0.05)不同品牌组里观察值的方差是相等的原假设。

最后输出的是每种品牌的观察数、均值和标准差。例如,ACME品牌的观察数为4,均值为2.32500000,标准差为0.17078251。 2. 均值的多重比较和置信区间

例25.2 继续上例的分析。由于品牌brand的F检验是显著的(0.0017<0.05),表明5种不同品牌的均值不全相等,但可能存在某2个或某3个或某4个品牌的均值相同。因此,常需要进一步的均值多重比较和置信区间分析。

程序如下:

proc anova data=study.veneer;

class brand; model wear=brand; means brand /ducan;

means brand /lsd clm cldiff;

run;

程序说明:第一个means语句选用了ducan选项,要求计算输出组间均值比较的新多重极差检验,结果见表25.5(a)。第二个means语句选用了lsd clm选项,对所有组均值进行两两t检验,输出各组均值的置信区间,结果见表25.5(b)。第二个means语句还选用了lsd cldiff选项,将对各组间均值之差采用最小显著差检验,输出各组间均值之差的置信区间,结果见表25.5(c)。

表25.5(a) Duncan的新多重极差检验

上海财经大学经济信息管理系IS/SHUFE

Page 17 of 30

The SAS System Analysis of Variance Procedure Duncan's Multiple Range Test for variable: WEAR NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 15 MSE= 0.020833 Number of Means 2 3 4 5 Critical Range .2175 .2280 .2346 .2390 Means with the same letter are not significantly different. Duncan Grouping Mean N BRAND A 2.6000 4 TUFFY A B A 2.3750 4 XTRA B A 表25.5(a)中结果分析:注意到各组均值按大到小排列(2.60,2.375,2.375,2.3250,2.0500),在标题“Duncan Grouping”下是一系列字母A、B、C,如果均值间差异不显著标上相同的字母,否则标上不同的字母。对于Duncan多重极差检验来说,5个均值之间的比较,只要看最大的均值与最小的均值之差的是否大于临界值0.239,因为2.600-2.050=0.55>0.239,则为显著,所以品牌TUFFY的均值不同与AJAX,应该标识不同的字母。因为存在5个均值之间最大差的显著性,接下来就需要比较4个均值之间差的显著性,临界值为0.2346。2.600-2.325=0.275>0.2346,显著,2.375-2.050=0.325>0.2346,显著,只要存在一个显著性,就需要继续比较3个均值之间差的显著性。虽然,均值2.600、2.375和2.375之间的差小于0.2280,均值2.375、2.375和2.325之间的差也小于0.2280,但由于存在2.375-2.050=0.325>0.2280,显著,继续比较2个均值之间差的显著性。2.600-2.375=0.225>0.2175,显著,2.325-2.050=0.275>0.2175,显著,其他相邻两均值比较不显著。

表25.5(b) 各组均值的t检验置信区间

T Confidence Intervals for variable: WEAR Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833 Critical Value of T= 2.13 Half Width of Confidence Interval= 0.153824 Lower Upper BRAND N Confidence Mean Confidence Limit Limit TUFFY 4 2.44618 2.60000 2.75382 XTRA 4 2.22118 2.37500 2.52882 表25.5(b)中结果分析:均值t分布的95%置信区间的一半宽度为0.153824,因此TUFFY品牌均值置信区间的下限为2.600-0.153824=2.44618,上限为2.600+0.153824=2.75382。其他品牌均值的置信区间计算,同样是均值加减0.153824而得到的。

表25.5(c) lsd最小显著差检验

上海财经大学经济信息管理系IS/SHUFE

Page 18 of 30

The SAS System T tests (LSD) for variable: WEAR NOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate. Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833 Critical Value of T= 2.13145 Least Significant Difference= 0.2175 Comparisons significant at the 0.05 level are indicated by '***'. Lower Difference Upper BRAND Confidence Between Confidence Comparison Limit Means Limit TUFFY - XTRA 0.0075 0.2250 0.4425 *** TUFFY - CHAMP 0.0075 0.2250 0.4425 *** TUFFY - ACME 0.0575 0.2750 0.4925 *** TUFFY - AJAX 0.3325 0.5500 0.7675 *** XTRA - TUFFY -0.4425 -0.2250 -0.0075 *** XTRA - CHAMP -0.2175 0.0000 0.2175 XTRA - ACME -0.1675 0.0500 0.2675 XTRA - AJAX 0.1075 0.3250 0.5425 *** CHAMP - TUFFY -0.4425 -0.2250 -0.0075 *** CHAMP - XTRA -0.2175 0.0000 0.2175 CHAMP - ACME -0.1675 0.0500 0.2675 CHAMP - AJAX 0.1075 0.3250 0.5425 *** ACME - TUFFY -0.4925 -0.2750 -0.0575 *** 表25.5(c)中结果分析:注意在显著水平为0.05上,两两比较的最小显著差为0.2175,如果显著则被标上“***”。例如,TUFFY均值减XTRA均值=2.600-2.375=0.225>0.2175,显著。综合分析的结果表明,AJAX品牌均值显著与其他品牌均值不同,且为最小的均值;TUFFY品牌均值也显著与其他品牌均值不同,且为最大的均值;XTRA、CHAMP、ACME三个品牌均值之间无显著差异。 3. 有计划的均值比较和参数估计

例25.3 继续上例的分析。有时在实际情况中,多重比较要按某种分类标准来进行,例如,假设我们知道5种品牌的制造商情况,品牌ACMX、AXAX和CHAMP来自美国U.S.制造商,而品牌TUFFY和XTRA来自非美国non-U.S.制造商。如果我们有兴趣比较美国品牌的均值与非美国品牌的均值是否有差异。

程序如下:

proc glm data=study.veneer;

class brand; model wear=brand;

contrast 'US vs NON-U.S.' brand 2 2 2 -3 -3;

上海财经大学经济信息管理系IS/SHUFE

Page 19 of 30

estimate 'US vs NON-U.S.' brand 2 2 2 -3 -3;

run;

程序说明:使用contrast语句来产生有计划的均值比较分析和使用estimate语句进行参数估计。注意在anova过程中没有这两条语句,必须使用glm过程。使用contrast语句前,应该首先表达出所关心的均值线性组合的原假设,如

H0:1/3(?ACME??AJAX??CHAMP)?1/2(?TUFFY??XTRA) 等价于H0:2(?ACME??AJAX??CHAMP)?3(?TUFFY??XTRA)?0contrast语句的三个基本参数,一是标签('US vs NON-U.S.'),二是效应名(brand),三是效应的数字系数表(2 2 2 -3 -3)。应特别注意的是,数字系数的次序是匹配分类变量按字母数字次序的水平值。事实上,均值线性组合的系数同样是model语句中效应参数组合的系数,这是因为,?i????i,将它们分别代入均值线性组合后,可得到

2(?ACME??AJAX??CHAMP)?3(?TUFFY??XTRA)?2(???ACME????AJAX??CHAMP??XTRA)?3(???TUFFY????XTRA) ?2(?ACME??AJAX??XTRA)?3(?TUFFY??XTRA)所以,estimate语句的使用格式与contrast语句非常类同。

输出的主要结果见表25.6所示:

表25.6 有计划的均值比较和参数估计

The SAS System Contrast DF Contrast SS Mean Square F Value Pr > F US vs NON-U.S. 1 0.27075000 0.27075000 13.00 0.0026 T for H0: Pr > |T| Std Error of Parameter Estimate Parameter=0 Estimate 表3.16中结果分析:显示了美国品牌均值与非美国品牌均值比较的平方和为0.27075,F值为13=0.27075/0.020833,这个F(1,15)分布F值大于13的概率为0.0026小于0.05,因此原假设是显著的,拒绝接受,即美国品牌均值与非美国品牌均值是不同的。效应组合的参数估计为-1.425=3×(2.325+2.050+2.375)-2×(2.600+2.375),对于原假设参数是否为0的t检验,t统计量为-3.60,概率为0.0026小于0.05,拒绝接受。注意到t检验的p值为0.0026,与对比分析的F检验的p值相同,这是因为两种检验是相同的,F值等于t的平方。 4. 随机单位组试验设计的方差分析

例25.4 某食品公司对一种食品设计了四种包装。为了考察哪种包装最受欢迎,选了十个有近似相同销售量的商店作试验,其中两种包装各指定两个商店,另两种包装各指定三个商店销售。在试验期中各商店的货架排放位置、空间都尽量一致,营业员的促销方法也基本相同。观察在一定时期的销售量,数据见表25.7所示。试比较四种包装的销售量是否一致。

表25.7 四种包装在10个商店中的销售量

包装类型 (treat) A1 A2 商店(block) 1 12 14 2 18 12 3 13 商店数 n 2 3 Page 20 of 30

上海财经大学经济信息管理系IS/SHUFE

本文来源:https://www.bwwdw.com/article/1ajg.html

Top