统计学第12讲 第12章 方差分析概论

更新时间:2023-07-25 11:42:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第12章 方差分析概论12.1 引言 各种不同情境下的双组实验设计有其自身局限,可 能会忽略有价值的信息。 例如:哪种治疗方法效果最好? 如果要比较六个组,是否可以进行六次双组 t 检验? 答案:进行六次 t 检验,会增大犯Ⅰ类错误的风险 ( 拒绝一个真实的虚无假设)。 再举一个极端的例子,假设进行一项研究,需要分 别进行1000次 t 检验。如果有50个 t 值表明差异在 0.05上显著,你会吃惊吗?

方差分析(analysis of variance)对多个样本进行比较并评估其显著性时,可以克服 t 检验存在的问题。它能够帮助我们回答一个问题:是 否可用一个总的指标说明实验处理导致各个不同组间 的平均数有差异? 12.2 平方和的概念

2 S

( X X )2 n 1

X

2

X n

2

n 1

SS n 1

从公式可以看出,若离差大,则方差也大,离差小 ,数据紧聚在平均数周围,则方差也小。

回忆一下 两样本 t 检验计算公式:

( X 1 X 2 ) ( 1 2 ) t SX1 X 2

SX1 X 2

SS1 SS 2 1 1 n n n1 n2 2 1 2

问:分子和分母分别表示意思? 答:分子表示平均数之间的差异,而分母表示各组内 变异相加的估计值,称为平均数差异的标准误。

平均数之间差异越大,则 t 值越大,否者 t 值越小

图12-1 要想得到统计学显著性,平均数差异大小与 变异大小之间的关系 如果变异较小 ,则统计显著 性所需的平均 数差异也较小X1 5

X2 9

如果变异较大 ,则统计显著 性所需的平均 数差异也较大

X 1 7.5

X 2 18.5

方差分析包括对两个方差的独立估计: 组间方差 (between-group variance) 组内方差 (with-group variance)

组间方差 F 组内方差方差分析一个基本概念就是平方和

SS X 2 SS总= SS组内 +

( X )2 nSS组间

12.3 举例说明:两个组的情形 12.3.1 总平方和分解为组内平方和与组间平方和实验组 X1 X2 控制组 X2 X2 361296

31 36961 1296

20 41 34400 1681 1156

32 34 32 33 和 3291024 1156

29841

34 271156 729

33 10 281089 100 784

11083 26 31 30 35 和 283676 961 900 1225 和

1024 1089 和

8461

实验组平均数 X 1 =32.9,控制组平均数 X 2 =28.3 SS总=(11083+8461)-(612)2/20=19544-18727.2=816.8 SS1=11083-(329)2/10=11083-10824.1=258.9 SS2=8461-(283)2/10=8461-8088.9=452.1 SS组内=258.9+452.1=711

ni n df2 单侧 1 2 2 2 P 329 283 612 0.01 8.29 10 10 20 =10824.1+8008.9-18727.2 18 0.05 4.41 =18833-18727.2=105.8 K=2,df=2-1=1方差的估计值S2=SS组间/1=105.8 组内自由度df=N-K=20-2=18 SS组内=711/18=39.5 查F表,F 0.05(1,18)=4.41

SS组间

( X i )2

( X 总 )2

df1

105.8 F 2.678 39.5

2.678 <4.41,不拒

绝H0。结论与前面的 t 检验一致。 注意:当组间自由度=1时,F=t2 ,2.678=1.6362

12.4 方差分析的基本思想 1. 总方差分为 组间方差 + 组内方差 a. 组间方差:由于受到实验处理,包括自变量以及 混杂因素影响而产生的系统差异,这些变量引起因 变量的变化。 b. 组内方差:由个体差异和非控制因素引起的因变 量的变化。精良的设计需要使这个方差最小化。 2. H0: μ1=μ2…=μk 什么意思? 所有样本来自一个总体。 3. H1: μ1,μ2,…,μk 不全相等 所有样本不是来自一个总体。 什么意思?

4. F 统计量

=组间方差÷组内方差

通过查F 临界值以确定是否拒绝或接受H0。 12.5 以三个实验组为例-----单因素方差分析例题:某项研究为了评价三种不同教学效果,从学生 总体中随机抽取21名被试,并随机分为三组,让他们 接受三种不同的教学,完成教学后就进行测验,测验 成绩越高,说明解决逻辑问题的能力越高。是否有证 据表明哪种方法更有效? 方法1 方法2 方法3 3 3 9 2 3 4 7 7 5 2 9 9 5 4 10 2 7 8 4 5 11

(a) 从 μ1=μ2=μ3 的总体中抽3个组,凭机 遇很可能获得(F比率小)

(b) 有时偶然可能获得 ,F比值大,但是概率 小于0.01. (c) 凭机遇几乎无法获 得,(F比率很大),发 生概率小于万分之一

方法1X2 方法2 X2

39 3 9

24 3 9

7

2

5

24 7 49

4

∑X1=25

49 4 25 7 9 4 49 81 16

16 ∑X12=111 5 ∑X2=38 25 ∑X22=238

方法3 9 X2 81

4 5 9 10 8 11 ∑X3=56 16 25 81 100 64 121 ∑X32=488

第1步:计算总平方和

( 25 38 46)2 SS总 (111 238 488) 21

1192 837 837 674.33 162.67 21

方法1X2 方法2 X2

39 3 9

24 3 9

7

2

5

24 7 49

4

∑X1=25

49 4 25 7 9 4 49 81 16

16 ∑X12=111 5 ∑X2=38 25 ∑X22=238

方法3 9 X2 81

4 5 9 10 8 11 ∑X3=56 16 25 81 100 64 121 ∑X32=488

第2步. 三组的组间平方和为;

252 382 562 1192 69.25 SS组 间 21 7 252 382 562 1192 SS组 间 21 69.24 7

第3步: 已知组间SS,总的SS,计算组内SS。 SS组内=162.67-69.24=93.43 第4步;计算组间方差估计值 df组间=K -1=3 -1=2 第5步:计算组内方差估计值 df组内= N- K =21-3=18 第6步:计算F 值 在本例。总自由度=N-1=20

S

2 组间

69.24 34.62 293.42 5.19 18

S

2 组内

34.62 F 6.67 5.19

第7步;列出分析分析表

表 12-3 方差分析表 变异源 平方和 自由度 69.24 2 组间 93.43 18 组内 20 总计 162.67 12.6 F 值的解释 查F 临界值表,F0.05(2,18)=3.5518

方差估计值 34.62 5.19df2

F比率 6.67df1 单侧P 2

0.010.05

8.294.41

6.67>3.55, 所以按照0.05拒绝H0,三个总体平均数 不同,不是来自一个总体。 请问:这个问题是否到此就结束了?

1. 事前比

较或者计划比较:如果想在研究前进行比 较,可使用事前检验而不用做方差分析。2. 事后比较:事前心中无数或者计划不好,可先进 行方差分析再事后做比较(也称为两两比较)。 1953年,普林斯顿大学Tukey提出HSD检验 (honestly significant difference,即真正的显著性差 异),使用条件:F检验要有显著性,并且各组样本 量相等。

HSD q S

2 组内

/ ni

其中:qα=根据给定的α水平以及组内自由度和 k(平均值的个数),从附表查得。

表12-4 样本平均数以及各组之间平均数差异的矩阵X1

=3.57

- X 2 =5.43 - X 3 =8.00 -X 1 =3.57

=5.43 1.86 - -X2

X 3 =8.00

4.43 1-α df 2.57 - 0.9518 0.99

r 等级差 数 3 3.61 4.70

查附表6 q界值表

当df=18 , r=3 ,α=0.05时,查得q=3.61.

HSD 3.61 5.19 / 7 3.10因为只有第1和3组平均数之间的差异4.43>3.10,结 论:第3种教学方法能够显著提高学生解决逻辑问题 的能力。

12.7 单变量实验设计---相关样本 行为或医学研究中诸多因素都能导致分数的变异。 诸如个体差异,在独立样本中无法识别和量化,其结 果会增大误差。剔除这些误差的方法,可考虑相关样 本设计。这好比选择天线一样,长天线噪音最低,电 台信号就清晰了。 12.8 三个配对组设计 挑选21名业余篮球队员,按照投篮水平分为七个区 组,每组3人投篮水平比较一致。每组站在罚球线 位置,随机使用三种不同的投篮方法,每个人投20 次。试问这21人在不同的区组和不同的投篮方法上 是否存在差异?

表12-5 接受不同训练后3个配对组的投篮分数(每 投20次投中的次数) 分组 1 2 3 4 5 6 7 合计 X1 15 13 12 11 9 8 7 75 训练方法 X2 X3 13 11 9 10 10 9 13 12 5 7 6 4 5 2 61 55 合计 39 32 31 36 21 18 14 191

12.9 计算平方和与方差估计值 SS总=SS处理+SS区组+SS误差1.计算总平方和 SS总 Xi2 表12-6 区组 X1 X 12 实验处理情况 X2 X 22

矫正项CT

( X i )2 ni kX3

12-812-9X 32 区组和

12 3

1513 12

225169 144

139 10

16981 100

1110 9

121100 81

3932 31

45 6 7 和

119 8 7 T1=75

12181 64 49 853

135 6 5 T2=61

16925 36 25 605

127 4 2 T3=55

14449 16 4 515

3621 18 14 191

2.计算SS处理及估计方差S2区组1 …

X115 …

X 12225 …

X213 …

X 22169 …

X311 …

X 32121 …

区组和39 …

7和

7T1=75

49853

5T2=61

25605

2T3=55

4515

14191

∑X2=225…+4=853+605+515=1973 矫正项CT=(∑X)2/nik=1912/21=1737.19 SS总= ∑X2-CT=1973 -1737.19=235.81 df总=nk -1=7×3 -1=20 SS处理=(752+612+552)/7 -1739.19=30.10 df处理=k -1=3 -1=2 12-10 12-11 12-12

SS处理=(752+612+552)/7 -1739.19=30.10 df处理=k -1=3 -1=2 所以 S2处理=30.10÷2=15.05区组 1 2

12-11 12-12 12-13bl 39 32 bl2 1521 1024

3. 计算SS区组及估计方差S2SS区 组 bl 2

k CT 12 14

34 5

3136 21

9611296 441

=(1521+….+196)/3-1737.19

=183.81df区组理=bl -1=7 -6

67 和

1814 191

324196 5763

所以

S2区组=183.81÷6=30.64

12-16

本文来源:https://www.bwwdw.com/article/hiqm.html

Top