统计学第12讲 第12章 方差分析概论
更新时间:2023-07-25 11:42:01 阅读量: 实用文档 文档下载
- 统计学第12章课后答案推荐度:
- 相关推荐
第12章 方差分析概论12.1 引言 各种不同情境下的双组实验设计有其自身局限,可 能会忽略有价值的信息。 例如:哪种治疗方法效果最好? 如果要比较六个组,是否可以进行六次双组 t 检验? 答案:进行六次 t 检验,会增大犯Ⅰ类错误的风险 ( 拒绝一个真实的虚无假设)。 再举一个极端的例子,假设进行一项研究,需要分 别进行1000次 t 检验。如果有50个 t 值表明差异在 0.05上显著,你会吃惊吗?
方差分析(analysis of variance)对多个样本进行比较并评估其显著性时,可以克服 t 检验存在的问题。它能够帮助我们回答一个问题:是 否可用一个总的指标说明实验处理导致各个不同组间 的平均数有差异? 12.2 平方和的概念
2 S
( X X )2 n 1
X
2
X n
2
n 1
SS n 1
从公式可以看出,若离差大,则方差也大,离差小 ,数据紧聚在平均数周围,则方差也小。
回忆一下 两样本 t 检验计算公式:
( X 1 X 2 ) ( 1 2 ) t SX1 X 2
SX1 X 2
SS1 SS 2 1 1 n n n1 n2 2 1 2
问:分子和分母分别表示意思? 答:分子表示平均数之间的差异,而分母表示各组内 变异相加的估计值,称为平均数差异的标准误。
平均数之间差异越大,则 t 值越大,否者 t 值越小
图12-1 要想得到统计学显著性,平均数差异大小与 变异大小之间的关系 如果变异较小 ,则统计显著 性所需的平均 数差异也较小X1 5
X2 9
如果变异较大 ,则统计显著 性所需的平均 数差异也较大
X 1 7.5
X 2 18.5
方差分析包括对两个方差的独立估计: 组间方差 (between-group variance) 组内方差 (with-group variance)
组间方差 F 组内方差方差分析一个基本概念就是平方和
SS X 2 SS总= SS组内 +
( X )2 nSS组间
12.3 举例说明:两个组的情形 12.3.1 总平方和分解为组内平方和与组间平方和实验组 X1 X2 控制组 X2 X2 361296
31 36961 1296
20 41 34400 1681 1156
32 34 32 33 和 3291024 1156
29841
34 271156 729
33 10 281089 100 784
11083 26 31 30 35 和 283676 961 900 1225 和
1024 1089 和
8461
实验组平均数 X 1 =32.9,控制组平均数 X 2 =28.3 SS总=(11083+8461)-(612)2/20=19544-18727.2=816.8 SS1=11083-(329)2/10=11083-10824.1=258.9 SS2=8461-(283)2/10=8461-8088.9=452.1 SS组内=258.9+452.1=711
ni n df2 单侧 1 2 2 2 P 329 283 612 0.01 8.29 10 10 20 =10824.1+8008.9-18727.2 18 0.05 4.41 =18833-18727.2=105.8 K=2,df=2-1=1方差的估计值S2=SS组间/1=105.8 组内自由度df=N-K=20-2=18 SS组内=711/18=39.5 查F表,F 0.05(1,18)=4.41
SS组间
( X i )2
( X 总 )2
df1
105.8 F 2.678 39.5
2.678 <4.41,不拒
绝H0。结论与前面的 t 检验一致。 注意:当组间自由度=1时,F=t2 ,2.678=1.6362
12.4 方差分析的基本思想 1. 总方差分为 组间方差 + 组内方差 a. 组间方差:由于受到实验处理,包括自变量以及 混杂因素影响而产生的系统差异,这些变量引起因 变量的变化。 b. 组内方差:由个体差异和非控制因素引起的因变 量的变化。精良的设计需要使这个方差最小化。 2. H0: μ1=μ2…=μk 什么意思? 所有样本来自一个总体。 3. H1: μ1,μ2,…,μk 不全相等 所有样本不是来自一个总体。 什么意思?
4. F 统计量
=组间方差÷组内方差
通过查F 临界值以确定是否拒绝或接受H0。 12.5 以三个实验组为例-----单因素方差分析例题:某项研究为了评价三种不同教学效果,从学生 总体中随机抽取21名被试,并随机分为三组,让他们 接受三种不同的教学,完成教学后就进行测验,测验 成绩越高,说明解决逻辑问题的能力越高。是否有证 据表明哪种方法更有效? 方法1 方法2 方法3 3 3 9 2 3 4 7 7 5 2 9 9 5 4 10 2 7 8 4 5 11
(a) 从 μ1=μ2=μ3 的总体中抽3个组,凭机 遇很可能获得(F比率小)
(b) 有时偶然可能获得 ,F比值大,但是概率 小于0.01. (c) 凭机遇几乎无法获 得,(F比率很大),发 生概率小于万分之一
方法1X2 方法2 X2
39 3 9
24 3 9
7
2
5
24 7 49
4
∑X1=25
49 4 25 7 9 4 49 81 16
16 ∑X12=111 5 ∑X2=38 25 ∑X22=238
方法3 9 X2 81
4 5 9 10 8 11 ∑X3=56 16 25 81 100 64 121 ∑X32=488
第1步:计算总平方和
( 25 38 46)2 SS总 (111 238 488) 21
1192 837 837 674.33 162.67 21
方法1X2 方法2 X2
39 3 9
24 3 9
7
2
5
24 7 49
4
∑X1=25
49 4 25 7 9 4 49 81 16
16 ∑X12=111 5 ∑X2=38 25 ∑X22=238
方法3 9 X2 81
4 5 9 10 8 11 ∑X3=56 16 25 81 100 64 121 ∑X32=488
第2步. 三组的组间平方和为;
252 382 562 1192 69.25 SS组 间 21 7 252 382 562 1192 SS组 间 21 69.24 7
第3步: 已知组间SS,总的SS,计算组内SS。 SS组内=162.67-69.24=93.43 第4步;计算组间方差估计值 df组间=K -1=3 -1=2 第5步:计算组内方差估计值 df组内= N- K =21-3=18 第6步:计算F 值 在本例。总自由度=N-1=20
S
2 组间
69.24 34.62 293.42 5.19 18
S
2 组内
34.62 F 6.67 5.19
第7步;列出分析分析表
表 12-3 方差分析表 变异源 平方和 自由度 69.24 2 组间 93.43 18 组内 20 总计 162.67 12.6 F 值的解释 查F 临界值表,F0.05(2,18)=3.5518
方差估计值 34.62 5.19df2
F比率 6.67df1 单侧P 2
0.010.05
8.294.41
6.67>3.55, 所以按照0.05拒绝H0,三个总体平均数 不同,不是来自一个总体。 请问:这个问题是否到此就结束了?
1. 事前比
较或者计划比较:如果想在研究前进行比 较,可使用事前检验而不用做方差分析。2. 事后比较:事前心中无数或者计划不好,可先进 行方差分析再事后做比较(也称为两两比较)。 1953年,普林斯顿大学Tukey提出HSD检验 (honestly significant difference,即真正的显著性差 异),使用条件:F检验要有显著性,并且各组样本 量相等。
HSD q S
2 组内
/ ni
其中:qα=根据给定的α水平以及组内自由度和 k(平均值的个数),从附表查得。
表12-4 样本平均数以及各组之间平均数差异的矩阵X1
=3.57
- X 2 =5.43 - X 3 =8.00 -X 1 =3.57
=5.43 1.86 - -X2
X 3 =8.00
4.43 1-α df 2.57 - 0.9518 0.99
r 等级差 数 3 3.61 4.70
查附表6 q界值表
当df=18 , r=3 ,α=0.05时,查得q=3.61.
HSD 3.61 5.19 / 7 3.10因为只有第1和3组平均数之间的差异4.43>3.10,结 论:第3种教学方法能够显著提高学生解决逻辑问题 的能力。
12.7 单变量实验设计---相关样本 行为或医学研究中诸多因素都能导致分数的变异。 诸如个体差异,在独立样本中无法识别和量化,其结 果会增大误差。剔除这些误差的方法,可考虑相关样 本设计。这好比选择天线一样,长天线噪音最低,电 台信号就清晰了。 12.8 三个配对组设计 挑选21名业余篮球队员,按照投篮水平分为七个区 组,每组3人投篮水平比较一致。每组站在罚球线 位置,随机使用三种不同的投篮方法,每个人投20 次。试问这21人在不同的区组和不同的投篮方法上 是否存在差异?
表12-5 接受不同训练后3个配对组的投篮分数(每 投20次投中的次数) 分组 1 2 3 4 5 6 7 合计 X1 15 13 12 11 9 8 7 75 训练方法 X2 X3 13 11 9 10 10 9 13 12 5 7 6 4 5 2 61 55 合计 39 32 31 36 21 18 14 191
12.9 计算平方和与方差估计值 SS总=SS处理+SS区组+SS误差1.计算总平方和 SS总 Xi2 表12-6 区组 X1 X 12 实验处理情况 X2 X 22
矫正项CT
( X i )2 ni kX3
12-812-9X 32 区组和
12 3
1513 12
225169 144
139 10
16981 100
1110 9
121100 81
3932 31
45 6 7 和
119 8 7 T1=75
12181 64 49 853
135 6 5 T2=61
16925 36 25 605
127 4 2 T3=55
14449 16 4 515
3621 18 14 191
2.计算SS处理及估计方差S2区组1 …
X115 …
X 12225 …
X213 …
X 22169 …
X311 …
X 32121 …
区组和39 …
7和
7T1=75
49853
5T2=61
25605
2T3=55
4515
14191
∑X2=225…+4=853+605+515=1973 矫正项CT=(∑X)2/nik=1912/21=1737.19 SS总= ∑X2-CT=1973 -1737.19=235.81 df总=nk -1=7×3 -1=20 SS处理=(752+612+552)/7 -1739.19=30.10 df处理=k -1=3 -1=2 12-10 12-11 12-12
SS处理=(752+612+552)/7 -1739.19=30.10 df处理=k -1=3 -1=2 所以 S2处理=30.10÷2=15.05区组 1 2
12-11 12-12 12-13bl 39 32 bl2 1521 1024
3. 计算SS区组及估计方差S2SS区 组 bl 2
k CT 12 14
34 5
3136 21
9611296 441
=(1521+….+196)/3-1737.19
=183.81df区组理=bl -1=7 -6
67 和
1814 191
324196 5763
所以
S2区组=183.81÷6=30.64
12-16
正在阅读:
统计学第12讲 第12章 方差分析概论07-25
中国共产党党史教学教案06-01
通防部相关制度汇编10-22
主板重要测试点 - 图文04-13
直流双闭环调速系统06-05
一件伤心的事作文500字06-17
2017-2018学年北师大版七年级语文第二学期期末测试题及答案04-30
《普通高等学校基本办学条件指标(试行)》06-12
民用建筑工程设计常见问题分析及图示(钢结构和空间网格结构)05SG109-411-05
中建x局(投标书)定稿版05-23
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 方差
- 统计学
- 概论
- 分析
- 小学四年级奥数和差倍
- 蕲春县2014年春高中期中教学质量检测高一语文答案
- 蒙德里安作品赏析
- 医学大学生自我鉴定的范文
- 小学美术说课稿模板(精心整理)
- 2010年05月秘书三级操作技能试题及参考答案
- 浅析中西餐桌礼仪文化的差异_毕业论文
- 知识点七年级英语(仁爱版)下册Unit 8 Topic 3语言点归纳
- 中级公路运输二、运输方式与综合运输章节练习(2015-10-10)
- java初学者必读-经验总结
- 现金流量表中英文对照表
- 浙江省名校新高考研究联盟2012届第二次联考数学(文科)含答案
- 苏教版语文必修一二字音字形练习
- 物业公司内审不合格项整改措施验证报告
- 九年级化学人教版下册第十二单元课题二《化学元素与人体健康》课
- 旋流沉砂池的排砂系统设计
- 第5章 演示文稿软件PowerPoint 2000
- 房地产抵押登记申请表
- 09届高考化学第一次模拟考试
- 高一化学试卷分析