方差分析和试验设计

更新时间:2023-10-13 18:18:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

6方差分析与试验设计

在研究一个或多个分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中主要方法之一。检验多个总体均值是否相等的统计方法。

所要检验的对象称为因素。因素的不同表现称为水平。每个因子水平下得到的样本数据称为观测值。

随机误差:在同一行业(同一总体)下,样本的各观测值是不同的。抽样随机性造成。 系统误差:在不同一行业(不同一总体)下,样本的各观测值也是不同的。抽样随机性和行业本身造成的。

组内误差:衡量因素在同一行业(同一总体)下样本数据的误差。只包含随机误差。 组间误差:衡量因素在不同一行业(不同一总体)下样本数据的误差。包含随机误差、系统误差。

方差分析的三大假设:

每个总体服从正态分布;

每个总体的方差?必须相同; 观测值是独立的;

2

单因素方差分析(F分布)

数据结构:Xij表示第i个水平(总体)的第j个的观测值。(i列j行)

分析步骤:

u 2 ?? u i ???? 1提出假设。 H 0 : u 1 ? ? ? ? ? ? u k 自变量对因变量没有显著影响

H 1 : i , 2 ,? ? ?? , k ) 不完全相等 自变量对因变量有显著影响 u i(? 1 2构造检验的统计量

?计算因素各水平的均值X (各水平样本均值) ?计算全部观测值的总均值X (总体均值) ?计算误差平方和:

总误差平方和SST:全部观测值Xij与总平均值X得误差平方和。 SST???(Xij?X)

i?1j?1kni2 水平项误差平方和SSA:各组平均值X与总平均值X得误差平方和。组间平方和。 SSA???(Xi?X)

i?1j?1kni2 误差项平方和SSE:各样本数据与其组平均值误差的平方和。组内平方和。 SSE???(Xij?Xi)

i?1j?1kni2 SST=SSA+SSE ?计算统计量

各平方和除以它们对应的自由度,这一结果称为均方。

1

SST的自由度为(n-1),其中n为全部观测值的个数。 SSA的自由度为(k-1),其中k为因素水平的个数。(组数-1) SSE的自由度为(n-k)。

SSA的均方(组间均方)为MSA?组间平方和SSA?

自由度k?1组内平方和SSE?

自由度n?k SSE的均方(组内均方)为MSE? F?MSA~F(k?1,n?k) MSE 3统计决策

在给定的显著性水平α下,查表得临界值F (?k?1,n?k) 若F?F?,拒绝原假设H0,有显著影响; 若F?F?,接受原假设H0,无显著影响; 4方差分析表 A

1 2 3

4

5

误差来源 组间(因素来源) 组内(误差) 总和 B 平方和 SS SSA SSE SST C 自由度 df k-1 n-k n-1 D 均方 MS MSA MSE E F值 MSA/MSE F P值 G F临界值 方差分析中的多重比较(T分布)

检测哪些均值之间不相等?哪些行业之间?

最小显著差异方法LSD的检验步骤: 1提出假设,即H0:ui?uj,H1:ui?uj 2计算检验统计量|Xi?Xj| 3计算LSD,LSD?t?2MSE(11?)~t(n?k) ninj 4根据显著性水平α决策:如果|Xi?Xj|>LSD,拒绝原假设,反之接受。

双因素方差分析

1数据结构

R行因素共有k个水平 ; C列因素共有r个水平。 Xi?是行因素的第i个水平下各观测值的平均值。

2

X?j是列因素的第j个水平下各观测值的平均值。 X是全部kr个样本数据的总平均值。

2分析步骤

?提出假设:

对行因素提出假设:

H0:u1?u2?????ui??????uk 自变量对因变量没有显著影响

H 1 : u i ( i ? 1 ,2 , ? ? ) 不完全相等 自变量对因变量有显著影响 ?? ,k 对列因素提出假设:

H0:u1?u2?????uj??????ur 自变量对因变量没有显著影响

H : u ( j ? 1 ,2 ,? ? ?? , r ) 不完全相等 自变量对因变量有显著影响 1j ?构造检验的统计量:

总误差平方和SST:全部观测值Xij与总平均值X得误差平方和。 SST???(Xij?X)

i?1j?1krkr2 行误差平方和SSR:SSR???(Xi??X)

i?1j?1kr2 列误差平方和SSC:SSC???(X?j?X)

i?1j?12 随机误差项平方和SSE:SSE???(XIj?Xi??X?j?X)

i?1j?1kr2 SST=SSR+SSC+SSE ?计算均方:

总误差平方和SST的自由度为(kr-1)

行因素的误差平方和SSR的自由度为(k-1) 列因素的误差平方和SSC的自由度为(r-1) 随机误差平方和SSE的自由度为(k-1)*(r-1)

SSR k?1SSC 列因素均方MSC=

r?1 行因素均方MSR= 随机误差项的均方MSE=

SSE

(k?1)(r?1) 检验行因素对因变量的影响是否显著: FR?MSR~F[k?1,(k?1)(r?1)] MSEMSC~F[r?1,(k?1)(r?1)] MSE 检验列因素对因变量的影响是否显著: FC? ?统计决策:

根据给定的显著性水平α和两个自由度下,查表得出临界值F?,将F?和

3

FR、FC比较。

若FR>F?,拒绝原假设,有显著影响。 若FC>F?,拒绝原假设,有显著影响。 双因素方差分析表

1 2 3 4 5 A 误差来源 行因素 列因素 误差 总和 B 误差平方和 SS SSR SSC SSE SST C 自由度 df k-1 r-k (k-1)*(r-1) Kr- D 均方 MS MSR MSC MSE E F值 MSR/MSE MSC/MSE F P值 G F临界值 4

7相关与回归分析

相关关系与函数关系

当一个或几个相互联系的变量取一定数值时,与之相对应的另一个变量的值虽然不确定,但它仍然按某种规律在一定范围内变化,变量间的这种关系,被称为相关关系。

变量之间的函数关系和相关关系在一定条件下可以相互转化。 相关关系与函数关系的区别

函数关系是变量之间的一种严格、完全确定性的关系,即一个变量的数值完全由另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。

相关关系难以像函数关系那样,用数学公式去准确表达。 相关关系与函数关系的联系

由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相关关系表现出来。当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数关系。

为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。

相关系数的种类:

涉及变量的个数:单相关、复相关

表现形式的不同:线性相关、非线性相关 现象变化的方向:正相关、负相关

相关程度的不同:完全相关、不完全相关、不相关 相关关系的描述:相关表、相关图

相关系数:总体相关系数ρ,样本相关系数γ

1简单线性相关系数

?? 总体相关系数 样本相关系数??Cov(x,y)?Var(x)Var(y)?协方差?xy??(x?x)(y?y)n

?方差2LxyLxxLyy?n?xy??x?yn?x?(?x)22n?y?(?y)22

相关系数的特点:

1)相关系数的取值[-1,1]。

2)γ=0时,x、y没有线性相关系数。

3)0<|γ|<1,x、y存在一定线性相关系数;γ>0正相关,γ<0负相关。 4)|γ|=1,x、y完全线性相关系数;γ=1,完全正相关,γ=-1完全负相关。 使用相关系数分析相关关系时的注意:

1)x和y都是相互对称的随机变量,即?xy??yx。

2)相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。 3)相关系数只能反映变量间线性相关的程度,不能确定变量的因果关系。 4)相关系数受变量取值区间大小及观测值个数的影响较大。 相关系数检验:

5

本文来源:https://www.bwwdw.com/article/8c1f.html

Top