第十一章 非参数检验

更新时间:2024-01-06 04:31:02 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第十一章 非参数检验

前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。例如,两样本平均数比较的t检验和多个样本平均数比较的F检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验——非参数检验(non-parametric test)。非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。

非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为t检验的86.4%,就是说以相同概率判断出差异显著,t检验所需的样本个数要少13.6%。非参数检验内容很多,本章只介绍常用的符号检验(sign test),秩和检验(rank-sum test)和等级相关分析(rank correlation analysis)三种。

第一节 符号检验

一、配对资料的符号检验

(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的

正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正值用“+”表示,负值用“-”表示。可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均数,当分布对称时,中位数与平均数相等。

(二)配对资料符号检验的基本步骤

1、提出无效假设与备择假设

HO:甲、乙两处理差值d总体中位数=0; HA:甲、乙两处理差值d总体中位数≠0。

此时进行两尾检验。若将HA中的“≠”改为“<”或“>”,则进行一尾检验。

2、计算差值并赋予符号 求甲、乙两个处理的配对数据的差值d,d>0者记为“+”,

d<0者记为“-”,d=0记为“0”。统计“+”、“-”、“0”的个数,分别记为n?,n?,n0,令n?n??n?。检验的统计量为K,等于n?、n?中的较小者,即K?min{n?,n?}。

207

3、统计推断 由n查附表11符号检验用K临界值表(表中P(2)表示两尾概率,用于

两尾检验,P(1)表示一尾概率,用于一尾检验)得临界值K0.05(n),K0.01(n)。如果K>K0.05(n) ,P>0.05,则不能否定HO,表明两个试验处理差异不显著;如果K0.01(n) <K≤K0.05(n) ,0.01<P≤0.05,则否定HO,接受HA,表明两个试验处理差异显著;如果K≤K0.01(n),P≤0.01,则否定HO,接受HA,表明两个试验处理差异极显著(注意:当K恰好等于临界K值时,其确切概率常小于附表11中列出的相应概率)。

【例11.1】某研究测定了噪声刺激前后15头猪的心率,结果见表11-1。问噪声对猪的心率有无影响?

表11-1 猪噪声刺激前后的心率(次/分钟)

猪 号 1 2 3 4 5 6 7 8 9 刺激前 61 70 68 73 85 81 65 62 72 刺激后 75 79 85 77 84 87 88 76 74 差 值 -14 -9 -17 -4 1 -6 -23 -14 -2 符 号 - - - - + - - - -

这是一个配对资料两尾检验的问题。

10 84 81 3 +

11 76 85 -9 -

12 60 78 -18 -

13 80 88 -8 -

14 79 80 -1 -

15 71 84 -13 -

1、提出无效假设与备择假设

HO :噪声刺激前后猪的心率差值d总体中位数=0; HA :噪声刺激前后猪的心率差值d总体中位数≠0。

2、计算差值并赋予符号 噪声刺激前后的差值及符号列于表11-1第4行和第5行,

从而得n??2、n??13,n?n??n??2?13?15,K?min{n?,n?}?n??2。

3、统计推断 当n=15时,查附表11得临界值K0.05(15)=3,K0.01(15)=2,因为K=2= K0.01(15),

P≤0.01,表明噪声刺激对猪的心率影响极显著。

值得注意的是,虽然符号检验方法简单,但是,由于利用的信息较少,所以效率较低,且样本的配对数少于6时,不能检验出差别,在7—12时也不敏感,配对数在20以上时符号检验才较为有用。

二、样本中位数与总体中位数比较的符号检验

为了判断一个样本是否来自某已知中位数的总体,即样本所在总体的中位数是否等于某一已知总体的中位数,就需要进行样本中位数与总体中位数的差异显著性检验。其符号检验的基本步骤为:

1、提出无效假设与备择假设

HO:样本所在的总体中位数=已知总体中位数; HA:样本所在的总体中位数≠已知总体中位数。

此时进行两尾检验。如果将备择假设HA中的“≠”改为“<”或“>”,则进行一尾检验。

2、计算差值、确定符号及其个数 将样本各观测值中大于已知总体中位数者记为

“+”,小于者记为“-”,等于者记为“0”。统计“+”、 “-”、 “0” 的个数,分别记为

n?、n?、n0,令n?n??n?。假设检验的统计量K为n?、n?中的较小者,即K?min{n?,n?}。

3、统计推断 由n查附表11符号检验用K临界值表,得临界值K0.05(n),K0.01(n)。如

208

果K>K0.05(n) ,P>0.05,则不能否定HO,表明样本中位数与已知总体中位数差异不显著;如果K0.01(n) <K≤K0.05(n) ,0.01<P≤0.05,则否定HO,接受HA,表明样本中位数与已知总体中位数差异显著;如果K≤K0.01(n),P≤0.01,则否定HO,接受HA,表明样本中位数与已知总体中位数差异极显著。

【例11.2】已知某品种成年公黄牛胸围平均数为140厘米,今在某地随机抽取10头该品种成年公黄牛,测得一组胸围数字:128.1, 144.4, 150.3, 146.2, 140.6, 139.7, 134.1, 124.3, 147.9, 143.0(cm)。 问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异?

表11-2 成年公黄牛胸围测定值符号检验表 牛号 1 2 3 胸围 128.1 144.4 150.3 差值 -11.9 4.4 6.3 符号 - + + 4 146.2 6.2 +

5 140.6 0.6 +

6 7 8 9 139.7 134.1 124.3 147.9 -0.3 -5.9 -15.7 7.9 - - - +

10

143 3 +

1、提出无效假设与备择假设

HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。

2、计算差值、确定符号及其个数 样本各观测值与总体平均数的差值及其符号列

于表11-3,并由此得n??6,n??4, n?6?4?10,K?min{n?,n?}?n??4。

3、统计推断 由n=10,查附表11,得K0.05(10)=1,K>K0.05(10) ,P>0.05,不能否定

HO,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。

第二节 秩和检验

秩和检验也叫做符号秩和检验(signed rank-sum test),是一种经过改进的符号检验,或称Wilcoxon检验,其统计效率远较符号检验为高。因为它除了比较各对数据差值的符号外,还要比较各对数据差值大小的秩次高低。方法是通过将观测值按由小到大的次序排列,编定秩次,求出秩和进行假设检验。秩和检验与符号检验法不同,要求差数来自某些对称分布的总体,但并不要求每一差数来自相同的分布。

一、配对试验资料的符号秩和检验(Wilcoxon配对法)

(一)基本步骤

1、提出无效假设与备择假设

HO:差值d总体的中位数=0; HA:差值d总体的中位数≠0。

此时进行两尾检验。若将HA中的“≠”改为“<”或“>”,则进行一尾检验。

2、编秩次、定符号 先求配对数据的差值d,然后按d的绝对值从小到大编秩次。

再根据原差值正负在各秩次前标上正负号,若差值d=0,则舍去不记,若有若干个差值d的绝对值相等,则取其平均秩次。

209

3、确定统计量T 分别计算正秩次及负秩次的和,并以绝对值较小的秩和绝对值为

检验的统计量T。

4、统计推断 记正、负差值的总个数为n,根据n查附表10(1)符号秩和检验用T临

界值表,得T0.05(n),T0.01(n)。如果T>T0.05(n) ,P>0.05,则不能否定HO,表明两个试验处理差异不显著;如果T0.01(n) <T≤T0.05(n) ,0.01<P≤0.05,则否定HO,接受HA,表明两个试验处理差异显著;如果T≤T0.01(n),P≤0.01,则否定HO,接受HA,表明两个试验处理差异极显著(注意:当T恰好等于临界T值时,其确切概率常小于附表10(1)中列出的相应概率)。

【例11.3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系,先将大白鼠按性别、月龄、体重等配为10对,再把每对中的两只大白鼠随机分配到正常饲料组和维生素E缺乏饲料组,试验结束后测定大白鼠肝中维生素A的含量如表11-4。试检验两组大白鼠肝中维生素A的含量是否有显著差异。

表11-3 不同饲料鼠肝维生素A含量资料(国际单位/克) 1

正常饲料组 3550 维生素E缺乏组 2450

鼠对别 差值di 秩次

2 2000 2400 -400 -1

3 3100 3100 0

4 3000 1800 1200 +7

5 3950 3200 750 +3.5

6 3800 3250 550 +2

7 3620 3620 0

8 3750 2700 1050 +5

9 10 3450 3050 2700 1750 750 +3.5

1300 +8

1100 +6

1、提出无效假设与备择假设

HO:差值d总体的中位数=0; HA:差值d总体的中位数≠0。

2、编秩次、定符号 计算表11-3中配对数据差值di,将d =0的舍去,共有差值n=8

个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为750的有两个,它们的秩次为3和4,所以其平均秩次为(3+4)/2=3.5,结果见表11-3。

3、确定统计量T 此例,正号有7个,其秩次为2,3.5,3.5,5,6,7,8,秩次和

为:2+3.5+3.5+5+6+7=35;

负号只有1个,其秩次为1,秩次和等于1。 负号秩次和较小,所以T=1。

4、统计推断 由n=8查附表10(1)得, T0.05(8)=3,T0.01(n)=0,因为T0.01(8) <T<T0.05(8) ,0.01<P<0.05,否定HO,接受HA,表明两个试验处理差异显著。

二、非配对试验资料的秩和检验(Wilcoxon非配对法)

非配对试验资料的秩和检验是关于分别抽自两个总体的两个独立样本之间秩和的成组比较,它比配对资料的秩和检验的应用更为普遍。

(一)基本步骤

1、提出无效假设与备择假设

HO:甲样本所在的总体的中位数=乙样本所在的总体的中位数; HA:甲样本所在的总体的中位数≠乙样本所在的总体的中位数。

此时进行两尾检验。若将HA中的“≠”改为“<”或“>”,则进行一尾检验。

210

2、求两个样本合并数据的秩次 假设两个样本的含量分别为n1和n2,则将两样

本的观测值合并后,总的数据为n1+n2个。将合并后的数据按从小到大的顺序排列,与每个数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“n1+n2”。遇不同样本的相同观测值时,其秩次取原秩次的平均秩次,但是同一样本内遇相同的观测值时则不必求平均秩次,秩次孰先孰后都可以。

3、确定统计量T 将两个样本重新分开,并计算各自的秩和。将较小的那个样本

含量作为n1,其秩和作为检验的统计量T。若n1=n2,则任取一组的秩和为T。

4、统计推断 由n1、(n2–n1)查附表10(3),得接受区域T0'.05T0.05?T0.05'?T0.05,T0'.01?T0.01。若

T 在T0'.05?T0.05之内,P>0.05,则不能否定HO,表明两个试验处理差异不显著;若T在

之外但在T0'.01?T0.01之内,0.01<P≤0.05,则否定HO,接受HA,表明两个试验

处理差异显著;若T在T0'.01?T0.01之外,P<0.01,则否定HO,接受HA,表明两个试验处理差异极显著。

【例11.4】 研究两种不同能量水平饲料对5-6周龄肉仔鸡增重(克)的影响,资料如表11-4所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异?

表11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验 饲 料 高能量 秩 次 低能量 秩 次 603 12 489 3

585 8.5 457 1

598 11 512 4

肉仔鸡增重(g)

620 617 650 n1=6 14 13 15 T1=73.5 567 512 585 591 531 467 n2=9 7 5 8.5 10 6 2 T2=46.5

1、提出无效假设与备择假设

HO:高能量饲料增重总体的中位数=低能量饲料增重总体的中位数; HA:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数。

2、编秩次 将两组数据混合从小到大排列为秩次。在低能量组有两个“512”,不求

平均秩次,其秩次分别为4和5;在高、低两组有一对数据为“585”,需求它们的平均秩次:(8+9)/2=8.5。结果见表11-4。

3、确定统计量T 以较小样本的秩次和为统计量T,即T= 73.5。

'4、统计推断 由n1=6, n2-n1=9-6=3查附表10(3)得,T0.05?T0.05为31—65,T0.01?T0.01'为26—70。T=73.5在T0'.01?T0.01,即26—70之外,P<0.01, 否定HO,接受HA,表明饲料能量高低对肉仔鸡增重的影响差异极显著。

三、多个样本比较的秩和检验(Kruskal-Wallis法,H法)

多个样本比较的秩和检验的Kruskal-Wallis法,又称H检验法。该法的前提是假设抽样总体是连续的和相同的,利用多个样本的秩和来推断它们分别代表的总体之分布位置是否相同,检验的基本步骤是:

1、提出无效假设与备择假设

HO:各个样本所分别代表的各总体分布位置相同;

211

HA:各个样本所分别代表的各总体分布位置不完全相同。

2、编秩次、求秩和 将各个样本的所有观测值混合后,按照由小到大的顺序排成1,

2,?,n个秩次。不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求平均秩次。按样本把每个观测值的秩次一一相加,求出各样本的秩和。

3、求H值

H?12n(n?1)?Ri2ni?3(n?1) (11-1)

式中,Ri为第i个样本的秩次之和;

ni为第i个样本的含量;n=∑ni

4、统计推断 根据n, ni查附表10(2),得临界值:H0.05,H0.01。若H<H0.05,P>

0.05,不能否定HO,可以认为各样本代表的各总体分布位置相同;若H0.05≤H<H0.01, 0.01<P≤0.05,否定HO,接受HA,表明各样本所代表的各总体分布位置显著不同;若H≥H0.01, P≤0.01,表明各样本所代表的各总体分布位置极显著不同。

当样本数k>3,ni>5时,不能从附表10(2)中查得H值。这时H近似地呈自由度为k-1的?2分布,可对H进行?2检验。

当相同的秩次较多时,按(11-1)式计算的H值常常偏低,此时应按(11-2)式求校正的H值HC:

HC?H??1????(tn33j?tj)????n? (11-2)

式中,tj表示某个数重复的次数。

【例11.5】某试验研究三种不同制剂治疗钩虫的效果,用11只大白鼠做试验,分为三组。每只鼠先人工感染500条钩蚴,感染后第8天,三组分别给服用甲、乙、丙三种制剂,第10天全部解剖检查各鼠体内活虫数,试验结果如表11-5所示。试检验三种制剂杀灭钩虫的效果有无差异。

表11-7 三种制剂杀灭钩虫效果及秩和检验

制剂甲组(a) 活虫数 秩次 279 6 338 11 334 10 198 2 303 8 ni 5 Ri 37

制剂乙组(b) 活虫数 秩次 229 4 274 5 310 9

制剂丙组(c) 活虫数 秩次 210 3 285 7 117 1

3

18

3

11

1、提出无效假设与备择假设

HO:三种制剂活虫数总体分布位置相同; HA:三种制剂活虫数总体分布位置不完全相同。

2、编秩次、求秩和 三个组观测值混合后的秩次如表11-5所示,最后一行为各组

212

秩次之和。

3、求H值 由(11-1)式,得

222?12371811?H??(??)??3(11?1)?2.3811(11?1)533????

4、统计推断 当n=11, n1=5, n2=3, n3=3时,查附表10(2),得H0.05=5.65。因为H

<H0.05, P>0.05,不能否定HO,表明三种制剂杀灭钩虫的效果差异不显著。

【例11.6】对某种疾病采用一穴、二穴、三穴作针刺治疗,治疗效果分为控制、显效、有效、无效4级。治疗结果见表11-6第(2)、(3)、(4)栏。问3种针刺治疗方式疗效有无显著差异?

表11-6 3种针刺方式治疗效果及秩和检验

等 级 一穴 二穴 三穴 合计 秩次范围 平均秩次 ⑴ 控 制 显 效 有 效 无 效 合 计

⑵ 21 18 15 5

⑶ 30 10 8 2

⑷ 10 22 11 8 51 (n3)

⑸ 61 50 34 15 160 (n)

⑹ 1~61 62~111 112~145 146~160

⑺ 31.0 86.5 128.5 153.0

各组秩和 一穴 二穴 三穴 ⑻ ⑼ ⑽ 651.0 930.0 310.0 1557.0 865.0 1903.0 1927.5 1028.0 1413.5 765.0 306.0 1224.0 4900.5 3129.0 4850.5 (R1) (R2) (R3)

59 50

(n1) (n2)

1、提出无效假设与备择假设

HO:三种针刺方式治疗效果相同; HA:三种针刺方式治疗效果不完全相同。

2、编秩次、求秩和 秩次、秩和等的计算结果列于表11-6。其中的合计栏(5)=(2)

+(3)+(4)栏;秩次范围栏(6)为每一等级组应占的秩次;平均秩次栏(7),是因为同一组所包含的秩次同属一个等级,不能分列出高低,故一律以其平均秩次为代表,平均秩次等于各等级组秩次下限与上限之和的平均;各组秩和R1、R2、R3分别等于第(2)、(3)、(4)栏乘以第(7)栏所得第(8)、(9)、(10)栏各自的和。

3、求H值 因为各等级组段均以平均秩次作为代表,视为相同秩次,其相同秩次的

个数tj等于各自的秩次合计,见第(5)栏。显然相同秩次较多,宜用(11-2)式求HC。先按(11-1)式计算H值:

22?4900.523129.04850.5?H???160?(160?1)?595051?12???3?(160?1)?12.7293 ??而

??tj3?tj??(613?61)?(503?50)?(343?34)?(153?15)?39450 0于是利用(11-2)式,得:

HC?1?12.72933945001603?12.72930.9037?14.0858

?16022此试验处理数为3,所以df=3-1=2,查?值表得?0.01(2)?9.212。因为HC>?0.01(2),

213

P<0.01,表明3种针刺方式的治疗效果差异极显著。

四、多个样本两两比较的秩和检验(Nemenyi-Wilcoxson-Wilcox法)

当多组计量资料或等级资料经多个样本比较的秩和检验,认为各总体的分布位置不完全相同时,常需要进一步作两两比较的秩和检验,以推断哪两个总体的分布位置不同,哪两个总体分布位置并无不同。这个方法类似方差分析中的多重比较,常用q法:

q?Ri?RjSRi?Rj (11-3)

式中,SRi?Rj为秩和差异标准误,计算公式为:

SRi?Rj?n(nk)(nk?1)12 (11-4)

n为样本含量即处理的重复数;k为比较的两秩和差数范围内所包含的处理数。可见,这里的q法只适用于重复数相等的试验资料。

计算q值后,以df=∞和k查附表5,得临界值q?(?,k),作出统计推断。

【例11.7】 某种激素4种剂量对大白鼠耻骨间隙宽度增加量的影响试验,结果见表11-7。问4种剂量大白鼠耻骨间隙的增加量是否有显著差异?

表11-7 四种剂量大白鼠耻骨间隙增加量及秩和检验 剂 量 1 2 3 4 0.15 (1)

增加量(单位:mm)

0.30 (2)

0.40 (3)

0.40 (4) 1.50 (11) 2.00 (15)

0.50 (5) 1.90 (14) 2.20 (16.5) 2.30 (18)

1.20 (6.5) 1.35 (8) 1.40 (9.5) 2.50 (19.5) 1.20 (6.5) 1.40 (9.5)

Ri 15 49 67 79

1.80 (13) 1.60 (12) 2.50 (19.5) 2.20 (16.5)

1、提出无效假设与备择假设

HO:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置相同; HA:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置不全相同。

2、编秩次、求秩和 将四组观测值混合,由小到大编秩次,见表11-7括号内数字。

不同组的相同观测值取平均秩次,如第2、3组各有一个1.20,取它们原来秩次6和7的平均6.5,余此类推;同一组内相同观测值不求平均秩次。各组秩和见表11-7最后一栏。

3、求H值 因为本例有2个1.20,2个1.40,2个2.20,2个2.50 ,所以用(11-2)

式求校正HC。先按(11-2)式计算H。

222?152496779?H????20(20?1)?5555?12???3(20?1)?13.32 ??而

?(tj214

3?tj)?(23?2)?(23?2)?(23?2)?(23?2)?24

所以

HC?1?2013.32243?13.320.9970?13.36

?204、统计推断 本例k=4,超出附表10(2)的范围,故用?2值(附表7)进行统计

推断。当df=4-1=3时,查附表7,得?0.01(3)?11.34。因为HC>?0.01(3),P<0.01,表明用4种剂量的大白鼠耻骨间隙宽度的增加量差异极显著。

225、多个样本的两两比较 列出两两比较表(表11-8)。

表11-8 4种剂量大白鼠耻骨间隙宽度增加量秩和两两比较

比 较 (1) 1与4 1与3 1与2 2与4 2与3 3与4

差数Ri-Rj 秩次距k (2) 64 52 34 20 18 12

(3) 4 3 2 3 2 2

SRi?Rj

q值 (5) 4.84 5.20 5.02 2.00 2.66 1.77

临界q值 α=0.05 α=0.01 (6) (7) 3.63 4.40 3.32 4.12 2.77 3.64 3.32 4.12 2.77 3.64 2.77 3.64

检验结果 (8) ** ** ** ns ns ns

(4) 13.2288 10.0000 6.7700 10.0000 6.7700 6.7700

用表11-7中相应的秩和R栏求秩和差数Ri?Rj,见第(2)栏;确定秩次距k,例如1与4的比较,其秩和差数64范围内有4个处理,k=4;1与3的比较,其秩和差数52范围内有3个处理,k=3,余此类推,见第(3)栏。利用(11-4)式计算各秩和差异标准误SR?R:

ijk=4时, SR1?R4?5(5?4)(5?4?1)125(5?3)(5?3?1)125(5?2)(5?2?1)12?13.2288

k=3时, SR1?R3??10.0000

k=2时, SR1?R3??6.7700

见第(4)栏。用(11-3)式计算q值,即(2)/(4)得(5)栏。然后根据df=∞和k查临界q值,列于第(6)、(7)栏。当q<1者,差异必不显著,该行的临界q值不必列出。最后将各q值与相应的临界q值比较,作出统计推断。检验结果表明:第1种剂量与第2、3、4种剂量差异极显著;第2种剂量与第3、4种剂量,第3种剂量与第4种剂量差异不显著。

第三节 等级相关分析

215

第八章所述的相关、回归分析法适用于变量为正态分布的资料。在实际工作中,经常遇到有些资料并不呈正态分布。对于这样的资料的分析只能用非参数法。分析两个变量间是否相关的非参数法,最常用的是等级相关分析。

等级相关是一种分析x、y两个变量的等级间是否相关的方法。先按x、y两变量的大小次序,分别由小到大编上等级(秩次),再看两个变量的等级间是否相关。等级相关程度的大小和相关性质用等级相关系数(coefficient of rank correlation)表示。等级相关系数亦称为秩相关系数。样本等级相关系数记为rs,它是总体等级相关系数?S的估计值。等级相关系数rs具有与相关系数r相同的特性,它的值介于-1与1之间,rs为正表示正相关,rs为负表示负相关,rs等于零为零相关。常用的等级相关分析方法有Spearman等级相关和Kendall等级相关等,本节只介绍Spearman等级相关系数的计算及其显著性检验。其基本分析步骤是:

1、 计算等级相关系数rs 先将变量x、y分别由小到大列出等级,相邻两数相同时,取平均等级;再求出每对等级之差d,利用(11-5)式计算等级相关系数:

rs?1?6?d22n(n?1) (11-5)

式中,n为变量的对子数,d秩次之差。

当相同秩次较多时,会影响?d2值,应采用(11-6)式计算校正的等级相关系数rs:

'nrs?'3?36?(tx?ty)?3?d2 (11-6)

?????n?n??2tx?6?33??n?n???2ty??6??式中,tx、ty的计算公式相同,均为:?在计算ty时,ti为y变量的相同秩次数。

ti?ti12。在计算tx时,ti为x变量的相同秩次数;

2、rs的显著性检验

(1)提出无效假设与备择假设 HO:?S=0;HA:?S≠0

(2)统计推断 根据n查附表12,得临界rs(?)值。若rs<rs(0.05),P>0.05,不能否定HO,表明两变量x、y等级相关不显著;若rs(0.05)≤rs<rs(0.01),0.01<P≤0.05,否定HO,接受HA,表明两变量x、y等级相关显著;若rs≥rs(0.01),P≤0.01,否定HO,接受HA,表明两变量x、y等级相关极显著。

【例11.8】研究含有必需氨基酸添加剂的某种饲料的营养价值时,用大白鼠做试验获得了关于进食量(x)和增重(y)的数据,见表11-9。试分析大白鼠的进食量与增重之间有无相关。

表11-9 大白鼠进食量与增重结果及等级相关分析表

鼠 号

变量x

变量y

增重(g) 秩次

秩次差 秩次差平方 d

d2

进食量(g) 秩次

216

1 2 3 4 5 6 7 8 9 10

合 计

820 7.5 780 5 720 4 867 9 690 3 787 6 934 10 679 2 639 1 820 7.5

165 7 158 5.5 130 2 180 9 134 3 167 8 186 10 145 4 120 1 158 5.5

0.5 -0.5 2 0 0 -2 0 -2 0 2

0.25 0.25 4 0 0 4 0 4 0 4 16.5

1、计算等级相关系数rs 对表11-9中各个试验数据分别按进食量与增重从小到大,排列秩次,对数值相同的数据则取平均秩次,如进食量820克的平均秩次为(7+8)/2=7.5。求出进食量的秩次与增重的秩次之差d和秩次差平方d。利用(11-5)式,得

rs?1?6?d222

n(n?1)?1?6?16.510(102?1)?0.90

2、rs的显著性检验 此例n=10,查附表12,得rs(0.01)=0.794, 因为rs>rs(0.01),P<0.01,等级相关极显著,表明大白鼠的进食量与增重之间存在着极显著正相关。

【例11.9】某研究观察雌鼠的年龄(月)与所产仔鼠的初生重(克)之间的关系,得表11-10的结果,问仔鼠初生重与雌鼠年龄之间是否存在相关?

表11-10 雌鼠年龄和仔鼠初生重的等级相关分析表

编号 (1) 1 2 3 4 5 6 7 8 9 10 合计

雌鼠年龄(月)

(2) 12 7 4 9 7 2 9 5 8 4

仔鼠初生重(g) 年龄秩次 初生重秩次

(3) 19 13 8 8 13 14 12 10 12 11

(4) 10 5.5 2.5 8.5 5.5 1 8.5 4 7 2.5

(5) 10 7.5 1.5 1.5 7.5 9 5.5 3 5.5 4

秩次差(d) (6) 0 -2 1 7 -2 -8 3 1 1.5 -1.5

秩次差平方(d2)

(7) 0 4 1 49 4 64 9 1 2.25 2.25 136.5

1、计算等级相关系数rs 先确定或计算雌鼠年龄和仔鼠出生重两个变量的秩次、秩

次差、秩次差的平方,结果见表11-10第(4)、(5)、(6)、(7)栏。

本例年龄秩次有2个5.5,2个2.5,2个8.5;初生重秩次有2个7.5,2个1.5,2个5.5,相同的秩次较多,用校正公式(11-6)式计算等级相关系数。

先计算tx和ty,对于tx,t1=2,t2=2,t3=2;对于ty,t1=2,t2=2,t3=2:

tx?ti?ti123??(2?2)?(2?2)?(2?2)12333?1.5

217

ty??ti?ti123?(2?2)?(2?2)?(2?2)12333?1.5

于是:

10'rs3?3?36?(1.5?1.5)?136.5?326.6667(165?3)(165?3)?0.1646

?10?10??10?10???2?1.5???2?1.5?????66????2、rs'的显著性检验 此例n=10,查附表12,得rs(0.05)=0.648,rs'<rs(0.05),P>0.05,

表明雌鼠的年龄与仔鼠初生重相关不显著。

习 题

1、参数检验与非参数检验有何区别?各有什么优缺点?

2、为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?

3、两样本比较的秩和检验的检验假设是否可用?1??2表示?为什么?

4、今测定了10头猪进食前后血糖含量变化如下表,分别用配对资料的符号检验和秩和检验法检验进食后血糖的平均含量差异是否显著? 猪号 饲前 饲后

1 120 125

2 110 125

3 100 120

4 130 131

5 123 123

6 127 129

7 118 120

8 130 129

9 122 123

10 145 140

(符号检验 P>0.05,配对秩和检验 T=8.5,P>0.05)

5、已知某地正常人尿氟含量的中位数为0.86mg/L。今在该地某厂随机抽取12 名工人,测得尿氟含量如下:0.84,0.86,0.88,0.94,0.97,1.01,1.05,1.09,1.20,1.35,1.83(mg/L) 。问该厂工人的尿氟含量是否显著高于当地正常人?(K=1, P≤0.05)

6、将一种生物培养物以等量分别接种到两种综合培养基A和B上,共接种10瓶A培养基和15瓶B培养基。一周后计算培养壁上单位面积的生物培养物细胞平均贴壁数,获得试验数据如下: 培养基A 培养基B

254 331 483

140 257 396

193 478 245

153 339 403

316 407 390

473 396

389 144

257 357

167 287

147 568

试检验两种培养基的培养效果有无显著差异?(T=84.5, P>0.05)

7、将未达到性成熟的雌性大家鼠14只,随机分为三组,分别为5只、5只和4只,各组分别注射剂量为0.64μg/鼠 1.64μg/鼠和2.64μg/鼠的促性腺激素,每天一次,连续注射三天后将其杀死,取出卵巢称重。试验结果见下表: 处 理 (注射剂量μg/鼠)

I

(0.64μg /鼠)

16.5

卵 巢 重 量

(mg)

45.0 26.5 32.9 20.0

II

(1.64μg/鼠)

24.9 51.6 35.7 33.6 30.4

III

(2.64μg/鼠)

41.8 54.6 31.5 39.9

问三种不同剂量促性腺激素对大家鼠卵巢增重效果是否有差异?(H=3.21,P>0.05) 218

8、观察三个品种母猪乳头数得如下次数分布表。问三个品种母猪乳头数有无差异? 乳头数(个)

品种A

<12 13 14 15 16 17 >18

(HC=0.102, P>0.05)

9、四种抗菌素的抑菌效力比较研究,以细菌培养皿内抑菌区直径为指标,并获得如下结果: 平皿号

1 2 3 4 5

抗菌素Ⅰ

28 27 29 26 28

抗菌素Ⅱ

23 25 24 24 23

抗菌素Ⅲ

24 20 22 21 23

抗菌素Ⅳ

19 22 21 23 22

1 3 2 4 4 3 2

母猪数(头) 品种B

2 2 5 3 6 4 1

品种C

1 2 4 2 3 2 2

4 7 11 9 13 9 5 合 计

试检验四种抗菌素的抑菌效力有无显著差异?如果有显著差异,作两两比较。 (HC=14.534,P<0.01,两两比较只有第Ⅲ与第Ⅳ组差异不显著=

10、用最佳线性无偏预测(BLUP)法和相对育种值(RBV)法对12头肉牛种公牛的种用价值作评定,其评定结果排序如下。问两种评定方法是否显著相关?

序 号 BLUP法 RBV法

1 9号 9号

2 8号 8号

3 5号 4号

4

5

6

7 3号 6号

8 6号 3号

9

10

11 1号 1号

12 7号 7号

4号 10号 11号 5号 10号 11号

12号 2号 12号 2号

(rs?0.9860,P<0.01)

11、有甲乙二鉴定员,对7头贫乏饲养3周的大白鼠评定的等级如下表。问甲、乙两人评定结果是否相似? 序 号 甲 乙

1 4号 4号

2 1号 2号

3 6号 5号

4 5号 6号

5 3号 1号

6 2号 3号

7 7号 7号

(rs?0.8571, P<0.01)

219

本文来源:https://www.bwwdw.com/article/wtpx.html

Top