2019-2020年新编李春喜《生物统计学》第三版--课后作业答案

更新时间:2023-05-05 13:10:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《生物统计学》第三版课后作业答案

(李春喜、姜丽娜、邵云、王文林编著)

第一章概论(P7)

习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么?

答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。

(2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下

四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。

习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。

答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。

(2)个体(individual)是组成总体的基本单元。

(3)样本(sample)是从总体中抽出的若干个个体所构成的集合。

(4)样本容量(sample size)是指样本个体的数目。

(5)变量(variable)是相同性质的事物间表现差异性的某种特征。

(6)参数(parameter)是描述总体特征的数量。

(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。

(8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。

(9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。

(10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差

异,可以分为随机误差和系统误差。

(11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因

素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。

(12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不

一致所产生的倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。

(13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测

值与其真值接近的程度。

(14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测

值彼此接近程度的大小。

(15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡

量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小

来衡量。

0 / 43

1 / 43

习题1.3 误差与错误有何区别?

答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设

法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。

第二章 实验资料的整理与特征数的计算(P22、P23)

习题 2.1 什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有哪些?制表

和绘图时应注意些什么? 答:(1)对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其数值大小

列入各个相应的组别内,便可以出现一个有规律的表式,这种统计表称之为次数分布表。

(2)次数分布图是指把次数分布资料画成图状,包括条形图、饼图、直方图、多边形图和散点图。

(3)制表和绘图的基本步骤包括:①求全距;②确定组数和组距;③确定组限和组中值;④分组,编制次数分布表。

(4)制表和绘图时需要注意的是事先确定好全距、组数、组距、各组上下限,再按观测值的大小来归组。

习题2.2 算数平均数与加权数形式上有何不同?为什么说它们的实质是一致的?

答:(1)形式不同在于计算公式的不同:算数平均数的计算公式为M =n

x x x n +++...21; 加权平均数的计算公式为M =m

m m f f f f x f x f x ++++++......212211。 (2)因为它们反映的都是同一组数据的平均水平。

习题2.3 平均数与标准差在统计分析中有什么作用?它们各有哪些特性?

答:(1)平均数(mean)的用处:①平均数指出了一组数据资料内变量的中心位置,标志着资料

所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其它资料进行比较。

(2)平均数的特性:①离均差之和等于零;②离均差平方和为最小。

(3)标准差(standard deviation)的用处:①标准差的大小,受实验或调查资料中多个观测

值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小;②在计算标准差时,如果对各观测值加上火减去一个常数a,标准差不变;

如果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了a倍;③在正态分布中,一个样本变量的分布可以作如下估计:x±s内的观测值个数约占观测值总个数的68.26%,x±2s内的观测值个数约占总个数的95.49%,x±3s内的观测

值个数约占观测值总个数的99.73%。

(4)标准差的特性: ①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均

数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算;④进行平均数区间估计和变异系数的计算。

习题2.4 总统和样本的平均数、标准差有什么共同点?又有什么联系和区别?

答:(1)总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。

二者区别在于,总体平均数用μ表示,μ=

N x

,公式中分母为总体观测值的个数N,

样本平均数用x=

n x

,公式中的分分母为样本观测值的个数n。样本平均数x是总体平均数μ的无偏估计值。

(2)总体和样本的标准差都等于离均差的平方和除以样本容量。二者的区别在于,总体

标准差用σ表示,,分母上总体观测值的个数N;标准差用s

表示,

,分母上是样本自由度n-1。样本标准差s是总体标准差σ的无偏估计值。

2 / 43

3 / 43

习题2.5

答:见下图——

100例30-40岁健康男子血清总胆固醇(mol/L)的次数分布表

组限

(mol/L)

组中值(mol/L)

次数 频率 累积频率

2.60- 2.870 2 0.02 0.02

3.10- 3.370 8 0.08 0.10 3.60- 3.850 12 0.12 0.22

4.10- 4.375 24 0.24 0.46 4.60- 4.845 20 0.20 0.66

5.10- 5.325 18 0.18 0.84 5.60- 5.825 7 0.07 0.91

6.10- 6.345 8 0.08 0.99 6.60- 0.000 0 0.00 0.99

7.10-

7.220 1 0.01 1.00

习题2.6

答:见下图——

100例男子总胆固醇

7.25

7.00

6.75

6.50

6.25

6.00

5.75

5.50

5.25

5.00

4.75

4.50

4.25

4.00

3.75

3.50

3.25

3.00

2.75

100例男子总胆固醇

F r e q u e n c y

20

10

Std. Dev = .87 Mea n = 4.74

N = 100.00

这100例男子的血清总胆固醇基本呈正态分布,中间4.1-5.1mol/L 的最多,两边少,但

6.6-

7.1 mol/L 的没有。

4 / 43

习题2.7

答:见下图——

Stat is tic s

100例男子总胆固醇100

4.7389.086674.6600a

4.79b .8666

5.75108

.276.241.055.4784.522.707.22473.893.5850c 4.08334.20004.31004.49004.66004.85005.16005.21005.38505.9325

Va lid Miss ing

N

Mea n

Std. Error of M e an Median Mode

Std. Dev ia tion Va ria nce Skewne ss

Std. Error of Skewness Kurtosis

Std. Error of Kurtosis Range Minimum Max imum Sum

1020253040506070758090

Pe rcentile s

C alc ula ted from groupe d da ta.

a. Multiple modes ex ist. The smallest va lue is shown

b. Pe rcentile s are ca lculate d from grouped data.

c.

Descriptive Statistics

100 4.52

2.70

7.22

4.7389.0867

.86665

.751

100

100例男子总胆固醇

Valid N (listwise)

Statistic

Statistic

Statistic

Statistic

Statistic Std. Error Statistic Statistic

N Range Minimum Maximum Mean

Std.Deviation Variance

由上表可知:平均数μ=4.7389,标准差s=0.86665,而CV=s /μ* 100% =18%

习题2.8

答:由习题2.7的表可知:中位数Median=4.6600,平均数μ=4.7389,两数相差0.0789,符

合正态分布。

习题2.9

答:分析见下图:

5 / 43

Descriptive Statistics

10 4.00

20.0000.3944

1.24722

1.556

10

24号

Valid N (listwise)

Statistic

Statistic

Statistic Std. Error Statistic Statistic N Range Mean

Std.

Deviation Variance

Descriptive Statistics

1011.0020.0000 1.0750

3.39935

11.556

10

金皇后

Valid N (listwise)

Statistic

Statistic Statistic Std. Error Statistic Statistic N Range Mean

Std.

Deviation Variance

由上图可知:“24号”玉米的平均数Μ=20,标准差s=1.24722,而CV=s /Μ* 100% =6.24%;“金皇后”玉米的平均数Μ=20,标准差s=3.39935,而CV=s /Μ* 100% =17.00%,比较二者的变异系数CV ,“24号”玉米的的变异系数CV 比“金皇后”玉米的小得多,说明“24号”玉米的整齐度大于“金皇后”玉米。

习题2.10

答:分析见下图:

Descriptive Statistics

5025.00

53.00

42.4600.9865

6.97579

48.662

50

贻贝单养

Valid N (listwise)

Statistic

Statistic Statistic Statistic Std. Error Statistic Statistic N Minimum Maximum Mean

Std.

Deviation Variance

Descriptive Statistics

5039.0069.0052.1000.8959

6.33503

40.133

50

贻贝与海带混养Valid N (listwise)

Statistic

Statistic Statistic Statistic Std. Error Statistic Statistic N Minimum Maximum Mean

Std.

Deviation Variance

由上图可知,贻贝单养的平均数μ1=42.46,极差R 1=53-25=28.00,标准差s 1=6.97579,CV 1=s 1 /μ1 * 100% =16.43%;贻贝与海带混养的平均数μ2=52.10,极差R 1=69-39=30.00,标准差s 2=6.33503,CV 2=s 2 /μ2* 100% =12.16%,虽然单养的极

差较小(28),但贻贝与海带混养的平均数更大(52.10),且混养的变异系数更小,即其整齐度更有优势,由此得出,贻贝与海带混养的效果更好。

6 / 43

第三章 概率与概率分布(P48)

习题3.1 试解释必然事件、不可能事件和随机事件。举出几个随机事件例子。

答:(1)必然事件(certain event )是指在一定条件下必然出现的事件;相反,在一定条件下

必然不出现的事件叫不可能事件(impossible);而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件(random event)。

(2)例如,发育正常的鸡蛋,在39℃下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。

习题3.2 什么是互斥事件?什么是对立事件?什么是独立事件?试举例说明。

答:(1)事件A 和事件B 不能同时发生,即A ·B=V ,那么称事件A 和事件B 为互斥事件

(mutually exclusion event),如人的ABO 血型中,某个人血型可能是A 型、B 型、O 型、AB 型4中血型之一,但不可能既是A 型又是B 型。

(2)事件A 和事件B 必有一个发生,但二者不能同时发生即A+B=U,A ×B=V,则称事件A 与事件B 为对立事件(contrary event),如抛硬币时向上的一面不是正面就是反面。事件A 与事件B 的发生毫无关系。

(3)事件B 的发生与事件A 的发生毫无关系,则称事件A 与事件B 为独立事件(independent event),如第二胎生男生女与第一台生男生女毫无关系。

习题3.3 什么是频率?什么是概率?频率如何转化为概率?

答:(1)事件A 在n 次重复试验中发生了m 次,则比值m /n 称为事件A 发生的频率

(frequency),记为W(A)。

(2)事件A 在n 次重复试验中发生了m 次,当试验次数n 不断增加时,事件A 发生的频率W(A)就越来越接近某一确定值p ,则p 即为事件A 发生的概率(probability)。

(3)二者的关系是:当试验次数n 充分大时,频率转化为概率 。

习题 3.4 什么是正态分布?什么是标准正态分布?正态分布曲线有何特点?u 和δ 对正

态分布曲线有何影响?

答:(1)正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平

均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。

(2)μ=0,σ2=1的正态分布为标准正态分布,记为N(0,1)。

(3)正态分布具有以下特点:①正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,

f(x)取最大值πσ21

;②正态分布是以μ为中心向左右两侧对称的分布 ③σu x -的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x 轴为渐近线,x 的取值区间为(-∞,+∞); ④正态分布曲线完全由参数μ和σ来决定 ⑤正态分布曲线在x=μ±σ处各有一个拐点;⑥正态分布曲线与x 轴所围成的面积必定等于1。

(4)正态分布具有两个参数μ和σ,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;σ决定正态分布曲线的展开程度,σ越小曲线展开程度越小,曲线越陡,σ越大曲线展开程度越大,曲线越矮宽。

7 / 43

习题3.5

答:查附表1可得:

(1)P=(0.3<μ<1.8)=F(μ=1.8)-F(μ=0.3)=0.96407-0.6107=0.3533

(2)P=(-1<μ<1)=F(μ=1)-F(μ=-1)=0.8413-0.1587=0.6826

(3)P=(-2<μ<2)=F(μ=2)-F(μ=-2)=0.97725-0.02275=0.9545

(4)P=(-1.96<μ<1.96)=F(μ=1.96)-F(μ=-1.96)=0.97500-0.02500=0.9500

(5)P=(-2.58<μ<2.58)=F(μ=2.58)-F(μ=-2.58)=0.99506-0.00494=0.9901

习题3.6

解:因为x 服从μ=4,σ=4的正太分布N(4,16),故通过标准化转换公式u=σμ

-x 可转化为:

(1) P(-3

P=(-1.75<μ≤0)=F(μ=0)-F(μ=-1.75)=0.5000-0.04006=0.45994

(2) P(x<2.44)→→ P (μ<-0.39)

P=(μ<-0.39)= F(μ= -0.39)=0.6517

(3) P(x>-1.5)→→ P (μ>-1.375)≈P (μ>-1.38)

P=(μ>-1.38)=1-F(μ= -1.38)=1-0.08379=0.91621

(4) P(x ≥-1)→→ P (μ>-1.25)

P=(μ≥-1.25)=1-F(μ= -1.25)=1-0.1056=0.89440

习题3.7

解:(1) 根据基因分离定律和基因自由组合定律可知:F 1代非糯稻Ww 与糯稻ww 回交,F 2

代糯稻和非糯稻的概率均为1/2,其中糯稻有200*1/2=100株,非糯稻有200*1/2=100株。

(2) 糯稻为2000*1/4=500株,非糯稻为2000*3/4=1500株。

习题3.8

解:由题意可知这种遗传符合泊松分布,P=0.0036

(1) ∵, λ= np =200*0.0036=0.72,

∴P (1) =0.721*e -0.45 / 1!= 0.72* e -0.45 =0.4591

(2) 调查的株数n 应满足e -λ=e

-np =0.01 因此n =e p lg *01.0lg - =43429

.0*0036.0-2-≈1280 (株)

习题3.9

解:此题符合二项分布,n=5,p=0.425,q=1-0.425=0.575

故 “四死一生”的概率P(4)= C 4

5p 4q 1 = 5*0.425 4*0.5751 = 0.09378

习题3.10

解:设x服从这一正态分布。因为x服从μ=16,σ=2的正太分布N(16,4),故通过标准化

转换公式u=

σμ

-

x

可转化为:

(1) P(10

∵P=(-3<μ<2)=F(μ=2)-F(μ=-3)=0.97725-0.001350=0.97590

∴落于10到20间的数据的百分数为97.59%。

(2) P(x<12)或P(x>20)→→P(μ<-2) 或P(μ>2)

∵P1=(μ<-2)=F(μ=-2)=0.02275

P2=(μ>2)=1-F(μ=2)=1-0.97725=0.02275

∴P1 (μ<-2) 或P2 (μ>2)的总概率P=P1+ P2=0.02275+0.02275=0.04550

∴小于12或大于20的数据的百分数为4.55%。

习题3.11

解:(1)查附表3可知,当df =5时:

①P (t= 2.571)=0.05,故P (t≤-2.571)=0.05/2=0.025

②P (t= 4.032)=0.01,故P (t>4.032)=0.01/2=0.005

(2)查附表4可知,当df =2时:

①P (Xˉ= 0.05) =0.975,故P (Xˉ≤0.05) =0.975

②P (Xˉ= 5.99) =0.05,故P (Xˉ>5.99) =1-0.05=0.95

③∵P (Xˉ= 0.05) =0.975,故P Xˉ>0.05) = 1-0.975=0.025

P (Xˉ= 7.38) = 0.025,故P (Xˉ<7.38) =0.025

∴P (0.050.05)=0.025-0.025=0

(3)查附表5可知,当df1 =3,df2 =10时:

①P (F>3.71)=0.05

②P (F>6.55)=0.01

8 / 43

9 / 43

第四章 统计推断(P78-79)

习题4.1 什么是统计推断?统计推断有哪两种?其含义是什么?

答:(1)统计推断(statistical inference )是根据总体理论分布由一个样本或一系列样本所得的

结果来推断总体特征的过程。

(2)统计推断主要包括参数估计和假设检验两个方面。

(3)①假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两

种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的哪种假设的推断。

②参数估计则是由样本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计(point estimation )和区间估计(interval estimation )。

习题4.2 什么是小概率原理?它在假设检验中有什么作用?

答:(1)小概率原理(little probability)是指概率很小的事件在一次试验中被认为是几乎不可能

会发生的,一般统计学中常把概率概率小于0.05或0.01的事件作为小概率事件。

(2) 它是假设检验的依据,如果在无效假设H 0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H 0,否定H A ;如果某事件的概率小于0.05或0.01,说明无效假设不成立,则否定H 0,接受H A 。

习题4.3 假设检验中的两类错误是什么?如何才能少犯两类错误?

答:(1)在假设检验中如果H 0是真实的,检验后却否定了它,就犯了第一类错误,即α错误

或弃真错误;如果H 0不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。

(3) 假设检验中的两类错误是弃真错误和取伪错误。为了减少犯两类错误的概率要做到:①显著水平α的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。

习题4.4 什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系?

答:(1)区间估计(interval estimation)指根据一个样本的观测值给出总体参数的估计范围,给

出总体参数落在这一区间的概率。

(2)点估计(point estimation)是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。

(3)置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。

习题4.5

解:(1)①假设:o H o μμ=,即改变饵料后对虾体重无显著变化;

:A H o μμ≠,即改变饵料后对虾体重显著变化。

②由于置信度10.95P α=-=,确定显著水平0.05α=。

10 / 43

③计算统计量:

1.2

0.12100x n

σ

σ=

=

=

2021

8.3330.12

x

x u μ

σ--=

=

=-

④作出推断:由于

0.05 1.96

u

u =,否定

o

H ,接受

A

H 。认为改变饵料后对虾体重

显著变。

(2)鲜活与人工配饵料各半喂养方式对虾体重的点估计为:

20 1.960.12200.2352x L x u ασ=±=±?=±

(3)鲜活与人工配合饵料各半喂养方式下对虾体重的区间估计为:

1220 1.960.1219.7648

20 1.960.1220.2352

x x L x u L x u αασσ=-=-?==-=+?=

推断:认为采用鲜活与人工配合饵料各半喂养方式下对虾体重为19.7648~20.2352g ,

这个估计置信度为95%。

习题4.6

解: (1)假设H 0:该测定结果与常规枝条含氮量没有显著差异; H A :该测定结果与常规枝条含氮量有显著差异。 (2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 单样本T 检验得到如下结果:

One -Sample Statistics 10

.023920

.0006812

.0002154

枝条含氮量

N

Mean Std. Deviation

Std. E rror Mean

One -Sam ple Tes t

-.371

9

.719

-.000080

-.000567

.000407

枝条含氮量

t

df

Sig. (2-tailed)

Mean Difference Low er Upper 95% Confidence I nterval of the Difference Test Value = 0.0240

(4)作出推断:由上表可知 P=0.719>α=0.05 ,故接受原假设即接受H 0,否定H A 认为该测

定结果与常规枝条含氮量没有显著差异。

11 / 43

习题4.7

解:本题中,s 1=25.4,n 1=128,s 2=46.8,n 2=69 (1)假设

12

0:H μμ=,即三化螟两代每卵块的卵数没有显著差异;

12

:A H μμ≠,即三化螟两代每卵数有显著差异。

(2)确定显著性水平0.01α=。 (3)计算统计量:

065.669

8.461284.252222

2112

2

1

=+=+=

-n s n s s x x

551.4065

.69

.743.472

1

2

1

-=-=

--=

x

x x

x s u

(4)作出推断:因为

0.01 2.58

u

u =,否定

o

H ,接受

A

H 。认为三化螟两代每卵块的卵数

有极显著差异。

习题4.8

解: 首先作F 检验

(1)假设H 0:即北方、南方动物鸟翅长变异一样; H A :即北方、南方动物鸟翅长变异不一样。

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

Independent Samples Test

.355

.561

-.14713.886-.27 1.825-4.212 3.676-.144

10.953

.888

-.27

1.865

-4.374

3.838

Equal variances assumed Equal variances not assum ed

鸟翅长(mm)

F

Sig.Levene's Test for Equality of Variances

t df

Sig. (2-tailed)Mean

Difference Std. Error Difference

Low er Upper 95% Confidence Interval of the Difference t-test for Equality of M eans

(4)作出推断:由上表可知 P=0.561>α=0.05 ,故接受原假设即接受H 0,否定H A ,即

北方、南方动物鸟翅长具有同质性。

再进行平均值的检验:

(1)假设H 0:即北方、南方动物鸟翅长没有显著差异; H A :即北方、南方动物鸟翅长有显著差异。 (2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

12 / 43

Independent Samples Test

.355

.561

-.14713.886-.27 1.825-4.212 3.676-.144

10.953

.888

-.27

1.865

-4.374

3.838

Equal variances assumed Equal variances not assum ed

鸟翅长(mm)

F

Sig.Levene's Test for Equality of Variances

t df

Sig. (2-tailed)Mean

Difference Std. Error Difference

Low er Upper 95% Confidence Interval of the Difference t-test for Equality of M eans (4) 作出推断:由上表可知 P=0.886>α=0.05 ,故接受原假设即接受H 0,否定H A ,认为 北方、南方的动物鸟翅没有显著差异。

习题4.9

解:(1)假设H 0:即治疗前后血压没有显著差异; H A :即治疗前后血压有显著差异。

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 配对样本T 检验得到如下结果:

Paired Samples Statis tics 122.231315.902 4.410102.31

13

12.835

3.560

治疗前治疗后

P air 1

Mean

N

Std. Deviation

Std. E rror Mean

Paire d Samples Corre lations

13

.634

.020

治疗前 & 治疗后

P air 1

N

Correlation

Sig.

Paired Samples Test 19.92

12.599

3.494

12.31

27.54

5.701

12

.000

治疗前 - 治疗后

P air 1

Mean

Std. Deviation

Std. E rror Mean

Low er Upper 95% Confidence Interval of the Difference P aired Differences

t df

Sig. (2-tailed)

(4)作出推断:由上表可知:P 值为0.000 <α=0.05 ,故否定H 0,接受H A 认为中草药青

木香治疗高血压的效果达到极显著水平。

13 / 43

习题4.10

解:(1)假设H 0:即两种病毒的致病力没有显著差异; H A :即两种病毒的致病力有显著差异。 (2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 配对样本T 检验得到如下结果:

Paire d Samples Statis tics 15.0088.177 2.89111.00

8

4.957

1.753

病毒A 病毒B

P air 1

Mean

N

Std. Deviation

Std. Error Mean

Paired Samples Corre lations

8

.899

.002

病毒A & 病毒B

P air 1

N

Correlation

Sig.

Paired Samples Te st 4.00

4.309

1.524

.40

7.60

2.625

7

.034

病毒A - 病毒B

P air 1

Mean

Std. Deviation

Std. E rror Mean

Low er

Upper

95% Confidence I nterval of the Difference P aired Differences

t df

Sig. (2-tailed)

(4)作出推断:由上表可知:P=0.034 <α=0.05,故否定H 0,接受H A ;认为两种病毒的致

病力间的差异达到显著水平。

习题4.11

解:检验该批棉花种子是否合格

(1)假设H 0:P ≤0.8,即该批棉花种子不合格;

H A :P > 0.8,即该批棉花种子合格

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

Binom ial Te st

177.8.8

.261a,b

2

23.2100

1.0

Group 1Group 2Total

发芽情况(1=发芽;2=未发芽)

Category

N

Observed P rop.

Test Prop.Asym p. Sig.

(1-tailed)

Alternative hypothesis states that the proportion of cases in the first group < .8.

a. Based on Z Approximation.

b.

(4)作出推断:由上表可知 P=0.261 >α=0.05,故接受H 0,否定H A ;认为该批棉花种子

不合格。

14 / 43

习题4.12

解:(1)假设H 0:即两医院乳腺癌手术后5年的生存率间没有显著差异;

H A :即两医院乳腺癌手术后5年的生存率间有显著差异。

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

Group S tatistics

755 1.36.480.017383

1.33

.469

.024

1=甲医院;2=乙医院

12

1=生存;2=未生存

N Mean

Std. Dev iation

Std. Error Mean

Independent Samples Test

4.648

.031

1.0461136.296.03.030-.027.0901.053

782.415

.293

.03

.030

-.027

.089

Equal variances assumed Equal variances not assumed

1=生存;2=未生存

F

Sig.Levene's Test for Equality

of Variances

t df Sig. (2-tailed)

Mean Difference

Std. Error Difference

Lower Upper 95% Confidence Interval of

the Difference t-test for Equality of Means

(4)作出推断:由上表可知 P=0.296 >α=0.05,故接受H 0,否定H A ;即两医院乳腺癌手

术后5年的生存率间未达著差异。

习题4.13

解:(1)假设H 0:即两种饵料的方差相同;

H A :即两种饵料的方差不同

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

Inde pe nde nt Samples Te st

.471

.523

-11.5445.000-18.458 1.5990-22.5686-14.3481-10.902

3.466

.001

-18.458

1.6931

-23.4593

-13.4574

E qual variances assumed E qual variances not assum ed

鱼的体重增加量(g )

F

Sig.Levene's Test for E quality of Variances

t df

Sig. (2-tailed)

Mean Difference Std. E rror Difference

Low er Upper 95% Confidence I nterval of the Difference t-test for Equality of Means

(4)作出推断:由上表可知方齐次性检验中P=0.523 >α=0.05,故接受H 0,否定H A ;认

为两种饵料的方差具有同质性。

15 / 43

第五章 χ2 检验 (P89-90)

习题5.1 什么是χ2检验?什么情况下的假设检验? 答:(1)χ2检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。即根据样本的频数分布来推断总体的分布。它属于自由分布的非参数检验。它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。所

以,凡是可以应用比率进行检验的资料,都可以用χ2检验。

(2)χ2检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。

习题5.2 χ2检验的主要步骤有哪些?什么情况下需要进行连续性矫正?

答 :(1)χ2检验的步骤为:

①提出无效假设H 0:观测值与理论值的差异由抽样误差引起即观测值=理论值 备择假设H A :观测值与理论值的差值不等于0,即观测值≠理论值

②确定显著水平α一般可确定为0.05或0.01

③计算样本的χ2,求得各个理论次数E i ,并根据各实际次数O i ,代入公式,计算

出样本的χ2。

④进行统计推断。

(2)自由度1=df 时,2x 值需进行连续性矫正,矫正的2αx 为:

()∑=--=k i i i i E E O x 1225.0α

习题5.3

解:(1)H 0:野兔性别比例符合1:1的比例;

H A :野兔性别比例不符合1:1的比例;

(2)选择显著水平为0.05

(3)经SPSS 卡方分析得到如下结果: 性别(1=雄性;2=雌性)

5771.5-14.58671.514.5

1431

2

Total Obs erved N

E x pec ted N Residual

16 / 43

Tes t Statis tics

5.8811.015

Chi-Square a

df

Asy mp. Sig.性别(1=

雄性;2=

雌性)

0 c ells (.0%) have expected frequenc ies less than

5. The minimum ex pec ted cell f requenc y is 71.5.a.

(4)作出推断:由上表可知 P=0.015 <α=0.05,故否定H0,接受H A 认为野兔性别比例不符合1:1的比例。

习题5.4

解:(1)H 0:大麦F 2代芒性状表型的其比率符合9:3:4的理论比率;

H A :其比率不符合9:3:4的理论比率;

(2)选择显著水平为0.05

(3)经SPSS 卡方分析得到如下结果: 芒性状表型(1=钩芒;2=长芒;3=短芒)

348348.7-.7115116.4-1.4157154.8 2.26201

2

3

Total Obs erved N E x pected N Residual

Tes t Statis tics

.0492.976

Chi-Square a

df

A sy mp. Sig.芒性状表型

(1=钩芒;

2=长芒;3=

短芒)

0 c ells (.0%) have expected frequenc ies less than

5. The minimum ex pec ted cell f requenc y is 11

6.4.a.

(4)作出推断:由上表可知 P=0.976 >α=0.05,故接受H 0,否定H A ,认为大麦F2代芒性状表

型比率符合9:3:4的理论比率。

17 / 43

习题5.5

解:(1)H 0:这群儿童性别比合理;

H A :这群儿童性别比不合理;

(2)选择显著水平为0.05

(3)经SPSS 卡方分析得到如下结果: 性别(1=男孩;2=女孩)

421373.547.5326373.5-47.5

7471

2

Total Obs erved N E x pec ted N

Residual

Tes t Statis tics

12.0821.001

Chi-Square a

df

Asy mp. Sig.性别(1=

男孩;2=

女孩)

0 c ells (.0%) have expected frequenc ies less than

5. The minimum ex pec ted cell frequenc y is 373.5.a.

(4)作出推断:由上表可知 P=0.001<α=0.05,故否定H 0,接受H A ,认为这群儿童性别比不

合理。

习题5.6

解:(1)H 0:两种苹果的耐储性差异不显著;

H A :两种苹果的耐储性差异显著;

(2)选择显著水平为0.05;

(3)经SPSS 卡方分析得到如下结果:

品种(1=国光;2=品种) * 腐烂情况(1=腐烂;2=未

腐烂) Cros s tabulation

Count

1418620016162178303483781

2

品种(1=国光;2=品种)Total 1

2腐烂情况(1=腐烂;

2=未腐烂)

Total

18 / 43

(4)作出推断:由上表可知 P=0.274>α=0.05,所以接受H 0 ,否定H A ,即两种苹果的耐储

性差异未达显著。

习题5.7

解: (1)H 0:不同小麦品种与赤霉病的发生无显著关系;

H A :不同小麦品种与赤霉病的发生有显著关系; (2)选择显著水平为0.05;

(3)经SPSS 卡方分析得到如下结果

植株患病情况(1=健株;2=病株) * 小麦品种(1=A ;2=B ;3=C ;4=D ;5=E ) Cros s tabulation Count

442460478376494225078393529850500520

499

513

674

544

2750

12

植株患病情况(1=健株;2=病株)Total

1

2345小麦品种(1=A ;2=B ;3=C ;4=D ;5=E )Total

Chi-Square Te sts

420.671a

4

.000

379.6884.00032.7751

.000

2750

P earson C hi-Square Continuity Correction Likelihood Ratio Linear-by -Linear A ss ociation N of V alid Cas es

V alue

df

A sy m p. Sig.(2-s ided)

0 cells (.0%) hav e ex pec ted count less than 5. The

minimum ex pec ted count is 90.73.

a.

(4)作出推断:由上表可知 P 值为0.000<α=0.05,故否定H 0,接受H A ,说明不同小麦品

种与赤霉病的发生有极显著的关系。

Chi-Square Te sts

.510b 1.475.2741.601.509

1

.476

.568

.300

.5081

.476

378

P earson Chi-Square

Continuity Correction

a

Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases

Value

df

Asym p. Sig.(2-sided)

E xact Sig.(2-sided)E xact Sig.(1-sided)

Computed only for a 2x2 table

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.13.

b.

19 / 43

习题5.8

解: (1)H 0:灌溉方式与叶片衰老无关;

H A :灌溉方式与叶片衰老有关; (2)选择显著水平为0.05;

(3)经SPSS 卡方分析得到如下结果

灌溉方式(1=深水;2=浅水;3=湿润) * 稻叶情况(1=绿叶;2=黄

叶;3=枯叶) Cros s tabulation Count

146771601839132051521416182481

30

36

547

123灌溉方式(1=深水;2=浅水;3=湿润)

Total

1

2

3

稻叶情况(1=绿叶;2=黄叶;3=

枯叶)

Total

Chi-Square Te sts

5.622

a

4

.229

5.5354.2374.5101

.034

547

P earson C hi-Square Continuity Correction Likelihood Ratio Linear-by -Linear A ss ociation N of V alid Cas es

V alue

df

A sy m p. Sig.(2-s ided)

0 cells (.0%) hav e ex pec ted count less than 5. The minimum ex pec ted count is 8.78.

a.

(4)作出推断:由上表可知 P=0.229>α=0.05,故接受H 0,否定H A 说明水稻灌溉方式与叶片

衰老无关。

第六章方差分析(P128-129)

习题6.1 什么是方差分析?方差分析的基本思想是什么?进行方差分析一般有哪些步骤?答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。

(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效

应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。

(3)方差分析的基本步骤如下:

①将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。

②列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。

③若F检验显著,对个处理平均数进行多重比较。

习题6.2 什么是多重比较?多重比较有哪些方法?多重比较的结果如何表示?

答:(1)多个平均数两两间的相互比较称为多重比较。

(2)多重比较常用的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法),其中最

小显著极差法又有新复极差检验(SSR法)和q检验法。

(3)多重比较的结果常以标记字母法和梯形法表示。

①标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,

将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相

差显著的则标以字母b。再以该标有b的平均数为标准,与各个比它大的平均数

比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平

均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,

直至差异显著的平均数标以字母c,再与上面的平均数比较。如此重复进行,直

至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,

凡有一个相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。

差异极显著标记方法同上,用大写字母标记。

②梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差

数>LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差数的右上角标上

“*”号;差数>LSD(LSR)0.01,说明处理平均数间的差异达到极显著水平,在差

数的右上角标上“**”号。差数< LSD(LSR)0.05,说明差异不显著。

习题6.3 方差分析有哪些基本假定?为什么有些数据需经过转换后才能进行方差分析?答:(1)方差分析有3个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在3个基本假定的基础上的。

(2)在研究中会出现一些样本,其所来自的总体和方差分析的基本假定相抵触,这些数

据在进行方差分析之前必须经过适当的处理即数据转换来变更测量标尺。

20 / 43

本文来源:https://www.bwwdw.com/article/b1me.html

Top