生物统计学复习题

更新时间:2024-05-25 10:28:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

生物统计学考试总结

第一章

生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。

内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法

统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协

方差分析等

生物统计学的作用:

1. 提供整理、描述数据资料的科学方法并确定其特征 2. 判断试验结果的可靠性 3. 提供由样本推断总体的方法 4. 试验设计的原则

相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合

2.个体:组成总体的基本单元

3.样本:由总体中抽出的若干个体所构成的集合 n>30 大样本; n<30 小样本 4.参数:描述总体特征的数量 5.统计数:描述样本特征的数量

由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数

6..效应:由因素而引起试验差异的作用

7. 互作:两个或两个以上处理因素间的相互作用产生的效应 生物统计学的研究包括了两个过程: 1. 从总体抽取样本的过程——抽样过程

2. 从样本的统计数到总体参数的过程——统计推断过程

第二章

1.算术平均数:是所有观察值的和除以观察的个数

平均数(AVERAGE)

特性:(1)样本中各观测值与平均数之差-离均差-的总和等于零

(2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即

以外的任何数值离均差平方和最小 设 a 为 x

2.中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以Md表示

3.众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以Mo表示 4.几何平均数:资料中有n个观测值,其乘积开n次方所得的数值,以G表示。 5.极差(全距):样本数据资料中最大观测值与最小观测值的差值

1

R=max{x1,x2,…,xn} — mix{x1,x2,…,xn}

6.样本方差: 总体方差:

用n-1代替n作,可以避免偏小估计,从而实现样本方差对总体方差的无偏估计 在统计上,自由度(df =n-1 )是指样本内独立而能自由变动的观测值的个数 在计算其他统计数时,如果受到k个条件的限制,则其自由度为n-k

7.样本标准差: 总体标准差:

(1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大

(2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;如果乘以或除以一个常数a,则标准差扩大或者缩小a倍 STDEV: 基于给定样本的标准偏差

STDEVP:基于给定样本总体的标准偏差

8变异系数(CV):样本标准差除以样本的平均数,得到百分比

(1)变异系数是样本变量的相对变量,是不带单位的纯数 (2)用变异系数可以比较不同样本相对变异程度的大小

第三章

概率的计算法则:

(1)乘法定理:如果A和B为独立事件,则事件A和B同时发生的概率等于各自事件的概率的乘积

P(A?B)?P(A)?(B)(2)加法定理:互斥事件A和BP的和的概率等于事件A和事件B的概率之和 P(A?B)?P(A)?P(B)

加法定理推理1:

如果A1、A2、?An为n个互斥事件,则其和事件的概率为: P(A1+A2?An)=P(A1)+P(A2)+?+P(An)

加法定理:如果A和B是任何两件事件,则 P(A?B)?P(A)?P(B)?P(A?B)概率分布:

(1)离散型随机变量的概率分布 变量(x) 概率(P) x1 x2 x3 … xn p1 p2 p3 … pn P(x=xi)=pi (i=1,2,…, n)

R离散随机变量的方差 ?2??(xi??)2P(X?xi)

x(2)连续型随机变量的概率分布 P?x?x?x??2f(x)dx12x2连续型随机变量的概率分布

1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率

5. 用数学函数的形式和分布函数的形式来描述 概率密度函数:(1)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件

i?1? 2

(2) ,f(x)不是概率 几种常见的概率分布:(适用范围,尾函数,自由度)

1. 二项分布的概率函数 记作B(n,p)或者B(n,π) (1)每次试验只有两个对立结果,分布记为A与 A ,它们出现的概率分布为p与q(q=1-p) (2)试验具有重复性和独立性 i二项式分布的概率累积函数: F(x)?P(x)x?0若随机变量x服从二项式分布,则有二项分布的总体平均数为 ?x?xip(xi)?np二项分布的总体标准差为: ??(xi??)2p?xi??npqx

?np?p二项成数(百分数)分布的平均数: ?p?x?nn

npqpq二项成数(百分数)分布的标准差: ???x??pnnn ???B(n, p) x n p

BINOMDIST number_s trials probability_s cumulative 实验成功次数 独立实验次数 一次实验中成功的概率 True: False: 例:假设年龄60~64岁的100名男性在1986年注射了一种新的流感疫苗而在第二年内死亡5人,这正常嘛?(注:1986年,60~64岁的男性老人第二年的死亡率约为0.02)

解:要知道100个男性的样本死亡5人是不是“异常”事件,这种估计的一个准则是寻找至少5人死亡的概率。

注:通常是把概率值为0.05或者更小的概率事件识别为异常(稀有事件)。 由于至少5人死亡的概率是0.05,可见100人中至少死亡5人是稍微有点异常,但不是很异常。

如果至少死亡10人,那么概率是3.44*10-5,这就很不正常,因而,在没有其他证据显示此疫苗有效前,应考虑停止使用。

2. 泊松分布

二项式分布中,如果p值很小而n值很大( p<0.1 和np<5 ),则泊松

分布

e ? ? ? x

P(x)?

x!式中: 为参数,?? ?np,x?0,1,2,...泊松分布的平均数、方差、标准差 ??? 2 x POISSON X mean cumulative ??????事件出现的次数 期望值 True: P(X?x)iFalse: P(X?xi) 3

例:假如我们研究乳腺癌的遗传敏感性。我们发现,母亲

曾患有乳腺癌的1000名40~49岁的妇女,在研究开始后的1年中,有4人患有乳腺癌,而我们从大总体中知道在这相同的时间内,1000人中有1个人发生乳腺癌。试问乳腺癌有没有敏感性? 解:如果用二项分布,则n=1000,p=1/1000,

BINOMDIST number_s Trials probability_s cumulative P(X?3) P(X?4) 3 1000 0.001 Ture 0.981 0.019 解:如果用泊松分布,则n=1000,p=1/1000, 则平均值 ? =1 POISSION x 3 mean 1 cumulative Ture P(X?3) P(X?4)0.981 0.019 则:这个事件是异常事件,则认为有乳腺癌的妇女,她们的子代具有遗传敏感性

23. 正态分布(高斯分布) N(?,?)?为总体平均数, ? 为总体标准差 正态分布的特征

x1. 当 ? ? 时,f(x)有最大值

2. 当 x ? ? 的绝对值相等的时候,f(x)值也相等 x??3. 当 的绝对值越大,f(x)值就越小,但永远不等于0

?4. 正态分布曲线完全由函数 ? 和 来决定

5. 正态分布曲线在 处各有一个拐点 6. 正态分布求和为0 x???? ? xi NORMDIST X Mean Standard_dev cumulative 函数值的区间点 算术平均值 标准差 True: 累积 False:概率密度函数值 标准正态分布:

??0,?2?1 xi u NORMSINV probability NORMSDIST Z u ?x???

标准正态分布的区间点 正态分布概率,介于0~1之间,含0,1

4. t分布:是小样本分布,小样本分布一般是指n<30。t分布适用于当总体标准差未知时用样本标准差

4

代替总体标准差,由样本平均数推断总体平均数以及2个小样本之间差异的显著性检验等 P45

TDIST:返回自由度为n的t分布在x点处的单尾或者双尾概率。

TINV: 返回自由度为n的t分布的双尾概率分布函数的反函数.

TINV

Probability

双尾学生 t 分布的概率

注意:1)TINV 返回 t 值,P(|X| > t) = probability,即P(|X| > t) = P(X < -t or X > t)

2)单尾 t 值可通过用两倍概率替换概率而求得

eg:如果概率为 0.05 而自由度为 10 ,

Degrees_freedom 自由度

双尾值由 TINV(0.05,10) 计算得到2.28139;

而同样概率和自由度的单尾值由 TINV(2*0.05,10) 计算得到 1.812462。

5

5.卡方分布 P45

6.F分布

6

1、概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者 2、非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者

3、配额抽样:选择一群特定数目、满足特定条件的被调查者

抽样分布:从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布

1. 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布 2. 是一种理论概率分布

3. 随机变量是 样本统计量——样本均值, 样本比例等 4 结果来自容量相同的所有可能样本

(符号)

7

样本平均数的基本性质:

(1)样本均值的均值(数学期望)等于总体均值?x??

?)??,则称?? 是? 的无偏估计 定义: 一个参数 ?的估计量是?? ,如果E(?

(2)样本均值的方差等于总体方差的1/n ??2x?2n

(3)样本平均数的标准误差的定义

(4)当总体服从正态分布N~(μ, σ)时,来自该总体的所有容量为n的样本的均值 也服从正态分X2

布, 的数学期望为σ2/n) Xμ,方差为σ/n。即 ~N(μ, X2

中心极限定理:设从均值为?,方差为? 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 两个独立样本平均数差数的分布 P44 第四章

假设检验:又称显著性检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假

8

设的推断。

如果抽样结果使小概率事件发生,则拒绝假设。 如果抽样结果没有使小概率事件发生,则接受假设 特点:(1)采用逻辑上的反证法(2)依据统计学上的小概率原理 生物统计学上,一般认为:等于或小于0.05或0.01的概率为小概率 在一次试验中,一个几乎不可能发生的事件发生的概率。

假设检验的步骤: 1、提出假设 2、确定适当的检验统计量

3、确定显著性水平a 4、计算概率 5、推断是否接受假设

两类:1)弃真错误;2)取伪错误

一.大样本平均数的假设检验——u检验 应用范围:1)总体方差 ? 已知

22

2)总体方差 ? 未知,但样本为大样本( n?30 ), 用s2来代替 ?

2

两个样本平均数比较的u检验

9

二、小样本平均数的假设检验——t检验 应用范围:

n ? 总体方差 ? 2 未知,且样本为小样本( 30 ), 采用t检验

当总体方差 ? 2 为未知时,当样本容量小于30,检验一个样本平均数 x 是否属于平均数为 的指

x??定总体,其 遵循自由度为df=n-1的t分布 ?0sxT分布的计算:

2、成组数据平均数比较的t 检验

成组数据资料是两个样本的各个变量从各自总体中抽取的,即两个抽样样本彼此独立。这样,不论两样本容量是否相同,所得数据皆为成组数据。

10

两个样本的总体方差相等,自由度df=n1+n2-2

两个样本的总体方差不相等,但抽样样本数相等,自由度df=n-1

3、成对数据平均数比较的t 检验

第五章

11

统计假设:H0:观测值与理论值的差异是由随机误差引起 HA:观测值与理论值之间有真实差异

所以卡方值是度量实际观测值与理论值偏南程度的一个统计量 卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大

卡方值为0,表明H0严格成立,且它不会有下侧否定区,只能进行右尾检验

连续性:由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离散型资料进行卡方检验计算的时,结果常常偏低,特别是当自由度df=1时,有较大偏差,为此需要进行矫正,当自由度df>1时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正

注意:要求各个组内的理论次数不小于5,如某组理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止

适合性检验(吻合性检验或拟合优度检验)步骤:

1. 提出无效假设,即认为观测值和理论值之间没有差异 2. 规定显著性水平 3. 计算样本卡方值

4. 根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较 独立性检验步骤:

1. 提出无效假设,即认为所观测的各属性之间没有关联 2. 规定显著性水平

3. 根据无效假设计算出理论数

4. 根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。 如果接受假设,则说明因子之间无相关联,是相互独立的 如果拒绝假设,则说明因子之间的关联是显著的,不独立

第六章

12

方差分析又称 F 检验 (F -test);方差分析是关于k(k≥3)个样本平均数的假设测验方法,是将总变异按照来源分为处理效应和试验误差,并做出其数量估计。

发现各变异原因在总变异中相对重要程度的一种统计分析方法。 总变异分解为组间变异和组内变异。

组内变异是个体差异所致,是抽样误差。

组间变异可能由两种原因所致,一是抽样误差;二是处理不同。

在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断 方差分析基本思想:

1、把k个总体当作一个整体看待

2、把观察值的总变异的平方和及自由度分解为不同来源的平方和及自由度 3、计算不同方差估计值的比值

4、检验各样本所属的平均数是否相等

? 实际上是观察值变异原因的数量分析 方差分析应用条件:

1、各样本须是相互独立的随机样本 2、各样本来自正态分布总体 3、各总体方差相等,即方差齐 方差分析基本用途:

1、多个样本平均数的比较 2、多个因素间的交互作用 3、回归方程的假设检验

SS 4、方差的同质性检验 处理间方差st2?tdft总平方和=处理间平方和+处理内平方和

SS总自由度=处理间自由度+处理内自由度 处理内方差se2?edfe统计假设的显著性检验——F检验:F检验的目的:推断处理间的差异是否存在

方差分析中的F检验总是单尾检验,而且为右尾检验

? F越大,越说明组间方差是主要方差来源,因子影响越显著;

? F越小,越说明随机方差是主要的方差来源, 因子的影响越不显著 F检验如果否定了H0,接受了HA,表明试验的总变异主要来源于处理间的变异 多重比较:多个平均数的相互比较

常用的:1、最小显著差数法(LSD法)

2、最小显著极差法(LSR法)—新复极差检验(SSR法)—q检验

13

总结:差异不显著标同一字母,差异显著标不同字母 最小显著极差法(LSR法)

? 把平均数的差异看成是平均数的极差(range)

? 根据极差范围内所包括的处理数(称为秩次距)k的不同,而采用不同的检验尺度叫做 最小显

著极差LSR

? 秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这两个平均数)包含的平

均数个数

? I类错误下降、工作量加大 新复极差法

q检验法

两因素方差分析:

互作:某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。互作效应实际是由于两个或多个试验因素的相互作用而产生的效应

根据对处理效应?i的不同假定,数学模型可分为:固定模型、随机模型和混合模型 14

采用EXCEL计算重复观测值的二因素方差分析: 1、数据输入区域必须有标题

2、直接分析结果仅适用用固定模型 第七章

相关系数的显著性检验

上述根据实际观测值计算得来的相关系数r是样本相关系数, 它是双变量正态总体中的总体相关系数ρ的估计值。样本相关系数r是否来自ρ≠0的总体,还须对样本相关系数r 进行显著性检验。 此 时 无 效 假 设、备 择 假 设 为HO:ρ=0,HA:ρ≠0。 与直线回归关系显著性检验一样,可采用t检验法

15

与F检验法对相关系数r的显著性进行检验。

曲线回归的相关指数R2:第八章

??2?y?y?2对于同一组实测数据,根据散点图的形状,可用若干相近的曲线拟合,同时建立若干曲线回归方程,然R?1?22

后根据R的大小和生物学等相关专业知识,选择即符合生物学规律,拟合度又较高的曲线回归方程来??y?y?描述两个变量间的曲线回归关系 第九章

样本容量的确定

第十章

实验设计的基本原则和作用

常用的试验设计的方法:1、对比设计2、随机区组设计3、裂区组设计4、正交设计 对比设计及其统计分析: 对比设计试验结果的统计分析:

16

分析步骤: 3、试验结论分析:对邻近CK的百分数越高(大于100%),就越可能优于对照,但绝不能认为超过100%的所有处理都显著地优于对照,因为将处理与相邻CK相比只是减少了误差,实际误差仍然存在,要 判断某个处理确实优于对照,一般至少要超过对照10%;凡仅超过对照5%的,均宜继续试验再做结论。 该判断方法由于不同试验的误差大小不同,仅是一种参考 随机区组设计及其统计分析: 设计方法:

1、将试验单位按性质不同分成与重复数一样多的区组; 2、每个区组内非试验相对一致,并随机排列一套试验处理;

3、不同区组间非试验因素允许有所不同,将不同重复也随机排列于各个区组

4、最终使区组内非试验因素差异最小,而区组间非试验因素差异最大,每个区组均包括全部处理 5、统计分析采用方差分析,将区组间误差分解出来,从而降低试验误差,提高试验精度

单因素随机区组: 把区组看作一个因素,和试验因素一起当作二因素试验,按照二因素无重复观察值的方差分析进行,主要做区组间、处理间和试验误差3个方面的方差分析 二因素随机区组:

裂区设计及其统计分析:

统计分析采用方差分析:

区组间、A因素、B因素、AB互作、主区误差和副区误差的方差分析 正交设计及其统计分析:

17

正交表:正交设计法中合理安排实验,并对数据进行统计分析的一种特殊表格。

正交设计的基本步骤:

(1)明确试验目的,确定试验指标

(2)挑选因素,选取水平,列出因素水平表 (3)选用正交表,进行表头设计

根据试验因素、水平数和是否需要估计因素间的相互作用来选择合适正交表。原则:能安排下全部试验因素,又要使部分试验的水平组合尽可能小。

各因素的水平数减1之和加1,即为所需的最少试验次数或处理组合数,若因素间有交互作用,需要再加上交互的作用的自由度。

? 表头设计就是将试验因素安排到所选正交表相应的列中。

表头设计原则:1、不要让主效应间,主效应与交互作用间有混杂现象;2、存在交互作用,查交互作用

(4)明确试验方案,进行试验,得到以试验指标形式表示的试验结果。 (5)对试验结果进行统计分析

通常采用两种方法:直观分析法、方差分析法。通过试验结果分析,可以得到因素主次顺序、最佳

水平组等有用信息。

(6)进行验证试验,做进一步分析。

第一章 概论

解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。

第二章 试验资料的整理与特征数的计算习题

18

2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇 (mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。

【答案】 =4.7398, s=0.866, CV =18.27 %

2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。

24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。

【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。

2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重 (kg) ,结果分别如下:

单养 50 绳重量数据: 45 , 45 , 33 , 53 , 36 , 45 , 42 , 43 , 29 , 25 , 47 , 50 , 43 , 49 , 36 , 30 , 39 , 44 , 35 , 38 , 46 , 51 , 42 , 38 , 51 , 45 , 41 , 51 , 50 , 47 , 44 , 43 , 46 , 55 , 42 , 27 , 42 , 35 , 46 , 53 , 32 , 41 , 48 , 50 , 51 , 46 , 41 , 34 , 44 , 46 ;

19

混养 50 绳重量数据: 51 , 48 , 58 , 42 , 55 , 48 , 48 , 54 , 39 , 58 , 50 , 54 , 53 , 44 , 45 , 50 , 51 , 57 , 43 , 67 , 48 , 44 , 58 , 57 , 46 , 57 , 50 , 48 , 41 , 62 , 51 , 58 , 48 , 53 , 47 , 57 , 51 , 53 , 48 , 64 , 52 , 59 , 55 , 57 , 48 , 69 , 52 , 54 , 53 , 50 。 试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。【答案】 1 =42 . 7, R=30, s 1 =7 . 078, CV 1 =16 . 58% ; 2 =52.1,R=30 , s 2 =6.335, CV 2 =12.16% 。 第三章 概率与概率分布

3.1 解释下列概念:互斥事件、对立事件、独立事件、频率、概率 ? 频率如何转化为概率 ? 

3.2 什么是正态分布 ? 什么是标准正态分布 ? 正态分布曲线有什么特点 ? μ和σ对正态分布曲线有何影响 ? 

3.3 已知 u 服从标准正态分布 N(0 , 1) ,试查表计算下列各小题的概率值: (1)P (0.3 < u ≤ 1.8) ; (2)P (-1 < u ≤ 1) ; (3)P (-2 < u ≤ 2) ; (4)P(-1.96 < u ≤ 1.96 ; (5)P(-2.58 < u ≤ 2.58) 。

【答案】 (1)0.34617 ; (2)0.6826 ; (3)0.9545 ; (4)0.95 ; (5)0.9901 。 3.4 设 x 服从正态分布 N(4 , 16) ,试通过标准化变换后查表计算下列各题的概率值: (1)P(-3 < x ≤ 4) ; (2)P(x < 2.44) ; (3)P(x > -1.5) ; (4)P(x ≥ -1) 。

【答案】 (1)0.4599 ; (2)0.3483 ; (3)0.9162 ; (4)0.8944 。

3.5 水稻糯和非糯为一对等位基因控制,糯稻纯合体为 ww ,非糯纯合体为 WW ,两个纯合亲本杂交后,其 F 1 为非糯杂合体 Ww 。

20

(1) 现以 F 1 回交于糯稻亲本,在后代 200 株中试问预期有多少株为糯稻,多少株为非糯稻 ? 试列出糯稻和非糯稻的概率;

(2 ) 当 F 1 代自交, F 2 代性状分离,其中 3/4 为非糯, 1/4 为糯稻。假定 F 2 代播种了 2000 株,试问糯稻株有多少 ? 非糯株有多少 ?

【答案】 (1) 糯稻 100 株,非糯 100 株,概率均为 0.5 ; (2) 糯稻 500 株,非糯 1500 株。

3.6 大麦的矮生抗锈基因和抗叶锈基因连锁,以矮生基因与正常感锈基因杂交,在 F 2 代出现纯合正常抗锈植株的概率仅 0.0036 。试计算: (1) 在 F 2 代种植 200 株时,正常抗锈植株的概率;

(2) 若希望有 0.99 的概率保证获得 1 株以上纯合正常抗锈植株,则 F 2 代至少应种植多少株 ? 【答案】 (1)P(0)=0.4867,P(1)=0.3504 ; P(2)=0.1262, P(3)=0.0303,P(4)=0.0055,

P(5)=0.0008,P(6)=0.0001 ; (2)1279 。

3.7 设以同性别、同月龄的小白鼠接种某种病菌,假定接种后经过一段时间生存的概率为 0.425 ,若 5 只一组进行随机抽样,试问其中“四生一死”的概率有多大 ? 【答案】 0.094 。

3.8 有一正态分布的平均数为 16 ,方差为 4 ,试计算: (1) 落于 10 到 20 之间的数据的百分数; (2) 小于 12 或大于 20 的数据的百分数。 【答案】 (1)97.59% ; (2)4.55% 。 3.9 查表计算:

(1) df=5 时, P(t ≤ -2.571)=? P(t > 4.032)=?  (2) df=2 时, P( 

(3) df 1= 3,df 2 =10 时, P(F > 3.71)=? P(F > 6.55)=? 【答案】 (1)P(t ≤ -2.571)=0.05 , P(t > 4.032)=0.99 ;

2 ≤ 0.05)=? P(

2 > 5.99)=? P(0.05 <

2 < 7.38 = =?

21

(2)P( 2 ≤ 0.05)=0.975 , P( =0.95 ;

2 > 5.99)=0.95 , P(0.05 < 2 < 7.38 =

(3)P(F > 3.71)=0.95 , P(F > 6.55)=0.99 。 第四章 统计推断

4.1 什么是统计推断 ? 统计推断有哪两种 ?  4.2 什么是小概率原理 ? 它在假设检验中有何作用 ? 

4.3 假设检验中的两类错误是什么 ? 如何才能少犯两类错误 ? 

4.4 什么叫区间估计 ? 什么叫点估计 ? 置信度与区间估计有什么关系 ? 

4.5 某养殖场以往都用鲜活饵料喂养对虾,经多年的观测资料得知,成虾平均体重为 21g ,标准差为 1.2g 。现改用鲜活与人工配合饵料各半喂养对虾,随机抽取成虾 100 尾,测得平均体重为 20g ,试问改变饵料后,对虾体重有无显著变化,并估计对虾体重的 95% 置信区间。

【答案】 u = - 8.33, 否定 H 0 :

=

0 =21g ,接受 H A :

0 ; 95% 置

信区间: (19.7648 , 20.2352) 。 4.6 核桃树枝条的常规含氮量为 2.40% ,现对一桃树新品种枝条的含氮量进行了 10 次测定,其结果为: 2.38% 、 2.38% 、 2.41% 、 2.50% 、 2.47% 、 2.41% 、 2.38% 、 2.26% 、 2.32% 、 2.41% ,试问该测定结果与常规枝条含氮量有无差别。

【答案】 t = - 0.371, 接受 H 0 :

=

0 =2.40% 。

4.7 检查三化螟各世代每卵块的卵数,检查第一代 128 个卵块,其平均数为 47.3 粒,标准差为 25.4 粒;检查第二代 69 个卵块,其平均数为 74.9 粒,标准差为 46.8 粒。试检验两代每卵块的卵数有无显著差异。 【答案】 u =-4.551, 否定 H 0 : 1 =

2 ,接受 H A :

1 ≠

2 。

4.8 假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长 (mm) 资料:北方的: 120 , 113 , 125 , 118 , 116 , 114 , 119 ;南方的: 116 , 117 , 121 , 114 , 116 , 118 , 123 , 120 。试检验这一假说。 【答案】 t = - 0.147, 接受 H 0 :

1 =

2 。

4.9 用中草药青木香治疗高血压,记录了 13 个病例,所测定的舒张压 (mmHg) 数据如下:

22

序号 1 2 3 4 5 6 7 8 9 10 11 12 13 治疗前 110 115 133 133 126 108 110 110 140 104 160 120 120 治疗后 90 116 101 103 110 88 92 104 126 86 114 88 112 试检验该药是否具有降低血压的作用。 【 答案】 t =5.701, 否定 H 0 : 1 =

2 ,接受 H A :

1 ≠

2 。

4.10 为测定 A 、 B 两种病毒对烟草的致病力,取 8 株烟草,每一株皆半叶接种 A 病毒,另半叶接种 B 病毒,以叶面出现枯斑病的多少作为致病力强弱的指标,得结果如下: 序号 1 病毒 A 9 病毒 B 10 2 17 11 3 31 18 4 18 14 5 7 6 6 8 7 7 20 17 8 10 5 试检验两种病毒的致病能力是否有显著差异。 【答案】 t =2.625, 否定 H 0 : 1 =

2 ,接受 H A :

1 ≠

2 。

4.11 有一批棉花种子,规定发芽率 p ≥ 80% 为合格,现随机抽取 100 粒进行发芽试验,有 77 粒发芽,试估计: (1) 该批棉花种子是否合格 ? (2) 该批棉花种子发芽率所属总体的 95% 置信区间。

【答案】 (1) u =0.625, 接受 H 0 : p ≤ p 0 ; (2)95% 置信区间: (0.7007 , 0.8393) 。

习题 4.12 调查了甲、乙两医院乳腺癌手术后 5 年的生存情况,甲医院共有 755 例,生存数为 485 人,乙医院共有 383 例,生存数为 257 人,问两医院乳腺癌手术后 5 年的生存率有无显著差别。

【答案】 u = - 0.958 ,接受 H 0 : p 1 = p 2 。

4.13 用三种不同的饵料喂养同一品种鱼,一段时间后,测得每小池鱼的体重增加量 (g) 如下: A 饵料: 130.5 , 128.9 , 133.8 ; B 饵料: 147.2 , 149.3 , 150.2 , 151.4 ; C 饵料: 190.4 , 185.3 , 188.4 , 190.6 。试检验各饵料间方差的同质性。 【答案】

2 =0.321 ,接受 H 0 :

=

=

。

4.14 工艺上要求棉纤维的断裂强度为 5.5g ,现对一新品系的断裂强度测定 8 次,得结果为: 5.5 , 4.4 , 4.9 , 5.4 , 5.3 , 5.3 , 5.6 , 5.1(g) 。问此新品系的断裂强度是否符合工艺要求 ? 试用符号检验法进行检验。

【答案】 P ( n + ≠ 4)=0.7255, 接受 H 0 : M d =5.5g 。

23

4.15 测定两个马铃薯品种的淀粉含量 (%) 各 5 次,得 A 品种为: 12.6 , 12.4 , 11.9 , 12.8 , 13.0 ; B 品种为: 13.4 , 13.1 , 13.5 , 12.7 , 13.6 。试用秩和检验法检验两品种淀粉含量的差异显著性。

【答案】 T =17 , T < T 1 =19 ,否定 H 0 ,接受 H A :两品种淀粉含量有显著差异。 第五章

检验

5.1 2 检验的主要步骤有哪些 ? 什么情况下需要进行连续性矫正 ? 

5.2 某林场狩猎得到 143 只野兔,其中雄性 57 只,雌性 86 只,试检验该种野兔的性别比例是否符合 1 ∶ 1?  【答案】

2 =5.483 ,否定 H 0 ,接受 H A :野兔性别比例不符合 1 ∶ 1 。

5.3 有一大麦杂交组合, F 2 代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为 348 , 115 , 157 。试检验其比率是否符合 9 ∶ 3 ∶ 4 的理论比率。 【答案】

2 =0.041 ,接受 H 0 :符合 9 ∶ 3 ∶ 4 的理论比率。

5.4 某乡 10 岁以下的 747 名儿童中有 421 名男孩,用 95% 的置信水平,估计这群儿童的性别比例是否合理 ?  【答案】

2 =11.828 ,否定 H 0 ,接受 H A :性别比例不合理。

5.5 某仓库调查不同品种苹果的耐贮情况,随机抽取“国光”苹果 200 个,腐烂 14 个,“红星”苹果 178 个,腐烂 16 个,试测试这两种苹果耐贮差异是否显著 ? 【答案】

2 =0.274 ,接受 H 0 :两种苹果耐性没有差异。

5.6 研究小麦品种感染赤霉病的情况 , 调查 5 个小麦品种感染赤霉病的情况如下表。试分析不同品种是否与赤霉病的发生有关。 品种 健株数 病株数 总计 【答案】

A 442 78 520 B 460 39 499 C 478 35 513 D 376 298 674 E 494 50 544 总和 2250 500 2750 2 =420.671 ,否定 H 0 ,接受 H A :品种与赤霉病的发生有极显著的关系。

24

5.7 用 A 、 B 、 C 三种浓度药物治疗 219 尾病鱼,试验结果如下表: 浓 度 A B C 总 计 治 愈 67 32 10 109 显 效 9 23 11 43 好 转 10 20 23 53 无 效 5 4 5 14 总 和 91 79 49 219 试检验三种浓度下药物治疗效果。 【答案】

2 = 36.463 ,否定 H 0 ,接受 H A :不同浓度的治疗效果有极其显著差异。

第六章 方差分析

6.1 什么是方差分析 ? 方差分析的基本思想是什么 ? 进行方差分析一般有哪些步骤 ?

6.2 方差分析有哪些基本假定 ? 为什么有些数据需经过转换后才能进行方差分析 ?  6.3 测定 4 种密度〔万株· (hm 2 ) -1 〕下 “ 金皇后 ” 玉米的千粒重 (g) 各 4 次 , 得下表结果 . 试作方差分析 , 并以 SSR 法作多重比较。

3 万株· (hm 2 ) -1 6 万株· (hm 2 ) -1 9 万株· (hm 2 ) -1 12 万株· (hm 2 ) -1 247 238 214 210 258 244 227 204 256 246 221 200 251 236 218 210 【答案】 F=69.76** , s =2.5166 。

6.4 为研究氟对种子发芽的影响,分别用 0 50

g · g -1 、 100

g · g -1 ( 对照 ) 、 10 g · g -1 、

g · g -1 4 种浓度的氟化钠溶液处理种子 ( 浸种 ) ,每浓

度处理的种子用培养皿进行发芽试验 ( 每盆 50 粒,每处理重复三次 ) ,测得芽长资料如下表。试作方差分析,并用 LSD 法、 SSR 法和 q 法分别进行多重比较。 处理 0 1 8.9 g · g -1  2 8.4 3 8.6 ( 对照 ) 25

6、在t 检验时,如果t = t0、01 ,此差异是: A、显著水平

B、极显著水平

C、无显著差异

D、没法判断

7、 生物统计中t检验常用来检验 A、两均数差异比较

B、两个数差异比较

C、两总体差异比较

D、多组数据差异比较

8、平均数是反映数据资料 性的代表值。 A、变异性

B、集中性

C、差异性

D、独立性

9、在假设检验中,是以 为前提。 A、 肯定假设

B、备择假设

C、 原假设

D、有效假设

10、抽取样本的基本首要原则是 A、统一性原则

B、随机性原则

C、完全性原则

D、重复性原则

11、统计学研究的事件属于 事件。 A、不可能事件

B、必然事件

C、小概率事件

D、随机事件

12、下列属于大样本的是 A、40

B、30

C、20

D、10

13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A、0.11

B、8.64

C、2.88

D、0.32

14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A、正比关系

B、反比关系

C、加减关系

D、没有关系

15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A、18

B、12

C、10

D、5

16、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A、9、1和8

B、1、8和9

C、8、1和9

D、 9、8和1

17、 观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为 A、偶然误差

B、系统误差

C、疏失误差

D、统计误差

18、下列那种措施是减少统计误差的主要方法。 A、提高准确度

B、提高精确度

C、减少样本容量

D、增加样本容量 D、F检验和X2-检验

19、相关系数显著性检验常用的方法是 A、t-检验和u-检验

B、t-检验和X2-检验 C、t-检验和F检验

C、X2-检验

20、判断整体中计数资料多种情况差异是否显著的统计方法是 A、t-检验 1、样本: 2、随机抽样:

36

B、F-检验 D、u-检验

三、 名词解释(每小题5分,共25分)

3、参数:

4、小概率事件原理:

四、 简答题(每小题10分,共30分)

1、请简述均数假设检验的基本步骤。

2、F检验与t检验的区别是什么?并写出t检验的步骤,F检验的步骤。

五、 计算题(每小题15分,共15分)

某车间用1台包装机装葡萄糖,额定标准为每袋净重0.5kg,包装机正常工作称糖服从正态分布,且根据长期经验知其标准方差?=0.015。某天,为检验包装机工作是否正常,随机抽取9包糖,检测它们的称重(单位:kg)平均值为:0.511。问这天包装机工作是否正常?(取α=0.05)

六、 填空题(每空1分,共10分)

1、显著性检验又称 ,是统计学的核心内容。 2、随机实验的每一个可能的结果称为 。

3、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 和

4、当随机变量的正态分布的μ=0,?= 时,正态分布就转化成标准正态分布。 5、数据资料按其性质不同各分为 资料和 资料两种。 6、小概率事件原理判定的基础是 。

7、试验设计的三大基本原则是设置重复、 和 。

七、 单项选择题(每小题1分,共20分)

题号 答案 题号 答案

1 11 2 12 3 13 4 14 5 15 6 16 7 17 8 18 9 19 10 20 1、在t 检验时,如果t = t0、01 ,此差异是: A、显著水平

B、极显著水平

C、无显著差异

D、没法判断

2、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A、9、1和8

B、1、8和9

C、8、1和9

D、 9、8和1

3、 观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为 A、偶然误差

B、系统误差

C、疏失误差

D、统计误差

4、 在均数假设检验中,当样本的个数大于30时,通常选择 检验。

37

A、 t-检验 B、u-检验 C、F-检验 D、都可以

5、 生物统计中t检验常用来检验 A、两均数差异比较

B、两个数差异比较

C、两总体差异比较

D、多组数据差异比较

6、百分数检验中,只有np和nq都大于 时,可用u或t检验。 A、 30

B、 20

C、 10

D、 5

7、 下面一组数据中属于计量资料的是 A、产品合格数

B、抽样的样品数

C、病人的治愈数

D、产品的合格率

8、平均数是反映数据资料 性的代表值。 A、变异性

B、集中性

C、差异性

D、独立性

9、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A、0.11

B、8.64

C、2.88

D、0.32

10、变异系数是衡量样本资料 程度的一个统计量。 A、变异

B、同一

C、集中

D、分布

11、在假设检验中,计算的检验统计量与事件发生的概率之间存在的关系是 。 A、正比关系

B、反比关系

C、加减关系

D、没有关系

12、下列那种措施是减少统计误差的主要方法。 A、提高准确度

B、提高精确度

C、减少样本容量

D、增加样本容量

13、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A、18

B、12

C、10

D、5

14、多重比较是对各个处理间的差异显著性检验的一种方法,它是对各处理的 间进行多重比较。 A、统计数

B、变数

C、F值

D、平均数

15、在X2检验中,当自由度为 时,需要对在X2检验的连续性进行矫正。 A、1

B、2

C、3

D、4

16、已回归方程的决定系是0.81,那么此回归方程的相关系数是 。B A、0.6561

B、0.9

C、0.59

D、0.81

17、下列数值属于参数的是: A、总体平均数

B、自变量

C、依变量

D、样本平均数

18、相关系数显著性检验常用的方法是 A、t-检验和u-检验

B、t-检验和X2-检验 C、t-检验和F检验

D、F检验和X2-检验

19、抽取样本的基本首要原则是

38

A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则

20、一组成组数据资料,每组具有10个观察值。该配对资料的自由度是 A、20

B、19

C、18

D、9

八、 名词解释(每小题5分,共25分)

1、总体: 2、统计量: 3随机误差: 4平均数:

九、 简答题(每小题10分,共30分)

1、请简述显著性检验的判定标准。

2、简述方差分析的基本步骤

十、 计算题(每小题15分,共15分)

为了确定大白鼠的血糖减少量y和胰岛素A注射剂量x之间的关系,对在相同条件下繁殖的10只大白鼠分别注射胰岛素A的不同剂量Xi后,测得各鼠血糖减少量Yi,数据如下。试建立血糖减少量(y)对胰岛素A注射剂量(x)的直线回归方程。

表 血糖减少量(y)与胰岛素A注射剂量(x)测定结果表 单位: g

胰岛素A剂量 0.20 血糖减少量

28

0.25 34

0.30 35

0.35 44

0.40 47

0.45 50

0.50 54

0.55 56

0.60 65

0.65 66

《生物统计学》答案

十一、 填空题(每空1分,共10分)

1、 因果关系 、 平行关系 2、 算术平均数 、 几何平均数 、 调和平均数 3、

S??(X?X)n?124、 某事件发生的概率很小,人为的认为不会发生 5、 0。6826 6、

自变量 、 依变量

十二、 单项选择题(每小题1分,共20分)

题号 答案 题号 答案 1 A 11 D 2 D 12 A 3 C 13 D 4 A 14 B 5 A 15 B 6 B 16 A 7 A 17 D 8 B 18 B 9 C 19 C 10 B 20 B 十三、 名词解释(每小题5分,共25分)

1、样本:在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。 2、随机抽样: 总体中每个个体均有相等的机会抽作样本的这种抽样方法。 3、参数:从总体中计算所得的用以描述总体特征的数值,称为参数。

4、概率事件原理:某事件发生的概率很小,人为地认为该事件不会出现,称为“小概率事件原理”。 四、简答题(每小题10分,共30分) 1、请简述均数假设检验的基本步骤。

第一步:提出假设:H0:x=x0(没有显著的差异);HA:x≠x0 (间有显著的差异);其中H0为原假设,HA

39

为备选假设。------------------------------------------------------ --------2分 第二步:根据题和需要,选取a值(a=0.05或者a=0.01) ----------- ----------4分 第三步:利用Excel自带公式或数据分析库计算概率值。-----------------8分 第四步:根据第三的计算结果,对题中的问题进行推断。----------------10分 2、检验与t检验的区别是什么?并写出t检验的步骤,F检验的步骤。

t检验和F检验均是平均数的差异显著性检验的两种方法,但前种方法仅是两个平均数的差异显著性检验,而后者是多个平均数差异显著性检验。

--------------------------------4分 t检验的步骤是:1.提出假设 2.构造统计量t

3.查表找出两个小概率的t值 4.判断

-------------------------------7分 F检验的步骤是:1。计算平方和与自由度

2.F值的计算 3.多重比较

--------------- ---10分 五、计算题(共15分)

1、某车间用1台包装机装葡萄糖,额定标准为每袋净重0.5kg,包装机正常工作称糖服从正态分布,且根据长期经验知其标准方差?=0.015。某天,为检验包装机工作是否正常,随机抽取9包糖,检测它们的称重(单位:kg)平均值为:0.511。问这天包装机工作是否正常?(取α=0.05) 解:1)设:H0:X0=X;(无显著差异,机器工作正常)

HA:X0≠X(有显著差异,机器工作不正常)------------- ------------2分 2)σx = 0.015÷3 = 0.005 ----------------------------------3分 3)u =(0.511-0.5)÷ 0.005 = 2.2 --------------------------4分 由于,u =2.2 > u0.05 = 1.96, --------------------------------------------------------5分 所以,检验的样本与标准之间有显著的差异,即该机器工作不正常。--------6分

十四、 填空题(每空1分,共10分)

1、 假设检验 2、 变数 3、 0.05 , 0.01 4、 1 5、 计数 , 计量 6、 原假设 7、 随机排列 , 局部控制

十五、 单项选择题(每小题1分,共20分)

题号 答案 题号 1 B 11 2 A 12 3 D 13 4 B 14 5 A 15 40

6 D 16 7 D 17 8 B 18 9 D 19 10 A 20

本文来源:https://www.bwwdw.com/article/3za7.html

Top