生物统计学复习资料

更新时间：2023-10-22 18:59:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

生物统计学重点推荐度：
相关推荐

生物统计学复习资料（宁肯“错杀”“一切”！）

一、选择与填空

1、总体（研究的全部对象）分为无限总体和有限总体；构成总体的每个成员称为个体。

2、从总体中获得样品的过程称为抽样，抽样可以分为放回式抽样和非放回式抽样。

3、常见的连续性数据（与某种标准作比较所得到的数据）有：长度、时间、质量、OD值、血压值等。这类数据通常是非整数。

4、常见的离散型数据（由记录不同类别个体的数目所得到的的数据）如：动物的头数、种子的粒数、血液中不同类型的细胞的数目。这类数据全部是整数。 5、样本的几个特征数：平均数、标准差、偏斜度和峭度。

6、度量数据的变异程度的常用方法：范围（极差）、平均离差、标准离差（标准差）。

7、总体的特征数有：数学期望（对随机变量进行长期观测所得数据的平均数）、方差、各阶矩。

8、t分布中样本标准误差的公式为

s。t分布类似于正态分布，也是一种对称n分布，它只有一个参数，即自由度，t分布同样要求总体是正态的。

9、点估计（用由样本数据所计算出来的单个数值对总体参数所做的估计），一个好的估计量应该满足三个条件：无偏性、有效性、相容性。

10、无重复实验时的两因素方差分析的条件：两因素间是否有交互作用。 11、在一元线性回归检验中，?ei2称为误差平方和或剩余平方和，用SSE表示。

i?1n 1

12、实验设计的两个基本原则：重复和随机化（重复的两个意义：①只有设置重复才能得到实验误差的估计；②只有设置重复才能推断出处理效应） 13、上尾检验的条件：拒绝H0之后，接受HA:?>?0 14、下尾检验的条件：拒绝H0之后，接受HA:?

15、双侧检验的条件：无充分的依据断言?不可能大于?0或?不可能小于?0 16、实际上，一般情况是随机变量Y服从N(?,?2)。为了能够使用附表2求其分布函数值，必须经过标准化，即： U?Y???

经此变换后，Y的分布函数

P(Yt0.05

二、名词解释

1.标准差：样本中各数值与其平均数离差平方和的算术平均数的平方根，它反映

y???)=?(y???)

2MSE n了各数据的离散程度。其公式为s=

?(y?y)ii?1n2n?1。

s。y2.变异系数：衡量样本中各个观测值变异程度的一个统计量。其公式为CV=

变异系数可以说是用平均数标准化了的标准差，在比较两个平均数不同的样本时所得结果更可靠。

3.互不相容事件：如果两个事件A和B的交是不可能事件，则称A和B为互不相容事件。

4.自由度：独立观测值的个数。因为计算s时所使用的n个观测值受到平均数的

约束，这就等于有一个观测值不能独立取值，因此自由度df?n?1。

5.零假设：总体平均数是未知的，为了得到对总体平均数的推断，可以假设总体平均数?等于某个给定的值?0，记为：H0:???0 6.备择假设：与零假设相对立的假设，记为HA

7.区间估计：只要标准化的样本平均数落在-?0.05(双侧)和?0.05(双侧)区间内，所有的

H0都将被接受，于是得到一个包含总体平均数的区间，用这种方法对总体参数

所做的估计称为区间估计。y-1.96限。

?n称为置信下限；y+1.96

?n称为置信上

8.方差分析：是一类特定情况下的统计假设检验，或者说是平均数差异显著性检验的一种引申。

9.线性统计模型（单因素）：

yij=???i??ij（i=1,2,3，...，a；j=1,2,3，...，n）其中：yij是在第i水平下的第j次观测值；?是对所有观测值得一个参数，称为总平均数；?i是仅限于对第i次处理的一个参数，称为第i次处理效应。?ij是随机误差成分。

10.线性统计模型（两因素）：

yijk????i??j?(??)ij??ijk（i=1，2，…，a；j,1,2，…，b；

k=1,2，…，n）

其中，?是总平均效应，?i是A因素第i水平的处理效应，?j是B因素第j水平的处理效应，(??)ij是在A因素第i水平和B因素第j水平的处理效应，?ijk是随机误差成分。

12.相关：设有两个随机变量X和Y，对于任一随机变量的每一个可能的值，另

一个随机变量都有一个确定的分布与之对应，则称这两个随机变量间存在相关关系。如果对于变量X的每一个可能的值xi，都有随机变量Y的一个分布相对应，则称随机变量Y对变量X存在回归关系，称X自变量，称Y因变量。 13.变换：将曲线化为直线，再按直线回归处理。 14.概率论：研究偶然现象本身规律性的学科。

15.统计学：基于实际观测结果，利用概率论得出规律，揭示偶然性中所寄予的必然性的学科。

16.生物统计学：一门探讨如何从不完整的信息中获取科学可靠的结论，从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的学科。 17.交互作用：一因子对另一因子的不同水准有不同的效果。

18.偏斜度（不考名词解释，但不代表不考）：度量数据围绕众数呈不对称的程度。三、解答题

1.简述编制连续性数据的频数表的一般步骤。

答：（1）从原始数据中找出最大值和最小值，并求出极差；

（2）决定划分的组数（50-100个数一般为7-10组；数据较多时一般为15-20组）。

（3）根据极差与划分的组数确定组限。（4）在频数表中列出全部组限、组界及中值。（5）将原始数据填入表中，计算各组的频数和频率。 2.几种常见的概率分布律答：（1）二项分布

1）概念：描述随机现象的一种常用概率分布形式，因与二项式展开式相同而得

名。

2）应用条件（特点）：每一种结果在每次试验中都有恒定的概率，试验之间是独立的。

（2）泊松分布

1）概念：在二项分布中，当某事件出现的概率特别小(??0)，而样本含量又特别大(n??)且n???时，二项分布就变成泊松分布了。

2）特点：在概率函数内的?，不但是它的平均数，而且是它的方差。（3）正态分布

1）概念：两头少，中间多，两侧对称,数据的这种分布规律称为正态分布。一般将?=0，?=1的正态分布称为标准正态分布，可表示为N（?，?2）. 2）特点（密度曲线）：?在?=0时，?(u)达到最大值。②当?不论向那个方向远离0时，因此?(u)的值都减小。e的指数都变成一个绝对值越来越来大的负数，③曲线两侧对称，即?(u)??(?u)。④曲线在u=-1和u=1处有两个拐点。⑤曲线下的面积等于1。⑥对于标准正态分布的累积分布函数?(u)的值，有编好的数值表。从表中方可以查出?(u)的值。其值等于标准正态曲线从-∞到u的一段曲线面积。该曲线下的面积表示随机变量U落入区间（-∞，0）的概率。⑦累积分布函数图形的特点：曲线在-∞处从0平稳上升，它关于点（0,0.5）中心对称。⑧=u-1.960到u=1.960 面积=0.9500；u=-2.576到u=2.576 面积=0.9900 3.中心极限定理

（1）概念：研究随机变量的极限分布是正态分布的一类定理，称为中心极限定理。简单叙述如下：假设被研究的随机变量Y可以表示为许多相互独立的随机变量Yi的和，如果Yi的数量很大，而且每一个别的Yi对于Y所起的作用又很小，则

本文来源：https://www.bwwdw.com/article/oa6f.html

相关文章：

正在阅读：

生物统计学复习资料10-22

班车突发事件应急预案07-08

2018新人教版部编本二年级下册语文《语文园地三》名师教学设计11-15

浅谈建筑工程施工现场管理策略的优化08-05

资产评估期末综合复习题及答案(1-3)99901-22

湖北省企业安全生产标准化自评报告资料合规性检查表03-24

上一篇：混凝土期末复习题及答案下一篇：犬伤门诊配置建议书 - 图文