生物统计学复习资料

更新时间:2023-10-22 18:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

(逆袭版)版权所有 翻版必究

生物统计学复习资料(宁肯“错杀”“一切”!)

一、选择与填空

1、总体(研究的全部对象)分为无限总体和有限总体;构成总体的每个成员称为个体。

2、从总体中获得样品的过程称为抽样,抽样可以分为放回式抽样和非放回式抽样。

3、常见的连续性数据(与某种标准作比较所得到的数据)有:长度、时间、质量、OD值、血压值等。这类数据通常是非整数。

4、常见的离散型数据(由记录不同类别个体的数目所得到的的数据)如:动物的头数、种子的粒数、血液中不同类型的细胞的数目。这类数据全部是整数。 5、样本的几个特征数:平均数、标准差、偏斜度和峭度。

6、度量数据的变异程度的常用方法:范围(极差)、平均离差、标准离差(标准差)。

7、总体的特征数有:数学期望(对随机变量进行长期观测所得数据的平均数)、方差、各阶矩。

8、t分布中样本标准误差的公式为

s。t分布类似于正态分布,也是一种对称n分布,它只有一个参数,即自由度,t分布同样要求总体是正态的。

9、点估计(用由样本数据所计算出来的单个数值对总体参数所做的估计),一个好的估计量应该满足三个条件:无偏性、有效性、相容性。

10、无重复实验时的两因素方差分析的条件:两因素间是否有交互作用。 11、在一元线性回归检验中,?ei2称为误差平方和或剩余平方和,用SSE表示。

i?1n 1

(逆袭版)版权所有 翻版必究

12、实验设计的两个基本原则:重复和随机化(重复的两个意义:①只有设置重复才能得到实验误差的估计;②只有设置重复才能推断出处理效应) 13、上尾检验的条件:拒绝H0之后,接受HA:?>?0 14、下尾检验的条件:拒绝H0之后,接受HA:?

15、双侧检验的条件:无充分的依据断言?不可能大于?0或?不可能小于?0 16、实际上,一般情况是随机变量Y服从N(?,?2)。为了能够使用附表2求其分布函数值,必须经过标准化,即: U?Y???

经此变换后,Y的分布函数

P(Yt0.05

二、名词解释

1.标准差:样本中各数值与其平均数离差平方和的算术平均数的平方根,它反映

y???)=?(y???)

2MSE n了各数据的离散程度。其公式为s=

?(y?y)ii?1n2n?1。

s。y2.变异系数:衡量样本中各个观测值变异程度的一个统计量。其公式为CV=

变异系数可以说是用平均数标准化了的标准差,在比较两个平均数不同的样本时所得结果更可靠。

3.互不相容事件:如果两个事件A和B的交是不可能事件,则称A和B为互不相容事件。

4.自由度:独立观测值的个数。因为计算s时所使用的n个观测值受到平均数的

2

(逆袭版)版权所有 翻版必究

约束,这就等于有一个观测值不能独立取值,因此自由度df?n?1。

5.零假设:总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均数?等于某个给定的值?0,记为:H0:???0 6.备择假设:与零假设相对立的假设,记为HA

7.区间估计:只要标准化的样本平均数落在-?0.05(双侧)和?0.05(双侧)区间内,所有的

H0都将被接受,于是得到一个包含总体平均数的区间,用这种方法对总体参数

所做的估计称为区间估计。y-1.96限。

?n称为置信下限;y+1.96

?n称为置信上

8.方差分析:是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引申。

9.线性统计模型(单因素):

yij=???i??ij(i=1,2,3,...,a;j=1,2,3,...,n) 其中:yij是在第i水平下的第j次观测值;?是对所有观测值得一个参数,称为总平均数;?i是仅限于对第i次处理的一个参数,称为第i次处理效应。?ij是随机误差成分。

10.线性统计模型(两因素):

yijk????i??j?(??)ij??ijk(i=1,2,…,a;j,1,2,…,b;

k=1,2,…,n)

其中,?是总平均效应,?i是A因素第i水平的处理效应,?j是B因素第j水平的处理效应,(??)ij是在A因素第i水平和B因素第j水平的处理效应,?ijk是随机误差成分。

12.相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另

3

(逆袭版)版权所有 翻版必究

一个随机变量都有一个确定的分布与之对应,则称这两个随机变量间存在相关关系。如果对于变量X的每一个可能的值xi,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归关系,称X自变量,称Y因变量。 13.变换:将曲线化为直线,再按直线回归处理。 14.概率论:研究偶然现象本身规律性的学科。

15.统计学:基于实际观测结果,利用概率论得出规律,揭示偶然性中所寄予的必然性的学科。

16.生物统计学:一门探讨如何从不完整的信息中获取科学可靠的结论,从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的学科。 17.交互作用:一因子对另一因子的不同水准有不同的效果。

18.偏斜度(不考名词解释,但不代表不考):度量数据围绕众数呈不对称的程度。 三、解答题

1.简述编制连续性数据的频数表的一般步骤。

答:(1)从原始数据中找出最大值和最小值,并求出极差;

(2)决定划分的组数(50-100个数一般为7-10组;数据较多时一般为15-20组)。

(3)根据极差与划分的组数确定组限。 (4)在频数表中列出全部组限、组界及中值。 (5)将原始数据填入表中,计算各组的频数和频率。 2.几种常见的概率分布律 答:(1)二项分布

1)概念:描述随机现象的一种常用概率分布形式,因与二项式展开式相同而得

4

(逆袭版)版权所有 翻版必究

名。

2)应用条件(特点):每一种结果在每次试验中都有恒定的概率,试验之间是独立的。

(2)泊松分布

1)概念:在二项分布中,当某事件出现的概率特别小(??0),而样本含量又特别大(n??)且n???时,二项分布就变成泊松分布了。

2)特点:在概率函数内的?,不但是它的平均数,而且是它的方差。 (3)正态分布

1)概念:两头少,中间多,两侧对称,数据的这种分布规律称为正态分布。一般将?=0,?=1的正态分布称为标准正态分布,可表示为N(?,?2). 2)特点(密度曲线):?在?=0时,?(u)达到最大值。②当?不论向那个方向远离0时,因此?(u)的值都减小。e的指数都变成一个绝对值越来越来大的负数,③曲线两侧对称,即?(u)??(?u)。④曲线在u=-1和u=1处有两个拐点。⑤曲线下的面积等于1。⑥对于标准正态分布的累积分布函数?(u)的值,有编好的数值表。从表中方可以查出?(u)的值。其值等于标准正态曲线从-∞到u的一段曲线面积。该曲线下的面积表示随机变量U落入区间(-∞,0)的概率。⑦累积分布函数图形的特点:曲线在-∞处从0平稳上升,它关于点(0,0.5)中心对称。⑧=u-1.960到u=1.960 面积=0.9500;u=-2.576到u=2.576 面积=0.9900 3.中心极限定理

(1)概念:研究随机变量的极限分布是正态分布的一类定理,称为中心极限定理。简单叙述如下:假设被研究的随机变量Y可以表示为许多相互独立的随机变量Yi的和,如果Yi的数量很大,而且每一个别的Yi对于Y所起的作用又很小,则

5

本文来源:https://www.bwwdw.com/article/oa6f.html

Top