生物统计学复习资料
更新时间:2023-10-22 18:59:01 阅读量: 综合文库 文档下载
- 生物统计学重点推荐度:
- 相关推荐
(逆袭版)版权所有 翻版必究
生物统计学复习资料(宁肯“错杀”“一切”!)
一、选择与填空
1、总体(研究的全部对象)分为无限总体和有限总体;构成总体的每个成员称为个体。
2、从总体中获得样品的过程称为抽样,抽样可以分为放回式抽样和非放回式抽样。
3、常见的连续性数据(与某种标准作比较所得到的数据)有:长度、时间、质量、OD值、血压值等。这类数据通常是非整数。
4、常见的离散型数据(由记录不同类别个体的数目所得到的的数据)如:动物的头数、种子的粒数、血液中不同类型的细胞的数目。这类数据全部是整数。 5、样本的几个特征数:平均数、标准差、偏斜度和峭度。
6、度量数据的变异程度的常用方法:范围(极差)、平均离差、标准离差(标准差)。
7、总体的特征数有:数学期望(对随机变量进行长期观测所得数据的平均数)、方差、各阶矩。
8、t分布中样本标准误差的公式为
s。t分布类似于正态分布,也是一种对称n分布,它只有一个参数,即自由度,t分布同样要求总体是正态的。
9、点估计(用由样本数据所计算出来的单个数值对总体参数所做的估计),一个好的估计量应该满足三个条件:无偏性、有效性、相容性。
10、无重复实验时的两因素方差分析的条件:两因素间是否有交互作用。 11、在一元线性回归检验中,?ei2称为误差平方和或剩余平方和,用SSE表示。
i?1n 1
(逆袭版)版权所有 翻版必究
12、实验设计的两个基本原则:重复和随机化(重复的两个意义:①只有设置重复才能得到实验误差的估计;②只有设置重复才能推断出处理效应) 13、上尾检验的条件:拒绝H0之后,接受HA:?>?0 14、下尾检验的条件:拒绝H0之后,接受HA:?0
15、双侧检验的条件:无充分的依据断言?不可能大于?0或?不可能小于?0 16、实际上,一般情况是随机变量Y服从N(?,?2)。为了能够使用附表2求其分布函数值,必须经过标准化,即: U?Y???
经此变换后,Y的分布函数
P(Y
二、名词解释
1.标准差:样本中各数值与其平均数离差平方和的算术平均数的平方根,它反映
y???)=?(y???)
2MSE n了各数据的离散程度。其公式为s=
?(y?y)ii?1n2n?1。
s。y2.变异系数:衡量样本中各个观测值变异程度的一个统计量。其公式为CV=
变异系数可以说是用平均数标准化了的标准差,在比较两个平均数不同的样本时所得结果更可靠。
3.互不相容事件:如果两个事件A和B的交是不可能事件,则称A和B为互不相容事件。
4.自由度:独立观测值的个数。因为计算s时所使用的n个观测值受到平均数的
2
(逆袭版)版权所有 翻版必究
约束,这就等于有一个观测值不能独立取值,因此自由度df?n?1。
5.零假设:总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均数?等于某个给定的值?0,记为:H0:???0 6.备择假设:与零假设相对立的假设,记为HA
7.区间估计:只要标准化的样本平均数落在-?0.05(双侧)和?0.05(双侧)区间内,所有的
H0都将被接受,于是得到一个包含总体平均数的区间,用这种方法对总体参数
所做的估计称为区间估计。y-1.96限。
?n称为置信下限;y+1.96
?n称为置信上
8.方差分析:是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引申。
9.线性统计模型(单因素):
yij=???i??ij(i=1,2,3,...,a;j=1,2,3,...,n) 其中:yij是在第i水平下的第j次观测值;?是对所有观测值得一个参数,称为总平均数;?i是仅限于对第i次处理的一个参数,称为第i次处理效应。?ij是随机误差成分。
10.线性统计模型(两因素):
yijk????i??j?(??)ij??ijk(i=1,2,…,a;j,1,2,…,b;
k=1,2,…,n)
其中,?是总平均效应,?i是A因素第i水平的处理效应,?j是B因素第j水平的处理效应,(??)ij是在A因素第i水平和B因素第j水平的处理效应,?ijk是随机误差成分。
12.相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另
3
(逆袭版)版权所有 翻版必究
一个随机变量都有一个确定的分布与之对应,则称这两个随机变量间存在相关关系。如果对于变量X的每一个可能的值xi,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归关系,称X自变量,称Y因变量。 13.变换:将曲线化为直线,再按直线回归处理。 14.概率论:研究偶然现象本身规律性的学科。
15.统计学:基于实际观测结果,利用概率论得出规律,揭示偶然性中所寄予的必然性的学科。
16.生物统计学:一门探讨如何从不完整的信息中获取科学可靠的结论,从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的学科。 17.交互作用:一因子对另一因子的不同水准有不同的效果。
18.偏斜度(不考名词解释,但不代表不考):度量数据围绕众数呈不对称的程度。 三、解答题
1.简述编制连续性数据的频数表的一般步骤。
答:(1)从原始数据中找出最大值和最小值,并求出极差;
(2)决定划分的组数(50-100个数一般为7-10组;数据较多时一般为15-20组)。
(3)根据极差与划分的组数确定组限。 (4)在频数表中列出全部组限、组界及中值。 (5)将原始数据填入表中,计算各组的频数和频率。 2.几种常见的概率分布律 答:(1)二项分布
1)概念:描述随机现象的一种常用概率分布形式,因与二项式展开式相同而得
4
(逆袭版)版权所有 翻版必究
名。
2)应用条件(特点):每一种结果在每次试验中都有恒定的概率,试验之间是独立的。
(2)泊松分布
1)概念:在二项分布中,当某事件出现的概率特别小(??0),而样本含量又特别大(n??)且n???时,二项分布就变成泊松分布了。
2)特点:在概率函数内的?,不但是它的平均数,而且是它的方差。 (3)正态分布
1)概念:两头少,中间多,两侧对称,数据的这种分布规律称为正态分布。一般将?=0,?=1的正态分布称为标准正态分布,可表示为N(?,?2). 2)特点(密度曲线):?在?=0时,?(u)达到最大值。②当?不论向那个方向远离0时,因此?(u)的值都减小。e的指数都变成一个绝对值越来越来大的负数,③曲线两侧对称,即?(u)??(?u)。④曲线在u=-1和u=1处有两个拐点。⑤曲线下的面积等于1。⑥对于标准正态分布的累积分布函数?(u)的值,有编好的数值表。从表中方可以查出?(u)的值。其值等于标准正态曲线从-∞到u的一段曲线面积。该曲线下的面积表示随机变量U落入区间(-∞,0)的概率。⑦累积分布函数图形的特点:曲线在-∞处从0平稳上升,它关于点(0,0.5)中心对称。⑧=u-1.960到u=1.960 面积=0.9500;u=-2.576到u=2.576 面积=0.9900 3.中心极限定理
(1)概念:研究随机变量的极限分布是正态分布的一类定理,称为中心极限定理。简单叙述如下:假设被研究的随机变量Y可以表示为许多相互独立的随机变量Yi的和,如果Yi的数量很大,而且每一个别的Yi对于Y所起的作用又很小,则
5
正在阅读:
生物统计学复习资料10-22
班车突发事件应急预案07-08
2018新人教版部编本二年级下册语文《语文园地三》名师教学设计11-15
浅谈建筑工程施工现场管理策略的优化08-05
中国百鬼录2 - 图文06-21
随笔散文:上了名校又如何11-20
求职个人简历模板 - 副本08-27
我的梦-随笔散文11-20
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 复习资料
- 统计学
- 生物
- 可视化建模与UML习题集
- 河北省教育学会学校文化研究分会召开第四届学术年会的 通知
- CCIE V5.0 TS 之 MPLS VPN网络Traceroute问题分析
- 《医患沟通学》试题及答案范文
- 燃气轮机的保护定值 - 图文
- 顾客财产控制程序7.5.4
- 店铺服装视觉营销的基础和方式方法 - 图文
- 中考誓师动员大会主持稿三篇
- 火电厂煤种的混配
- 第五章,成本
- 光学材料折射率的测定
- PB 编码规范
- 2013年中考英语仿真模拟试卷
- 生物统计学 第四版 李春喜课后习题答案
- 2013年下半年合同管理实务知识模拟题及答案(高级)
- 浅谈乡镇环境的问题及其治理
- 漆安慎 杜禅英 力学习题及答案06章
- 2018-2019苏教版语文五年级上册期末测试题(2套,有答案)
- 微处理器系统设计
- 作文起步