生物统计学考试总结(第1至7章)汇总 - 图文

更新时间:2023-10-10 14:04:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

生物统计学考试总结

第一章

生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法

统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相

关分析、协方差分析等

生物统计学的作用:

1. 提供整理、描述数据资料的科学方法并确定其特征 2. 判断试验结果的可靠性 3. 提供由样本推断总体的方法 4. 试验设计的原则

相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合

2.个体:组成总体的基本单元

3.样本:由总体中抽出的若干个体所构成的集合 n>30 大样本; n<30 小样本 4.参数:描述总体特征的数量 5.统计数:描述样本特征的数量

由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数

6..效应:由因素而引起试验差异的作用

7. 互作:两个或两个以上处理因素间的相互作用产生的效应 生物统计学的研究包括了两个过程: 1. 从总体抽取样本的过程——抽样过程

2. 从样本的统计数到总体参数的过程——统计推断过程

第二章

1.算术平均数:是所有观察值的和除以观察的个数

平均数(AVERAGE)

特性:(1)样本中各观测值与平均数之差-离均差-的总和等于零

(2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平

x以外的任何数值方和小,即离均差平方和最小 设 a 为

2.中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为

中位数,以Md表示

3.众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以Mo表示

4.几何平均数:资料中有n个观测值,其乘积开n次方所得的数值,以G表示。 5.极差(全距):样本数据资料中最大观测值与最小观测值的差值

R=max{x1,x2,…,xn} — mix{x1,x2,…,xn}

6.样本方差: 总体方差:

用n-1代替n作,可以避免偏小估计,从而实现样本方差对总体方差的无偏估计 在统计上,自由度(df =n-1 )是指样本内独立而能自由变动的观测值的个数 在计算其他统计数时,如果受到k个条件的限制,则其自由度为n-k

7.样本标准差: 总体标准差:

(1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大 (2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;如果乘以或除以一个常数a,则标准差扩大或者缩小a倍 STDEV: 基于给定样本的标准偏差

STDEVP:基于给定样本总体的标准偏差

8变异系数(CV):样本标准差除以样本的平均数,得到百分比

(1)变异系数是样本变量的相对变量,是不带单位的纯数 (2)用变异系数可以比较不同样本相对变异程度的大小

第三章

概率的计算法则:

(1)乘法定理:如果A和B为独立事件,则事件A和B同时发生的概率等于各自事件的概率的乘积 P(A?B)?P(A)?P(B)(2)加法定理:互斥事件A和B的和的概率等于事件A和事件B的概率之和

P(A?B)?P(A)?P(B)

加法定理推理1:

如果A1、A2、?An为n个互斥事件,则其和事件的概率为: P(A1+A2?An)=P(A1)+P(A2)+?+P(An)

加法定理:如果A和B是任何两件事件,则 P(A?B)?P(A)?P(B)?P(A?B)概率分布:

(1)离散型随机变量的概率分布 变量(x) 概率(P) x1 x2 x3 … xn p1 p2 p3 … pn P(x=xi)=pi (i=1,2,…, n)

R离散随机变量的方差 ?2??(xi??)2P(X?xi)

(2)连续型随机变量的概率分布 P?x?x?x??12i?1?x2x2f(x)dx连续型随机变量的概率分布

1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率

5. 用数学函数的形式和分布函数的形式来描述 概率密度函数:(1)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件

(2) ,f(x)不是概率

几种常见的概率分布:(适用范围,尾函数,自由度)

1. 二项分布的概率函数 记作B(n,p)或者B(n,π) (1)每次试验只有两个对立结果,分布记为A与 A ,它们出现的概率分布为p与q(q=1-p)

(2)试验具有重复性和独立性 i二项式分布的概率累积函数: F(x)?P(x)x?0

若随机变量x服从二项式分布,则有二项分布的总体平均数为 ?x?xip(xi)?np二项分布的总体标准差为: ??(xi??)2p?xi??npqx

?np?p二项成数(百分数)分布的平均数: ?p?x?nn

npqpq二项成数(百分数)分布的标准差: ???x??pnnn ???B(n, p) x n p

BINOMDIST number_s trials probability_s cumulative 实验成功次数 独立实验次数 一次实验中成功的概率 True: False: 例:假设年龄60~64岁的100名男性在1986年注射了一种新的流感疫苗而在第二年内死亡5人,这正常嘛?(注:1986年,60~64岁的男性老人第二年的死亡率约为0.02)

解:要知道100个男性的样本死亡5人是不是“异常”事件,这种估计的一个准则是寻找至少5人死亡的概率。

注:通常是把概率值为0.05或者更小的概率事件识别为异常(稀有事件)。

由于至少5人死亡的概率是0.05,可见100人中至少死亡5人是稍微有点异常,但不是很异常。

如果至少死亡10人,那么概率是3.44*10-5,这就很不正常,因而,在没有其他证据显示此疫苗有效前,应考虑停止使用。

2N(?,?)3. 正态分布(高斯分布)

?为总体平均数, ? 为总体标准差 正态分布的特征

x1. 当 ? ? 时,f(x)有最大值

2. 当 x ? ? 的绝对值相等的时候,f(x)值也相等 x??3. 当 的绝对值越大,f(x)值就越小,但永远不等于0

?4. 正态分布曲线完全由函数 ? 和 来决定

5. 正态分布曲线在 处各有一个拐点 6. 正态分布求和为0 x???? ? xi NORMDIST X Mean Standard_dev cumulative 函数值的区间点 算术平均值 标准差 True: 累积 False:概率密度函数值 标准正态分布:

??0,?2?1 xi u NORMSINV probability NORMSDIST Z u ?x???

标准正态分布的区间点 正态分布概率,介于0~1之间,含0,1

4. t分布:是小样本分布,小样本分布一般是指n<30。t分布适用于当总体标准差未知时用样本标准差代替总体标准差,由样本平均数推断总体平均数以及2个小样本之间差异的显著性检验等 P45

TDIST:返回自由度为n的t分布在x点处的单尾或者双尾概率。

TINV: 返回自由度为n的t分布的双尾概率分布函数的反函数.

TINV

Probability 双尾检验 t 分布的概率

Degrees_freedom 自由度

注意:1)TINV 返回 t 值,P(|X| > t) = probability,即P(|X| > t) = P(X < -t or X > t) 2)单尾 t 值可通过用两倍概率替换概率而求得 eg:如果概率为 0.05 而自由度为 10 , 双尾值由 TINV(0.05,10) 计算得到2.28139;

而同样概率和自由度的单尾值由 TINV(2*0.05,10) 计算得到 1.812462。

5.卡方分布 P45

本文来源:https://www.bwwdw.com/article/660f.html

Top