生物统计学笔记 - 图文
更新时间:2024-05-05 18:06:01 阅读量: 综合文库 文档下载
- 生物统计学笔记图片推荐度:
- 相关推荐
Statisticsis the introduction of mathematical language into specific fields of scienc. It is an art and science for collecting, analyzing, showing and interpreting data.
Sources of randomness
The problem involves a large number of data, can not be fully studied, can only be used in a \
The random error of the experiment, that is, the error caused by the uncontrolled, unrecongnized factors in the test process.
Two major factions Classical
The probability of an event can be explained by a large number of repeated experiments, and this explanation does not depend on the cognitive body. Bayes
Any inference of the parameters is necessary and can only be based on the posterior distribution of parameters.
Common statistical terms Population: Individual:
Sample:a set of individuals drawn from a population is called a sample. Each individual that makes up a sample is called a sample unit.
The number of individuals included in the sample is called sample size or sample sizes, and the sample capacity is often recorded as n.
Generally in biological research, n<=30 samples are usually called small samples.the calculation and analysis of some statics between small and big samples are different.
The basic characterstic of statistical analysis is to infer the whole by sample.
Variables and constants
Deviation and error Deviation:
random error: sampling error systematic error: lopsoded error
2018年3月5日 18:26
第一章 绪论 (2学时)
主要内容:介绍课程的性质、内容和考核方式;了解生物统计学的发展历史和基本概念;通过具体实例说明生物体中随机现象的普遍性。 重点和难点:让学生认识到随机性在生命系统中具有普遍性。 1. 生物统计发展历史
2. 生物体中随机现象的普遍性
第二章:试验·与特征数的计算 (2学时)
主要内容:试验资料的类型、收集与整理,层次分布表、直方图等收集和显示数据方式;特征数的计算,包括平均数、众数、方差、极差等。 重点和难点:特征数的计算,平均数、众数、方差和极差的含义 1. 试验材料的收集与整理 2. 特征数的计算
主要内容:大数定理;几种常见的理论分布,二项分布、泊松分布和正态分布;统计数的分布,t分布、χ2分布、F分布。 重点和难点:几种常见的理论分布和统计数的分布 1. 概率基础知识
2. 几种常见的理论分布 3. 统计数的分布
第四章:统计推断 (8学时)
主要内容:假设检验的原理和方法,具体假设检验方法,包括u检验、t检验和方差的同质性检验;参数估计和点估计,非参数检验。 重点和难点:假设检验的原理和方法,具体假设检验方法 1. 假设检验的原理和方法 2. 样本平均数的假设检验 3. 样本频率的假设检验 4. 方差的同质性检验 第五章:卡方检验(2学时)
重点和难点:卡方检验的原理和方法 1. 卡方检验的原理和方法 2. 适合性检验 3. 独立性检验
重点和难点:方差分析、协方差分析的原理和方法 1. 方差分析的基本原理 2. 单因素方差分析 3. 二因素方差分析
重点和难点:重点是直线回归的原理和方法,相关分析的原理和方法 1. 直线回归分析 2. 直线相关
1. 试验设计的基本原则:重复、随机和局部控制
2. 局部控制的方法:比对设计、随机区组设计和拉丁方设计等 第九章:扩展知识 (4学时, 理论课)
重点和难点:生物学和统计学之间的内在逻辑关系 1. DNA突变、转录因子结合、表型之间的联系 2. 课程项目实践和统计学在各个环节的衔接关系 实践环节:课程项目实践 (16学时,上机操作)
1. 模式生物基因组GC含量特征或基因突变方向特征 2. 基因型和表型关联分析 3. 转录因子结合位点 4. 自由选题
2018年3月9日 19:54
The concept and main content of biostatistics
Biostatistics is the application of mathematical statistics in biological research
Sources of biological randomness Variability, uncertainty, complexity
Collation of data &caculation of the characteristic number
2018年3月9日 20:03
Type of test data:
Collection and collation of test data
Quantitative character is a character which could be counted or measured, the data get in this way is called data of quantitative characteristics
The quantitative trait data is divided into two kinds, discrete type and continous.
Qualitative character means the character which could be measured directly.
The data obtained from the observation of quality traits is the quality character data. This type of trait can not be direcyly used as a numerical value, to obtain data on such traits, it is necessary to quantify the results of their observations.
Collection of test data: Overall, samples
Random samping must meet 2 conditions :
Equal opportunity of each individual being drawn in the whole
Independent of each other in the whole, whether being drawn is not affected by other individual.
Finishing of test data:
The formulation of the distribution table
The caculation of the characteristic number
The distribution of variables has two distinct basic characteristics: centealization and dispersion
Arithmetic mean: the sum means the number
Median: the number standing at the middle of the line
Mode: the value that has the most occurrences of the observed value Geometric:
Application scope:the geometrical mean numberis applicable to the logarithmic normal distribution of variable x, and the data of normal distribution after logarithmic transformation. Harmonic mean:
The reciprocal of the arithmetic mean of the reciprocal of the observations in the data
The important nature of arithemetic averages:
The sum of the deviations is equal to zero The square sum of the deviation is minimum
Range: the difference between the maximum value and the minimum value of a sample variable Variance:
Standard deviation:
The characteristics of standard deviation:
The size of the standard deviation, affected by multiple observations, if the observation number of large differences between the difference is also large, and vise versa is small
Coefficient of variabilit: CV=s / x × 100%
The degree of relative variability of different samples can be compared
Probabity and probility distribution
2018年3月12日 12:40
The concept:
Wheather or not something happens
Frequency: the number of occurrences of the event dicided by the total times
Probability: the frequency obtained after extensive testings, which is an approximate value. Classocalprobabilty: the probablity is calculated directy from the characteristics of the event. Geometric probablity is considered as a random experiment with an infinite number of possible basic events
The axiomatic definition of probablity:
Caculation of probability:
Plot& and events, mutex events, opposing events, independent events, complete event system
The law of probability caculation:
the addition theorem of mutex events.
定理: 若事件A与B互斥,则 P(A+B)=P(A)+P(B) 推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An) 推理2 P(A)=1-P(A)
推理3 完全事件系的和事件的概率为1。
Probability distribution of discrete variables
Probability distribution of continuous type variables
The probability depend on the distribution density function
Law of large numbers: Chebyshev inequalities:
Berrnoulli's law of large numbers:
Sinchin law of large numbers:
当n足够大时,符合泊松分布 泊松分布函数的推导:
(1)χ2分布于区间[0,+∝ )。
(2)χ2分布的偏斜度随自由度降低而增大,当自由度df=1时,曲线以纵轴为渐近线。 (3)随自由度df的增大, χ2分布曲线渐趋左右对称,当df>30时,卡方分布已接近正态分布。 t分布
(1)t分布曲线是左右对称的,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度制约,每个自由度都有一条t分布曲线。
(3)和正态分布相比,t分布顶端偏低,尾部偏高,自由度df>30时,其曲线接近正态分布曲线,n→∝时则和正态分布曲线重合。 F分布:
(1)F分布的平均数μF=1 ,F的取值区间为[0,+∝)
(2)F分布曲线的形状仅决定于n1和n2。在n1=1或2时,F分布曲线呈严重倾斜的反向J型,当n1≧ 3时,转为左偏曲线。
现有一N=3总体,具有变量3,4,5,可以求出 μ=4, σ 2=0.6667,σ =0.8165。 现以n=2作独立的有放回式抽样。
小概率事件在一次抽样中基本上不会发生。 二 、假设检验的步骤
具平均数?0=126(mg/L), ?=240 (mg/L)的正态分布。现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。问:该药物治疗是否有效?
治疗后 n =6 x =136
那么 ?x=?0 ? 即克矽平对治疗矽肺是否有效?
1 、提出假设
x-?0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。 平均数的假设检验
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。 而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数和治疗前的平均数来自不同总体,即克矽平有疗效。
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作?。 统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设
检验也常取?=0.05和?=0.01两个显著水平 。
生物统计学笔记 - 图文05-05
建筑工程施工造价指标 - 图文01-15
- 高一物理牛顿运动定律全套学习学案
- 水处理一级反渗透加还原剂亚硫酸氢钠后为什么ORP会升高
- 毕业设计(论文)-正文董家口 - 图文
- 荣盛酒店经营管理公司录用通知及入职承诺书II
- 第二讲 大学英语四级快速阅读技巧
- 质量管理体系文件(2015年委托第三方医药物流配送企业专用版本)
- 214071收款办法
- 苏轼对《文选》选文的评价
- 《诊断学基础B》1-8作业
- 广东省东莞市高一数学下学期期末教学质量检查试题
- 海南电网公司VIS推广应用管理办法
- 红星照耀中国习题
- 苏教版小学语文六年级上册期末复习资料之生字词整理
- 局域网组建与应用—王向东
- 税务稽查内部管理文书样式
- 环保社会实践调查表
- 九年级思品第一单元复习
- 2016年全国注册咨询工程师继续教育公路路线设计规范试卷
- 毕业设计-青岛港董家口港区防波堤设计
- 撞背锻炼方法与益处
- 统计学
- 生物
- 图文
- 笔记
- 海地软件教程简洁加完整版
- 轴的常用材料及性能 - 图文
- 2001年江西省英语中考试题及答案
- 人教版小学美术一年级上册《鱼儿游游》评课记录
- 涤棉织物染整工艺设计
- 刘桥中心学校2015-2016年期中考试表彰大会
- 再生铜棒生产及深加工项目可行性研究报告 - 图文
- 《看戏》阅读练习及答案
- 曙光公社社会调研报告最终版2
- 干部在线学习——大力发展现代农业,积极推进中国特色农业现代化
- 第6章电力变压器保护试题 - 图文
- 新视野大学英语第三版读写教程第四册课文+翻译
- 长春市未来十年总体规划(2011-2020)
- 火电厂工程项目管理策划
- 执业医师考试 2015 试题2
- FAQ(JAVA基础二)整理
- 移动3G视频监控平台建设方案
- 基于UML的学籍管理系统的分析与设计
- 国家预算期末考试总复习题