(完整版)《卫生统计学》考试重点复习资料.doc
更新时间:2023-04-26 21:57:01 阅读量: 实用文档 文档下载
- 流行病与卫生统计学推荐度:
- 相关推荐
《卫生统计学》复习资料
08 生物技术曾洋and林阳第一章绪论
名词解释
统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率 (probability) 又称几率,是度量某一随机事件 A 发生可能性大小的一个数值,记为 P( A), P( A)越大,说明 A 事件发生的可能性越大。0﹤P( A)﹤ 1。
频率:在相同的条件下,独立重复做n 次试验,事件 A 出现了 m 次,则比值 m/n 称为随机事件 A 在 n 次试验中出现的频率 (freqency) 。当试验重复很多次时P( A) = m/n 。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量( random variable )是指取指不能事先确定的观察结果。随机变量的具
体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差 (systematic error) 是指由于仪器未校正、测量者感官的某种偏差、医生
掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差( random error )又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。
变异:在自然状态下,个体间测量结果的差异称为变异(variation )。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,
其表现为各种生理测量值的参差不齐。
抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异的存在,在
抽样过程中产生的样本统计量与总体参数之间的差异。
分布:随机现象的规律性通过概率来刻画,而随机事件的所有结局及对应概率的排列称为分
布。
第二章定量资料的统计描述
名词解释
算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。
中位数:将一组观察值由小到大排列, n 为奇数时取位次居中的变量值;为偶数时,取位次居
中的两个变量的平均值。
众数:众数原指总体中出现机会最高的数值。样本众数则是在样本中出现次数最多的数值。
极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
四分位数间距:是由第 3 四分位数和第 1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样
本、小样本均可,最为常用。
变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV表示。问答题
常见的描述集中趋势的指标有哪些,概念分别是什么?
答:常见的描述集中趋势的指标有算数均数、几何均数、中位数和众数。概念见名解。
常见的描述离散趋势的指标有哪些,概念分别是什么?
答:常见的描述离散趋势的指标有极差、四分位数间距、方差、标准差和变异系数。概念见
名解。
第三章定性资料的统计描述
名词解释
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就是指
定一个统一“标准” (标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备
可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
问答题
常用的相对数指标有哪些?它们的意义和计算上有何不同?
答:常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:
①
率
发生某现象的观察单位数
100% 可能发生某现象的观察单位总数
率又称频率指标,说明某现象发生的频率或强度,常以100%、 1000‰等表示。
②构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。
构成比
某一组成部分的观察单位数
同一事物各组成部分的观察单位总数
100%
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比 =甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
⑴ 计算相对数的分母一般不宜过小。
⑵ 分析时不能以构成比代替率。
⑶ 不能用构成比的动态分析代替率的动态分析。
⑷ 对观察单位数不等的几个率,不能直接相加求其总率。
⑸ 在比较相对数时应注意可比性。
⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。
应用标准化法的注意事项有哪些?
答:应用标准化法时应注意的问题有:
1)标准化法的应用范围很广,其主要目的就是消除混杂因素的影响。
2)标准化后的标准化率,已经不再反反映当时当地的实际水平,它只是表示相互比较的资料
间的相对水平。
3)报告比较结果时必须说明所选用的“标准”和理由。
4)两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
第四章统计表和统计图
名词解释
统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table )。狭义的统计
表只表示统计指标。
统计图:统计图 (statistical graph) 是将统计指标用几何图形表达,即以点的位置、线段的升降、
直条的长短或面积的大小等形式直观的表示事物间的数量关系。
问答题
常用统计图的定义和制图要求。
名称定义制图要求
条图用等宽直条的长短来表示相互独立的起点为 0 的等宽直条,条间距相等,按高低顺序各统计指标的数值大小排列。
普通线图适用于连续性资料。用线段的升降来纵横两轴均为算术尺度,相邻两点应以折线相表示一事物随另一事物变化的趋势。连。图内线条不宜超过 3 条。
半对数线图用线段的升降来表示一事物随另一事横轴为算术尺度,纵轴为对数尺度。余同普通线物变化的速度。图。
圆图以圆面积表示事物的全部,用扇形面以圆面积为 100%,将各构成比分别乘以 3.6 度积表示各部分的比重得圆心角度数后再绘扇形面积。通常以12 点为
始边依次绘图。
直方图用矩形的面积来表示某个连续型变量常以横轴表示连续型变量的组段(要求等距),的频数分布纵轴表示频数或频率,其尺度从“ 0”开始,各
直条间不留空隙。
散点图以点的密集程度和趋势表示两种事物绘制方法同线图,只是点与点之间不连接。间的相关关系
第五章常用概率分布
名词解释
正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution )。通常用记号N ( , 2 ) 表示均数为,标准差为的正态分布。标准正态分布 : 均数为0、标准差为 1 的正态分布被称为标准正态分布(standard normal distribution),通常记为N (0,12)。
问答题
正态概率密度曲线的位置与形状具有哪些特点?
答:正态概率密度曲线的位置与形状具有以下特点:
1)关于 x=μ对称。
2) 在 x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点。
3)曲线下面积为 1。
4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横
轴向左移。
5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖” ;σ越小,数据
越集中,曲线越“瘦高” 。
第六章参数估计基础
名词解释
抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。
标准误及X :通常将样本统计量的标准差称为标准误。许多样本均数的标准差X 称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
点估计:是直接利用样本统计量的一个数值来估计总体参数。
区间统计:用统计量 X 和S x确定一个有概率意义的区间,以该区间具有较大的可信度包含
总体均数。
可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间。它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为 1-α。
第七章假设检验基础
名词解释
I 型和 II 型错误: I 型错误( type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为 I 型错误,其概率大小用α表示;II 型错误( type II error ),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。
检验效能: 1-β称为检验效能( power of test ),它是指当两总体确有差别,按规定的检验水
准α所能发现该差异的能力。
问答题
假设检验的基本步骤是什么?
答:①建立假设、选用单侧或双侧检验、确定检验水准;
②选用适当检验方法,计算统计量;
③确定 P 值并作出推断结论。
假设检验与区间估计的关系式什么?
答:①置信区间具有假设检验的主要功能
②置信区间课提供假设检验没有提供的信息。置信区间在回答差别有无统计学意义的同
时,还可以提示差别是否具有实际意义。
③假设检验比置信区间多提供的信息:假设检验可以报告确切的P 值。
应用假设检验需要注意的问题有哪些?
答:①应用检验方法必须符合其适用条件。
②权衡两类错误的危害以确定α的大小。
③正确理解P 值的意义,如果P<α,宜说差异“有统计学意义”。
第八章方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表示。
组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。
组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。
随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象
的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对
象随机地分配到各处理组,这种设计叫做随机区组设计。
第九章x2检验
问答题
R C 列表2检验的注意事项
1、行×列表中不宜有 1/5 以上的理论值小于 5, 也不允许有理论值小于 1。如果发生上述情况,一
般有两种处理方法:
⑴ 增大样本含量,从而期望增大理论值。
⑵将理论值小于 5 的行和列与性质相近的邻近行或列中的实际频数合并 , 期望重新计算的理论
值增大。
2、当多个样本率 (或构成比 )比较的2检验结论有统计学意义,并不能判定任意两组之间的差
异有统计学意义,必须用行×列的分割的办法进一步作两两比较。
3、对于有序的分类变量,采用卡方检验,不能考虑数据的有序性质。
第十章基于秩次的非参数检验
名词解释
参数检验:凡是以特定的总体分布为前提,对未知的总体参数做推断的假设方法。
非参数检验:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,故又称任意分布检验。
第十一章两变量关联性分析
名词解释
线性相关系数:又称 Pearson 积矩相关系数,是定量描述两个变量间线性关系密切程度和相
关方向的统计指标,其定义为
公式:
样本相关系数:
问答题
相关分析应用中的应注意的问题:
1、散点图能够使我们直观地看出两变量间有无线性关系,所以在进行相关分析前应先绘出散点
图,当散点有线性趋势时,才进行相关分析。
2、线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料。
3、出现离群值时慎用相关。
4、相关关系不一定是因果关系。
5、分层资料盲目合并易出假象。
第十二章简单回归分析
名词解释
回归分析:研究结果变量如何随自变量变化的常用方法。
回归直线的置信带:将置信区间的上下限分别连起来形成的两条弧线间的区域。
最小二乘原则:每个观察点距离回归线的纵向距离的平方和最小,即残差平方和最小。
(1- α)置信带的意义:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条
弧线曲线所形成的区带内,其置信度为1- α。
问答题
线性回归模型的适用条件:
(1)因变量 Y 与自变量 X 呈线性关系。
(2)每个个体观察值之间相互独立
(3)在一定范围内,任意给定 X 值,对应的随机变量 Y都服从正态分布
(4)在一定范围内,不同的 X 值所对应的随机变量 Y 的方差相等。
公式
回归方程:=a+bX b==a= b
(一)方差分析
== =
b
(二)t 检验
注意:对同一资料作总体系数β是否为0 的假设检验,方差分析和t 检验是等价的,并且有
非处理因素(confounder) 。
的关系。
(三)总体回归系数β的置信区间
(四)决定系数回归平方和与总离均差平方和之比,记为
第十四章实验设计
实验设计的基本要素:受试对象、处理因素、实验效应。(小题)
实验设计的基本原则:对照、随机化、重复。(小题)
常用的实验设计方案:完全随机设计、配对设计、随机区组设计、拉丁方设计、交叉
设计、析因设计、嵌套设计、正交设计
名词解释
处理因素 (被试因素 ):根据研究目确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的因素,简称处理或因素 (factor) 。是根据研究目的确定的主要因素,处理因素在
整个实验中应始终要保持不变。
非处理因素:与处理因素可能同时存在的能使受试对象产生效应的非研究因素。
常常会干扰研究因素的观察与分析,因此又称为干扰因素或混杂因素
问答题
受试对象应满足三个基本条件:
一是对处理因素敏感;
二是特异性,即不受非处理因素干扰;
三是反应必须稳定。
影响样本含量估计的因素
1.第一类错误的大小:越小所需样本含量愈多;
2.检验效能 (1 )或第二类错误的大小:检验效能愈大,第二类错误的概率愈小,所需样本
含量愈多。
3.容许误差δ:容许误差愈大,所需样本含量愈小。
4.总体标准差或总体概率:反映资料的变异度。愈大,所需样本含量自然愈多。总体概率越
近于 0.50,则所需样本含量愈多。
实验设计的基本原则
一、对照原则
目的:控制混杂因素和偏倚;显露处理因素的效应;判断不良反应。
对照的方式: (1)安慰剂对照 (2)空白对照 (3)实验对照 (4)自身对照 (5)标准对照二、随
机化原则
随机化是使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。
随机化形式: (1)抽样的随机(2) 分组的随机 (3)实验顺序的随机
三、重复原则
重复是指在相同实验条件下进行多次研究或多次观察。重复最主要的作用是估计实验误差。
重复的形式:( 1)整个实验的重复;( 2)用多个受试对象进行重复:有足够的样本含量;( 3)同一受试对象的重复观察。
正在阅读:
钱包里会放谁的照片11-03
PID同步控制应用方案06-08
2016年反洗钱阶段考试试题库04-15
排序算法pascal代码集锦07-08
591UP公务员考试应战平台 - ZH 2006江苏行政能力测试(A) - 图文11-14
u盘格式化后数据恢复怎么办08-28
2017年中国医科大学《传染病护理学》考查课试题及答案09-23
四年级下册乘法运算定律练习汇总06-10
慢慢成熟11-03
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 整版
- 复习资料
- 统计学
- 重点
- 卫生
- 考试
- doc
- 六韬·文韬·大礼原文
- 2019年初级会计师经济法基础备考预习题及答案七含答案
- 中图版地理必修2二第1章人口的增长迁移与合理容量(全章)教学案
- 招标师考试-招标采购法律法规与政策最新考前押题试卷5
- 2013年全国高考语文试卷分类汇编---语病辨析
- 甘肃省天水市一中2016-2017学年高二下学期第二学段考试英语试题
- 汽车销售顾问转正工作总结范文
- 语文四年级下册各单元四字词语释义 (2) (1)
- 3.2用关系式表示变量之间的关系精细教案
- 河南省周口市2020年五年级上学期英语期末考试试卷(II)卷
- 中国最容易读错的29个姓氏培训资料
- 出自论语的25个成语典故
- 黄山头:古往今来皆传奇
- 高一化学上学期第3周试题
- 银行客户经理工作规划书2021示范文本
- 福建省连江县高一化学上学期期末测试试题(一)新人教版
- 助理工程师给人见习期工作总结
- 校园一角的作文校园一角的作文怎么写?
- 胸腰椎经皮椎体后凸成形后连续2年应用唑来膦酸预防二次骨折
- 新人教版五年级下册语文句子专项同步练习