医学统计学

更新时间:2023-09-18 01:41:01 阅读量: 幼儿教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2012医学统计学

第一章:概述

1. 统计工作的基本步骤是什么?

(一)计划与设计(二)搜集资料 (三)整理资料(四)分析资料 2、医学统计资料主要来源有哪些方面?

(1)统计报表(2)医疗卫生工作记录(3)专题调查或实验研究 3. 整理资料的目的是什么?通常整理成为哪两类

目的:据设计的要求对原始数据进行分组和汇总,使其系统化、条理化,便于下一步计算统计指标和统计分析。常分为:(1)性质分组(2)数量分组 -编制频数表 4.分析资料包含哪两方面?

1,统计描述:指用统计指标、统计表和统计图对资料的数量特征及分布规律进行描述;

2,统计推断:指由样本统计量推断总体参数或分布,并对实验数据进行各种检验,最后根据专业知识解释分析结果。目的是用样本信息推断总体特征。

5. 统计资料类型分为哪几类?

一.计量资料:凡是以定量的方法测定观察单位某项指标数值得大小,所得的资料称为数值变量资料。

二.计数资料:将观察单位按某一属性或类别来分组,清点各组的观察单位数,所得资料称为分类变量资料。三、等级资料:又称有序分类,各类别间有程度上的差别。 是介于计量资料与计数资料之间的一种资料。 6、什么是总体与样本

总体:根据研究目的确定的同类事物(同质)或现象的所有观察单位某种变量值的集合称为总体。 样本:由总体中随机抽取有代表性的一部分个体,其实测值的集合称为样本。 7、什么是参数和统计量

总体的统计指标称为参数。总体均数(?0?8),总体率等; 样本的统计指标称为统计量,样本均数(x),样本 率(P)等. 8.常见的误差有哪些?

系统误差:可以避免 随机测量误差:不可避免

抽样误差与抽样研究:由抽样造成的样本统计量和总体参数的差别称为抽样误差。从所研究的总体中随机抽取一部分有代表性的样本进行研究,样本指标推论总体,最终达到了解总体的目的。由于变异造成总体所包含的个体值存在差别,因此样本统计量和总体参数会有差别,

9、频率和概率?什么是小概率事件?

频率是对样本而言,概率是对总体而言。概率是指某随机事件发生可能性的大小,常用符号P表示。一般概率范围在0-1之间。统计上的许多结论都是带有概率性的,习惯上常将P?0?50.05或P?0?50.01称为小概率事件,表示事件发生的可能性很小。 第二章 计量资料的统计分析 (一)统计描述

1.变量值的频数分布包括哪两个特征? 集中趋势:变量值的集中位置所在

离散趋势:变量值围绕集中位置的分布情况。

2. 反映集中趋势指标及适合的分布类型? 采用平均数,是一组指标体系 ,包括

算术均数(简称均数):对称分布尤其是正态分布的资料. (总体均数u?8?6 ) (样本均数 x)

几何均数(G) :偏态分布的资料,但变量值呈倍数关系或对数转换后呈正态分布中位数(M):偏态分布的资料,或

资料类型不清楚。

3、全距、四分位数间距、方差、标准差及变异系数各有何优缺点? 1) 全距(极差):表示一组变量值的最大值和最小值之差,用R表示。

优点:简单明了,各种分布类型的资料都适用。缺点:仅考虑最大值和最小值之差,而未考虑其它变量值的差别。即全距不能准确反映样本所有变量值的变异程度,故仅作为参考变异指标,不能作为主要变异指标。

2) 四分位数间距 为特定的百分位数,用Q表示,下四分位数QL=P25上四分位数QU=P75,四分位数间距即QU -QL。全部变量比QL小有1/4的变量值,比QU大有1/4的变量值。四分位数间距内包含全部变量值的1/2,可看作中间1/2变量值的全距。四分位数间距越大,变量值的变异程度或离散程度越大。 3)方差:考虑了各个变量值,但度量衡被平方了。

4).标准差 考虑了一组变量值中所有变量值的差别,用于对称分布资料,特别是正态分布资料(最恰当),总体标准差用s表示,样本标准差用s表示。

5)变异系数 当两组或多组变量值的单位不同或均数相差较大时,不能或不宜用两个或多个标准差的大小来比较其变异程度的大小,为此引入反映变量值相对变异程度的变异系数,样本变异系数的公式为: 4.均数、几何均数与中位数的关系是什么?

中位数一定在变量值的中心位置。对于正态分布总体,均数=中位数;对于对数正态分布总体,几何均数=中位数;但对于正态分布资料和对数正态分布资料,若用样本中位数比用样本均数和几何均数会降低推断总体均数和总体几何均数的灵敏度。 有6份血清的抗体效价为:1:10,1:20,1:40;1:40;1:80;1:160,其平均效价采用几何均数。 5.反映离散趋势指标有哪些?其用途是?

反映一组变量值的变异程度或离散程度,常用的变异指标有极差、四分位数间距、方差 标准差和变异系数(CV)。其中最常用的是标准差。

用途: 全距对变量值的各种分布类型资料都适用;标准差和均数配套,变异系数作为辅助变异指标,适用于对称分布资料,特别是正态分布资料;四分位数间距和中位数配套,一般用于不对称的偏态分布资料。

注意:变异指标与平均指标是彼此独立的,二者可结合对某一组变量值特别是正态分布资料作很好的描述。 6、标准差有何应用 ?

(1)描述事物的变异程度(2)衡量均数的代表性

(3)结合样本均数描述频数分布特征(4)计算变异系数和标准误 (二) 单变量资料的统计推断 1什么是均数的抽样误差与标准误

统计学上把由抽样造成的样本统计量和相应的总体参数之差叫做抽样误差,把由抽样造成的样本均数和相应的总体均数之差叫做均数的抽样误差

2[/U]、标准误的应用

(1)表示抽样误差的大小:说明由样本均数推断总体均数的可靠性。 (2)确定总体均数的可信区间 (3)进行均数的t检验. sX = sX 为均数的总体标 准误

SX = SX 为均数的样本标 准误

从公式看出,当样本例数一定时,标准误与标准差成正比;当标准差一定时,标准误与样本含量 n 的平方根成反比。增加样本含量可以减小抽样误差。

3.假设检验通常包含哪些设计类型?一样本均数与总体均数的假设检验(二两个总体均数差别的假设检验 4. 配对设计的差值均数与总体均数0比较的t检验 5.如何根据检验统计量u或t值,判断p值,下结论

a |u| P 判断 0.05

双侧 <1.96 >0.05 接受 H0 、拒绝H1 单侧 <1.645 差别无显著性

双侧 ?0?6 1.96 ?0?5 0.05 拒绝H0 、 接受H1 单侧 ?0?6 1.645 差别有显著性 0.01

双侧 ?0?6 2.58 ?0?5 0.01 拒绝H0 、 接受H1 单侧 ?0?6 2.33 有高度显著性 a |t| P 判断 0.05

t0.05 接受 H0 ,拒绝H1 差别无显著性

t ?0?6t 0,05,n ?0?5 0.05 拒绝H0 、 接受H1 , 差别有显著性 0.01

t ?0?6 t 0,01,n ?0?5 0.01 拒绝H0 、 接受H1 差别有高度显著性 6.假设检验的注意事项?

1) 资料来源于严密的抽样研究设计,保证资料的同质,组间均衡性和可比性. 2)注意应用条件

3)正确理解差别有无统计意义 实际差别与统计意义

统计意义:抽到这样大统计量的可能性很小,可以拒绝 H0。但并不意味两总体均数差别很大。 样本量很大时,即使均数差别不大,统计学意义却显著。 样本小时,即使均数差别很大,统计学意义却不显著。 7、完全随机设计的两个样本均数的比较

推断两样本所代表的两个总体均数是否相同。条件是两组资料来源于正态分布,两总体方差齐. 1)两个大样本的u检验。 两样本含量均>50, 用u检验。2)、两个小样本均数的比较的t检验 8、什么是配对设计?

两样本中的观察值由于存在某种联系而一一对应结成对子的情况.

1)、同一受试对象处理前后的比较:高血压治疗前后的血压值,或每一名病人有一对数据; 2)、同一对象身体不同部位测定值比较:如左右臂皮肤的敏感试验,测得红斑直径; 3)、同一样品两种不同方法测定结果:两种仪器,两名化验员,两种条件等; 4)、成对设计:动物配对后随机分到两组后的测定结果; 9、总体均数的可信区间如何估计?

由抽样误差规律,按一定概率(可信度)估计总体均数在哪个范围(区间),所估计的区间叫做总体均数的可信区间或置信区间。常用的可信度为95%或99% 总体均数 m 的1-a可信区间为

大样本资料总体均数 m 的95%可信区间为大样本资料总体均数 m 的99%可信区间为 第二章分类变量资料的统计分析 (一)资料的统计描述

1. 分类变量资料常用什么指标进行描述?常见的相对数指标包括什么?

常用相对数(相对数是两个有关的绝对数之比)来描述,是一组指标,常见包括

1、率(rate):又称频率指标,表示某现象发生的频率或强度,比例基数用k表示,据习惯定,一般至少保留1~2为整数。包括%、‰、1/万、1/10万,计算公式为 3.什么是构成比?

又称构成指标,表示某一事物内部各组成部分所占的比重或分布,常用百分数表示。计算公式为

注意:构成比之和为100%,具体计算时,有时受尾数取舍的影响,其和不等于100%,可将尾数作适当调整,使其和等于100%。各构成比之间是相互制约的,其比重的增减互相影响。 4、什么是相对比

又称对比指标,表示两个有联系的同类指标之比,常用倍数或百分数表示。计算公式为 5、应用相对数应注意的问题?

1,计算率和构成比的分母不宜过小(观察单位应足够多),否则样本率不稳定,易造成错觉; 2,不要将构成比作率分析(不能混淆);

3,求平均率时不能直接将几个率相加取平均求其合并率或平均率,而应以总发生数除以总可能发生例数。 4,应注意率(或构成比)的可比性

5,对样本率(或构成比)的比较应作假设检验;因比较的目的是推断其总体率(或构成比)有无差别。 6、率的标准化意义及目的何在? 标准化法的意义[/U]

当比较两个总率时,如果两组内部某种能影响指标水平的重要特征的构成上有差别,往往造成总率的升高或下降,影响两个总率的对比;因此要设法消除其内部构成的差异,使之能合理地进行比较,所用的方法称为标准化法。

目的[/U]:采用统一的标准构成以消除内部构成不同对总率的影响,使标准化后的标准化总率具有可比性。标准化率简称标化率或调整率。 注意[/U]:

1 . 标准化法只适用于解决因两组内部构成不同,并有可能影响两组总率比较的可比性问题。

2 . 因选定的标准人口不同,算得的标准化率也不同。故当比较两个(或几个)标准化率时应采用同一标准人口。 3 . 标准化率已不再反映率的实际水平,只是表明相互比较的资料的相对水平。 (二)分类资料的统计推断 1、什么是率的标准误:

由抽样造成的样本率和总体率的差别称为率的抽样误差。

总体率用p表示,样本率用p[/I]表示,率的总体标准误用sp表示 ,因总体率一般是未知的,若用样本率p[/I]估计, sp的样本估计值为率的样本标准误sp,其计算公式为: 2 、总体率的可信区间如何估计?

当n足够大(n>50),且np?0?65或n(1-p)?0?65时,样本率p近似服从均数为p、标准误为sP的正态分布, 总体率的95%可信区间为

p±1.96sp:(p- 1.96sp~p+ 1.96sp) 总体率的99%可信区间为

p±2.58sp:(p- 2.58sp~p+ 2.58sp) 3、率的u检验条件?率的u检验的设计类型?

适用条件:1. 适用于一个样本率与一个总体率的比较,或两个样本率间的比较。而不能用于多个率或构成比资料的比较; 2. 要求样本量较大,一般p与(1-p)均大不接近0,率的分布近似于正态分布。 1.样本率和总体率比较的u检验

有一个随机样本率和一个标准值(或经验值)。 2. 两个样本率比较的u检验 有两个随机抽取的样本率

3、如何根据检验统计量u值,判断p值,下结论

a |u| P 判断 0.05

双侧 <1.96 >0.05 不拒绝 H0 、差别 单侧 <1.645 无统计学意义

双侧 > 1.96 < 0.05 拒绝H0 、 接受H1 单侧 > 1.645 差别有统计学意义 0.01

双侧 > 2.58 < 0.01 拒绝H0 、 接受H1 单侧 > 2.33 差别有高度统计学意义

4、如何根据c2值判断P[/I]值和统计学结论? c2值 P值 统计结论

< c2 0.05, n >0.05 不拒绝 H0 、差别 无统计学意义

?0?6 c2 0.05, n ?0?50.05 拒绝 H0 、差别 有统计学意义

?0?6 c2 0.01, n ?0?50.01 拒绝 H0 、差别 有统计学意义 5 、c2检验的类型? (1)四格表资料的c2检验 基本公式法

专用公式法 u n =(R-1)(C-1) 校正公式 连续性校正条件

当四格表中有任一格子理论数 1≦T<5,同时总例数n?0?640,需要计算校正的c2 四格表确切概率法条件

条件:四格表资料中若 n<40,或有任一格子理论数T<1。 (2)配对计数资料c2检验

两种检测结果比率比较(观察结果有无差异比较 B 配对四格表资料的关联性分析 (3)行乘列表资料的 c2检验

当 R>2 or C>2 两个以上的率的比较 两个或多个构成比的比较 按两种属性分类的频数表资料的关联性分析 6.c2检验的适用条件?

适用:检验两个或两个以上总体率或构成比之间差异是否有统计意义(样本量不限)。也可检验两类事物之间(行与列变量)是否存在一定的关系。

7、行?0?7列表资料c2检验的注意事项 ? (1) R*C 表中4/5以上格子的理论数应该>5;

不能有1/5以上格子理论数小于5,或有任一格子理论数小于1,如不符合条件则a 增加实验样本含量b. 相邻行或列数字合并;C.删除所在行或列的数据D.直接计算概率

(2) c2 检验的结果拒绝H0时仅提示所比较的各组总体来说有差别,但不能表示其间任一两者间均有差别,也不表示差别的强度。如想进一步了解彼此间的差别,需将行?0?7列表分割,再进行c2 检验。 (三)统计分析结果的表达 统计表与统计图

1、什么是统计表 ?其优点是什么?用表格的形式来表达统计资料和指标,优点:避免冗长文字叙述、便于阅读、分析比较 2. 统计表的基本结构与要求?

制表的原则:简单明确,层次清楚,一事一表,避免内容庞杂 1.标题:上端,加表号,简要说明内容、地点、时间。

2. 标目:横标目(主辞):位于左侧,表示被研究事物的主要标志(或对象);纵标目(宾辞):位于表的上端,是研究事物的指标(注明单位)

3. 线条:顶线、底线、纵标目与数字分隔线、合计横线。无竖线、斜线。

4.数字:阿拉伯数字,位数一致,位置对齐,不留空格,“-”:无数字;“…”:资料缺失。备注:表外补充说明,*, **等引出。 3、什么是统计图 ?常见的统计图有哪些?

是用点、线、面或立体图形图形将事物的数量大小、分布情况、发展变化趋势等特征表达出来。 统计图的种类与结构

常见的统计图:线图、直方图、圆形图、散点图、统计地图等。 由标题、图域、标目、尺度、图例等构成 4 统计表的种类?

1.简单表:主辞仅有一个标志

2.复合表:主辞有两个以上的标志,将部分主辞与宾辞置于表的上方复合起来。 5.常用统计图适用的资料类型是什么?

1. 直条图:用等宽直条的长短、高低来表示相互独立各指标数值的大小。

适合于:按性质分组的资料,各个相互独立的统计指标。分为简单条图,复式条图。 2.圆形图pie chart

适用于百分构成资料,表示事物各组成部分的构成情况。以圆形的总面积代表100%,按比例分成若干部分,以角度大小表示各部分所占的比重。

3.百分直条图:作用与圆形图相同,但以直条总长度为100%。

4. 直方图 表示连续性变量的频数分布,用于频数分布图。纵轴表示频数或频率,以不同直方形面积代表数量,各直方面积与各组的数量成正比。注意:直条间不留空隙;组距必须相等

5.线图 适用于连续性数量资料,用线段的升降表示某事物在时间上的变化或某现象随另一现象而变化的情况。 7. 散点图

表示两事物变化的相关性和趋势。

本文来源:https://www.bwwdw.com/article/evbh.html

Top