定性资料总结

更新时间:2023-10-17 06:00:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第三章 定性资料的统计描述

Statistical Description ofQualitative Variables

1.相对数

2.标准化法的意义和基本思想 3.动态数列及其分析指标 4.率的标准误与可信区间

第一节 相对数

定性资料的数据基本形式是绝对数,如某病的入院人数、治疗人数、有效人数、死亡人数等,用以说明客观事物或现象发生的实际水平。定性资料的统计描述通常需要在绝对数基础上计算相对数,如治愈率、有效率、死亡率等,说明事物或现象发生的相对水平。

计数资料统计描述的一般步骤是先对观察测量得到的变量值(即观察值)进行分类汇总得到分类资料频数表(属于绝对数指标),再在此基础上计算相对数指标,才能对分类变量资料进行正确的描述。 频数表:按类别或属性计数

如欲了解某医院临床护士(师) 职称结构,可按职称分六个级别,然后分别清点属于各类别的人数,将类别及相应人数编制成频数表。即简单分组。 如果按两种或两种以上标志分组,则称为复合分组。 相对数的概念及计算

描述计数资料的 最主要指标是相对数(relative number) 。

常用的相对数有:频率[率(rate) ]、频率分布[构成比(constituent ratio) ]、强度(intensity)、相对比(relative ratio) 1.频率和强度

①频率型指标是相对数最常见的一种,它表示某事件发生的频率。计算公式为:阳性率=(发生某事件的观察单位数/可能发生某事件的观察单位总数)×K

率=(已发生的实际数/所有可能发生的例数)×比例基数

其中K是一个等于1的基数,通常为100%,100000/10万等。一般应使算得的率至少保留一位整数,但注意观察例数一般应大于比例基数,至少不应相差太大。(率:反映某事物或现象发生频率和强度大小的指标) 比例基数:

百分率(治愈率、感染率); 千分率(出生率、死亡率);

十万分率(某些疾病死亡率,比如自杀,中国 的自杀率23/10万); 总体率用π表示,样本率用P表示。

常用的指标:死亡率、发病率、患病率、病死率、治愈率。 ②医学上常用的频率指标

患病率=患病人数/调查人数×100%

发病率=一定时期内的新病例数/同期平均人口数×100%

感染率=感染人数/检查人数×100%

死亡率=一年内死亡人数/该年内平均人口数×10000/00

③医学上易混淆的两对指标

病死率=病人死亡数/接受治疗的病人数×100% 死亡率=一年内死亡人数/该年内平均人口数×K

患病率=患病人数/调查人数×100%

发病率=一定时期内新发生的病例数/可能发生该病的平均人口数×100% 例如:2002 年,中国男性肺癌发病率 为44.7/10万,女性为27.4/10万。肺的长期存活率仍旧很低,据2002年报告,我国肺癌患者5 年 生存率 仅为8 %。2001年全世界死于肺癌者达100 万以上,死亡率为40.31/10万。 强度型指标是单位时间内某事件发生的频率。计算公式为:

强度=发生某事件的观察单位数/∑(可能发生某时间的单位数×观察时长)×K 2.频率分布(构成比)

用来说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。计算公式为:

构成比=某一组成部分的个体数/同一事物各组成部分的个体总数×100% 构成比描述事物内部各组成部分的比重或数量的分布情况,是深入研究事物的内在联系,探索事物变化原因的有效方法。 3.相对比

相对比是两个有关指标之比,用来说明一个指标是另一个指标的若干倍或是百分之几。

相对比=甲指标/乙指标

式中甲乙指标常常是两个地域或两个时期的同类指标。用作比较的指标可以是相对数、也可以是绝对数或平均数。 ①相对危险度RR以及优势比OR

在队列研究和病例对照研究中常用。RCT和循证证据中常用到RR的概念。

RR=P1/P0

OR=病例组的优势/对照组的优势=(a/b)/(c/d)=ac/bd

相对指标应用中常见问题

1.分不清构成比与率的概念及用法,常把构成比当做率来分析。 2.计算相对数时的分母过小

当分母较小时,最好直接用绝对数表示,如必须使用相对数,应列出其可信区间或实际数。

3.误将几个率相加后取其平均值作为几个率的平均值。 应用原始数据重新计算率的大小。 4.不考虑可比性的问题

5.应考虑相对数比较时的抽样误差,率与率之间的比较应该做统计学检验。

第二节 率的标准化法

比较两总率时,若两组资料内部各小组率有明显差别,而且各小组内部构成也明显不同时,则不能直接比较。这时需要用到率的标准化法。常用方法有直接法和间接法。

率的标准化法是为了比较不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响。

基本思想:采用统一的标准构成以消除内部构成不同对总率的影响,使通过

标化后的标准化率具有可比性。

计算标准化率:直接法与间接法*标化的要求 标化方法 所需数据

被标化组 标准组(选定) 直接法 各小组的率 各小组的标准人口数 间接法 各小组的人口数 标准各小组死亡率 与总死亡数 与总死亡率 1.直接法计算标准化率 具体计算步骤为: ①选定标准人口

选定一公认的人口构成作为标准或任选带比较的一组人口构成作为标准 或将两待比较组的人口构成项合并 ②计算预期发生数,“发生”可表示治愈、发病、死亡、生存等。

预期发生数=标准人口×原发生率 ③求标准化率

标准化率=预期发生数/标准总人数×100%

条件:已知标准组年龄别人口数或年龄别人口构成时,用直接标化法。 算法:被标化组按标准组年龄别人口数(构成)算得的预期死亡数,除以标准组的总人口数即得标化率p’

p’=(∑Nipi)/N

选择标准人口构成的三种途径

1)选择甲组或乙组的数据做标准。

2)选择甲组和乙组的数据之和做标准。

3)选择有代表性的、较稳定的、数量较大的人群的数据做标准,时间最好与被标化的资料一致或接近(如全国、全省或本地区的数据)。

例如: 表2 用直接法计算标准化死亡率

p’=(∑Nipi)/N

807?68?288?126?9613851000?*?13.85‰

10000010000010001028?86?391?148?11017631000,??*?17.63‰ P乙10000010000010002.间接法计算标准化率

只有某病总死亡数r和各年龄组人口数ni,缺少各年龄组的死亡率pi 算法:

p’=P*r/(∑niPi)=P*SMR

SMR>1:被标化人群的死亡率高于标准组 SMR<1:被标化人群的死亡率低于标准组

例如:已知甲地死亡总数为845人,乙地为697人,以及两地各年龄组人口数,求两地标准化死亡比及标准化死亡率。

表6 用间接法计算标准化死亡率

P甲?,

845?0.91甲地标准化死亡比SMR=929

甲地标准化死亡率P=15.42‰*0.91=14.03‰

697?1.14乙地标准化死亡比SMR=613

乙地标准化死亡率P=15.42‰*1.14=17.58‰

应用标准化法的注意事项

1、当两组或多组资料其各小组的率相差较大且具有一致的方向时,若内部构成不同才需进行标准化。当两组或多组资料其各小组的率相差较大且具有一致的方向时,若内部构成不同才需进行标准化。 2、计算的标准化率是为了进行合理的比较,它只表明相互比较的率的相对大小,并不反映实际水平。计算的标准化率是为了进行合理的比较,它只表明相互比较的率的相对大小,并不反映实际水平。

3、对于同一份资料,如果选择的标准不同,算得的标化率也不同。对于同一份资料,如果选择的标准不同,算得的标化率也不同。

*进行标准化率的比较时,已知各个年龄组的实际(死亡、出生、患病)率用宜用直接法。已知某病的实际(死亡、出生、患病)总人数及各个年龄组的人

口数,不知道各个年龄组的实际(死亡、出生、患病)率宜用间接法。

第三节 动态数列及其分析指标 定义:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间 上的变化和发展趋势。

指标:绝对增长量、发展速度、增长速度、平均发展速度、平均增长速度 1.绝对增长量:事物在一定时期内增长的绝对值(累计增长量、逐年增长量) 2.发展速度和增长速度:事物在一定时期的变化情况(定基比、环比) 3.平均发展速度和平均增长速度

平均增长速度=平均发展速度-1

第四节 率的标准误与可信区间

标准误:从一个已知总体率中进行随机抽相同的多个样本,样本率与样本率之间,样本率与总体率之间的差异,称为率的抽样误差。率的抽样误差用率的标准误度量。

σp= √[π(1?π) n] Sp=√[p(1?p)/n]

例如:某县抽样调查了2170名居民中,其中慢性病患病人数521人,慢性病患病率为24.0%。试估计该县慢性病患病率的标准误。

sp?0.24*0.76?0.009172170

正态近似法估计总体率

当n足够大,且np及n(1-P)均大于5时,π的抽样分布近似正态分布,(1-α)总体率的双侧可信区间近似为:(p-Zα/2Sp,p+ Zα/2Sp)

例如:某医生用一种新的进口药物治疗了125例腿部静脉血栓患者,其中97例患者有效,患者有效率为77.6%,试估计该种新药治疗腿部血栓总体有效率的95%可信区间。

p?za/2sp?0.776?1.960.776(1?0.776)?0.703,0.849125

即该种新药治疗腿部静脉血栓总体有效率的95%可信区间为(70.3% ,84.9%)。

查表法求总体率的置信区间

对于小样本资料,尤其是跟接近0或100%时,直接查附表,即可得到其总体率的可信区间。

例如:已知某医院对36例肝癌患者用一种新的介入疗法进行治疗,术后有合并症2人,试估计该手术合并症发生率的95%CI。

查表即本例与交叉处的上行数值为1~18,即该手术合并症发生率的95%可信区间为(1% ,18%)。

本文来源:https://www.bwwdw.com/article/bp2f.html

Top