第十章 分类变量资料的统计分析

更新时间:2023-08-26 08:10:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计资料的类型数值变量: 定量资料 分类变量: 定性资料 无序分类:(计数资料) 二项分类 多项分类 连续型计量资料 离散型计量资料

有序分类 : 变量之间有程度的差 别, 且排列有序. (等级资料)

变量的转换: 定量

定性

第十章 分类变量资料的统计分析第一节 统计描述

一.描述指标(相对数)1. 率(rate) : R n K N 单位: %,‰,万分率,10万分率 2. 构成比 (constituent ratio) 单位: % 特点: 3. 相对比 (relative ratio) 常用率比

例10-1 某研究者2000年对某校的初中生进行了近视患病 情况调查,试计算各年级近视患病率和构成比及 三年级和一年级患病率的相对比.年级 一年级 二年级 三年级 合计 检查人数 442 428 405 1275 患病人数 患病率 67 68 74 209 15.16 15.89 18.27 16.39 构成比 32.06 32.53 35.41 100.0 相对比

1.2

二. 应用相对数时注意事项1. 分母不宜太小 2. 率和构成比的区别 3. 样本含量不等的几个率的平均值不等于 几个率 的算数平均值 4. 对率或构成比进行比较时,应注意资料的可比性 5. 率的标准化 6. 两样本率进行比较时应进行假设检验

三.率的标准化1.基本思想: 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率,使得出的标 准化率具有可比性. 2.计算方法: 直接法: 已知各年龄组的实际发病率,用标准人口数或标准人口构成进行计算

间接法: 标准化死亡比 (SMR), 实际死亡数与预期死亡数的比

3. 率的标准化应注意的问题

第二节 计数资料统计推断一. 率的抽样误差和标准误 样本率和总体率或样本率之间存在的差异,称 抽样误差.率的抽样误差用率的标准误表示.( p or Sp). p (1 )n

p(1 P) Sp n

( p =阳性率, 1- p=阴性率)

二. 总体率的区间估计1. 正态近似法:条件: n 足够大,样本率p 或1-p均不太 小时, 即 np 和 n(1-p)>5

p u × Sp 2. 查表法:当n ≤50, 样本率p 接近于0或1时,该资料服从 二项分布,用查表法估计总体率可信区间

例10-5 为了解某地乙肝表面抗原携带情况,某研究者在该 地人群中随机检测了该地200人,乙肝表面抗原阳性7 人,乙肝表面抗原携带率为3.5%,试计算标准误并估 计95%和99%可信区间.n=200 X=7, P=3.5%Sp p (1 P ) n

95%可信区间: 3.5% 1.96 Sp

99%可信区间: 3.5% 2.58 Sp

三. 两个率比较的u 检验当np和 n(1-p) ≧5 时 样本率的分布近似正态分布— u 检验(一) 检验步骤: 1. 建立假设, 确定检验水准α H0: 1= 2 H1: 1≠ 2 α =0.05

2. 选择检验方法, 计算 u 值3. 确定 P 值, 判断结果

(二)资料类型1. 样本率与总体率的比较 (例10-6)计算公式:u p p

p

(1 )n

2. 两个样本率的比较 (例10-7) 计算公式:

u

p1 p

2 1 1 pc(1 pc )( ) n1 n 2

X1 X 2 pc n1 n2

例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?处理 A药 B药 合计 有效 68 (64.82) 52 (55.18) 120 无效 6 (9.18) 11(7.82) 17 合计 74 63 137 有效率(%) 91.89 82.54 87.59

H0: 1= 2 H1: 1≠ 2 =0.05

第三节 X2 检验 (chi-square test)基本思想 检验实际频数与理论频数的吻合程度,实 际频数与理论频数越相近, X2 值越小; 反 之,实际数与理论数相差越大, X2值越大.计算公式:

2

A T T

2

理论频数的计算: TRC= nRnC / n df=(行数-1)(列数-1)

例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?处理 A药 B药 合计 有效 68 (64.82) 52 (55.18) 120 无效 6 (9.18) 11(7.82) 17 合计 74 63 1372

有效率(%) 91.89 82.54 87.59

2

A T T

二. Χ2 检验的基本步骤 1. 建立检验假设,确定检验水准 H0: 1= 2 H1: 1 2 =0.052. 计算Χ2 值 资料类型不同,计算公式不同 3. 确定 P 值, 判断结果 根据查Χ2 界值表, 确定P值

三. 四格表资料的Χ2 检验

处理 A药 B药 合计

有效 a c a+c

无效 b d b+d

合计 a+b c+d n

1. 四格表资料的Χ2 检验的专用公式(ad bc) 2 n 2 (a b)(c d )( a c)(b d )df =(R-1)(C-1)=1

2. 四格表资料的Χ2 检验的校正 -- Yates 连续校正校正公式:

2

A T 0 .5 T

2

2

ad bc n / 2 n2

(a c)(b d )( a b)(c d )

校正的目的:英国统计学家(Yates)认为 2分布是一种连续 性分布,而四格表中的资料属离散性分布,得到 的 2统计量的抽样分布也是离散的.因此,为改 善 2统计量分布的连续性,建议进行校正.

连续性校正应遵循的条件: 1. T 5, 且 N 40时, 用非校正的公式 2. 1 T < 5,且N 40时,用连续性校正公 式 3. T <1 或 N< 40, 用 Fisher 精确概率法

例10-9 某医生收集到两种药物治疗白色葡萄球 菌败血症疗效的资料,结果见表10-8,问两 种药物疗效之间的差别有无统计学意义?处理 甲药 乙药 合计 有效 28 (26.09) 12 (13.91) 40 无效 2 (3.91) 4 (2.09) 6 合计 30 16 46

本文来源:https://www.bwwdw.com/article/d54i.html

Top