第十章 分类变量资料的统计分析
更新时间:2023-08-26 08:10:01 阅读量: 教育文库 文档下载
- 第十章光结局和夜结局推荐度:
- 相关推荐
统计资料的类型数值变量: 定量资料 分类变量: 定性资料 无序分类:(计数资料) 二项分类 多项分类 连续型计量资料 离散型计量资料
有序分类 : 变量之间有程度的差 别, 且排列有序. (等级资料)
变量的转换: 定量
定性
第十章 分类变量资料的统计分析第一节 统计描述
一.描述指标(相对数)1. 率(rate) : R n K N 单位: %,‰,万分率,10万分率 2. 构成比 (constituent ratio) 单位: % 特点: 3. 相对比 (relative ratio) 常用率比
例10-1 某研究者2000年对某校的初中生进行了近视患病 情况调查,试计算各年级近视患病率和构成比及 三年级和一年级患病率的相对比.年级 一年级 二年级 三年级 合计 检查人数 442 428 405 1275 患病人数 患病率 67 68 74 209 15.16 15.89 18.27 16.39 构成比 32.06 32.53 35.41 100.0 相对比
1.2
二. 应用相对数时注意事项1. 分母不宜太小 2. 率和构成比的区别 3. 样本含量不等的几个率的平均值不等于 几个率 的算数平均值 4. 对率或构成比进行比较时,应注意资料的可比性 5. 率的标准化 6. 两样本率进行比较时应进行假设检验
三.率的标准化1.基本思想: 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率,使得出的标 准化率具有可比性. 2.计算方法: 直接法: 已知各年龄组的实际发病率,用标准人口数或标准人口构成进行计算
间接法: 标准化死亡比 (SMR), 实际死亡数与预期死亡数的比
3. 率的标准化应注意的问题
第二节 计数资料统计推断一. 率的抽样误差和标准误 样本率和总体率或样本率之间存在的差异,称 抽样误差.率的抽样误差用率的标准误表示.( p or Sp). p (1 )n
p(1 P) Sp n
( p =阳性率, 1- p=阴性率)
二. 总体率的区间估计1. 正态近似法:条件: n 足够大,样本率p 或1-p均不太 小时, 即 np 和 n(1-p)>5
p u × Sp 2. 查表法:当n ≤50, 样本率p 接近于0或1时,该资料服从 二项分布,用查表法估计总体率可信区间
例10-5 为了解某地乙肝表面抗原携带情况,某研究者在该 地人群中随机检测了该地200人,乙肝表面抗原阳性7 人,乙肝表面抗原携带率为3.5%,试计算标准误并估 计95%和99%可信区间.n=200 X=7, P=3.5%Sp p (1 P ) n
95%可信区间: 3.5% 1.96 Sp
99%可信区间: 3.5% 2.58 Sp
三. 两个率比较的u 检验当np和 n(1-p) ≧5 时 样本率的分布近似正态分布— u 检验(一) 检验步骤: 1. 建立假设, 确定检验水准α H0: 1= 2 H1: 1≠ 2 α =0.05
2. 选择检验方法, 计算 u 值3. 确定 P 值, 判断结果
(二)资料类型1. 样本率与总体率的比较 (例10-6)计算公式:u p p
p
(1 )n
2. 两个样本率的比较 (例10-7) 计算公式:
u
p1 p
2 1 1 pc(1 pc )( ) n1 n 2
X1 X 2 pc n1 n2
例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?处理 A药 B药 合计 有效 68 (64.82) 52 (55.18) 120 无效 6 (9.18) 11(7.82) 17 合计 74 63 137 有效率(%) 91.89 82.54 87.59
H0: 1= 2 H1: 1≠ 2 =0.05
第三节 X2 检验 (chi-square test)基本思想 检验实际频数与理论频数的吻合程度,实 际频数与理论频数越相近, X2 值越小; 反 之,实际数与理论数相差越大, X2值越大.计算公式:
2
A T T
2
理论频数的计算: TRC= nRnC / n df=(行数-1)(列数-1)
例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?处理 A药 B药 合计 有效 68 (64.82) 52 (55.18) 120 无效 6 (9.18) 11(7.82) 17 合计 74 63 1372
有效率(%) 91.89 82.54 87.59
2
A T T
二. Χ2 检验的基本步骤 1. 建立检验假设,确定检验水准 H0: 1= 2 H1: 1 2 =0.052. 计算Χ2 值 资料类型不同,计算公式不同 3. 确定 P 值, 判断结果 根据查Χ2 界值表, 确定P值
三. 四格表资料的Χ2 检验
处理 A药 B药 合计
有效 a c a+c
无效 b d b+d
合计 a+b c+d n
1. 四格表资料的Χ2 检验的专用公式(ad bc) 2 n 2 (a b)(c d )( a c)(b d )df =(R-1)(C-1)=1
2. 四格表资料的Χ2 检验的校正 -- Yates 连续校正校正公式:
2
A T 0 .5 T
2
2
ad bc n / 2 n2
(a c)(b d )( a b)(c d )
校正的目的:英国统计学家(Yates)认为 2分布是一种连续 性分布,而四格表中的资料属离散性分布,得到 的 2统计量的抽样分布也是离散的.因此,为改 善 2统计量分布的连续性,建议进行校正.
连续性校正应遵循的条件: 1. T 5, 且 N 40时, 用非校正的公式 2. 1 T < 5,且N 40时,用连续性校正公 式 3. T <1 或 N< 40, 用 Fisher 精确概率法
例10-9 某医生收集到两种药物治疗白色葡萄球 菌败血症疗效的资料,结果见表10-8,问两 种药物疗效之间的差别有无统计学意义?处理 甲药 乙药 合计 有效 28 (26.09) 12 (13.91) 40 无效 2 (3.91) 4 (2.09) 6 合计 30 16 46
正在阅读:
第十章 分类变量资料的统计分析08-26
交通运输行业:跨境电商物流产业链有望持续受益,预计2021年快递业务量超1000亿票07-25
夏天的荷花池作文400字07-11
如何营造活跃的小学数学课堂教学氛围05-17
3 广东省仿制药一致性评价生物等效性试验生物样品分析规范(试行)05-17
机电系统计算机控制复习题07-10
2014年度《通信施工企业管理人员》安全生产培训考试试卷和答案01-24
家的味道作文350字07-14
文化遗产概览课后考试答案10-21
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 十章
- 统计分析
- 变量
- 分类
- 资料
- 密度计算专题突破
- 幼儿园消毒记录表
- 2016广西公务员培训考试-十三五规划总体思路的解读考试答案
- 2013届高考理科数学一轮复习课时作业(61)离散型随机变量及其分布列
- 方剂学--第一章 解表剂
- 横截式方程在圆锥曲线中的妙用
- 金融危机下大学生就业形式分析及对策
- 国家助学贷款提前还贷攻略
- 堡坎施工协议
- 学习教育法律法规的收获doc
- 托福听力分类词汇汇总
- windows2008服务器搭建
- 摄影作品分析
- 合同管理师继续教育考试答案
- 浅谈无线传感器网络技术及其应用
- 2020届高考地理人教版(选考)一轮复习强化训练:流域的综合开发——以美国田纳西河流域为例(含解析)
- 手拉手供电配网自动化方案
- 四年级下册数学教案-6.1《小数加减法(例1)》 人教新课标1
- 简易OA系统功能测试报告-小强
- 行政执法人员取得行政执法证件考试题库