8.4列联表独立性分析案例1

更新时间:2023-06-05 12:00:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

湘教版列联表独立性分析案例

8.4列联表独立性 列联表独立性 分析案例1( 分析案例 (一)高二数学 选修2-32011-6-30 郑平正 制作

第三章

统计案例

湘教版列联表独立性分析案例

在许多实际问题中,我们需要考察两种因素的关系。例如: 在许多实际问题中,我们需要考察两种因素的关系。例如: 数学解题能力是否与性别有关;高考升学率是否与补课有关。 数学解题能力是否与性别有关;高考升学率是否与补课有关。为 了分析这些问题,我们需要获取一些数据, 了分析这些问题,我们需要获取一些数据,并对数据进行分析处 对所得的结论作出判断。 理,对所得的结论作出判断。某医疗机构为了了解呼吸道疾病与吸烟是否有关, 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽 样调查, 个成年人, 样调查,共调查了 100 个成年人,其中吸烟者 54 人,不吸烟者 46 人,调查结果是:吸烟的 54 人中 39 人患病, 15 人不患病; 调查结果是: 人患病, 人不患病; 人患病, 人不患病。 不吸烟的 46 人中 21 人患病, 25 人不患病。

根据这些数据能否断定:患肺癌与吸烟有关吗? 根据这些数据能否断定:患肺癌与吸烟有关吗?

湘教版列联表独立性分析案例

案例 患肺癌与吸烟是否有关? 肺癌与吸烟的调查数据 患肺癌 吸烟 不吸烟 总计 未患肺癌 总计

n11 =39 n21 =21 n+1 =60

n12 =15 n22 =25 n+2 =40

n1+ =54 n2+ =46

n =100

分析: 吸烟的人在调查总人数中所占的百分比:54% 患肺癌的人在调查总人数中所占的百分比:60% 既吸烟又患肺癌的人在调查总人数中所占的百分比:39% 显然, × 60% ≠ 39%。 54% 我们有理由相信吸烟是与肺癌有关的。

湘教版列联表独立性分析案例

n11 n1+ n+1 若 ,则吸烟是与肺癌无关联,可以认为它们相 = n n n n1+ n+1 互独立。这个式子还可以改写为:n11 = .在吸烟与患肺癌 n n1+ n+1 问题中, ≈ 32.4<39 ,这说明既吸烟又患肺癌的人数比独 n立时要多,在这种情况下,吸烟会使患肺癌的人数增加。

湘教版列联表独立性分析案例

实际上,为了应用概率论得到统计量的近似的分布,统计学 家最终选用了:

n11 n1+ n+1 2 n12 n1+ n+2 2 ( ) ( ) n n + n n n χ 2 = n[ n n1+ n+1 n1+ n+2 n n n n n21 n+1 n2+ 2 n22 n2+ n+2 2 ) ( ) ( n n + n n n + n n+1 n2+ n2+ n+2 n n n n来衡量独立性的大小

n(n11n22 n12 n21 ) 2 2 可以化简为 χ = n1+ n2+ n+1n+2

湘教版列联表独立性分析案例

怎样描述实际观测值与估计值的差异呢? 怎样描述实际观测值与估计值的差异呢? 统计学中采用

( 观 测 值 预 期 值 )2 用 卡 方 统 计 量 :χ 2 = ∑ 预期值 来刻画实际观测值与估计值的差异.a+b a+c 2 a+b b+d 2 (a n × × ) (b n × × ) 2 n n n n k = + a+b a+c a+b b+d n× × n× × n n n n c+d a+c 2 c+d b+d 2 (c n × × ) (d n × × ) n n n n + + c

+d a+c c+d b+d n× × n× × n n n n

n(ad bc) 2 化简得 k 2 = (a + c)(b + d )(a + b)(c + d )

湘教版列联表独立性分析案例

独立性检验用χ2统计量研究 这类问题的方法 步骤

通过数据和图表分析, 通过数据和图表分析,得到 结论是: 结论是:吸烟与患病有关 结论的可靠 程度如何? 程度如何?

第一步: 假设吸烟 患病之间没有关系 吸烟和 第一步:H0: 假设吸烟和患病之间没有关系 第二步:列出2×2列联表 第二步:列出2吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d

湘教版列联表独立性分析案例

第三步:引入一个随机变量: 第三步:引入一个随机变量:卡方统计量

k =2

( a + b )( c + d )( a + c )( b + d )其中 n = a + b + c + d

n ( ad bc )

2

第四步:查对临界值表,作出判断。 第四步:查对临界值表,作出判断。P(χ2 ≥x0) 0.50 0.40 0.25 0.15 x0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

湘教版列联表独立性分析案例

P(χ2 ≥x0) 0.50 0.40 0.25 0.15 x0

0.10

0.05 0.025 0.010 0.005 0.001

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

例如 0.1%把握认为A 99.9%把握认 0.1%把握认为A 99.9%把握认 把握认为 χ > 10.828 与B无关 为A与B有关 1%把握为 把握为A 1%把握为A与B 99%把握认 99%把握认 2 χ > 6.635 无关 为A与B有关 90%把握认 90%把握认 10%把握认为 10%把握认为 2 χ > 2.706 为A与B有关 A与B无关 没有充分的依据显示A 没有充分的依据显示A与B有关 2 χ < 2.706 但也不能显示A ,但也不能显示A与B无关2

湘教版列联表独立性分析案例

独立性检验 患病之间没有关系 解:H0: 吸烟和患病之间没有关系 患病 吸烟 不吸烟 总计 通过公式计算 39 21 60 不患病 15 25 40 总计 54 46 100

100 ( 39 × 25 15 × 21) χ = ≈ 7.307 54 × 46 × 60 × 402 2

湘教版列联表独立性分析案例

成立的情况下, 已知在 H 0 成立的情况下,

P ( χ ≥ 6.635) ≈ 0.0102

χ 2大于6.635概率非常 成立的情况下, 6.635概率非常 即在 H 0 成立的情况下, 大于6.635

小,近似为0.010 近似为0.0102

=7.307的观测值远大于6.635, 的观测值远大于6.635 现在的 χ =7.307的观测值远大于6.635,出 现这样的观测值的概率不超过0.010 0.010。 现这样的观测值的概率不超过0.010。 故有99%的把握认为H 不成立,即有99% 99%的把 故有99%的把握认为H0不成立,即有99%的把 99%的把握认为 握认为“患病与吸烟有关系” 握认为“患病与吸烟有关系”。

湘教版列联表独立性分析案例

500人身上试验某种血清预防感冒作用 人身上试验某种血清预防感冒作用, 例 1. 在 500 人身上试验某种血清预防感冒作用 , 把他们 P(χ2 ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外500 500名未用血清的人的感冒记 一年中的感冒记录与另外 500 名未用血清的人的感冒记 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 录作比较

,结果如表所示。 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 感冒的作用? 未感冒 感冒 合计 使用血清 未使用血清 合计 258 216 474 242 284 5262

500 500 1000

感冒与是否使用该血清没有关系。 解:设H0:感冒与是否使用该血清没有关系。

1000(258 × 284 242 × 216 ) 2 ≈ 7.075 χ = 474 × 526 × 500 × 500 因当H 成立时, 的概率约为0.01,故有 因当 0成立时,χ2≥6.635的概率约为 的概率约为 ,故有99%的把握认 的把握认 为该血清能起到预防感冒的作用。 为该血清能起到预防感冒的作用。

湘教版列联表独立性分析案例

例2:为研究不同的给药方式(口服与注射0.010 0.005 0.001 P(χ≥x为研究不同的给药方式(口服与注射)和药的效 0.10 0.05 0.025 ) 0) 0.50 0.40 0.25 0.15 果(有效与无效)是否有关,进行了相应的抽样调查, x0 有效与无效)是否有关,进行了相应的抽样调查, 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 调查的结果列在表中,根据所选择的193 193个病人的数 调查的结果列在表中,根据所选择的193个病人的数 能否作出药的效果和给药方式有关的结论? 据,能否作出药的效果和给药方式有关的结论? 口服 注射 合计χ2 =

有效 58 64 122

无效 40 31 712

合计 98 95 193

药的效果与给药方式没有关系。 解:设H0:药的效果与给药方式没有关系。

193(58 × 31 64 × 40 ) ≈ 1.3896 <2.072 122 × 71 × 98 × 95 因当H 成立时, 的概率大于15%,故不能否定假设 因当 0成立时,χ2≥1.3896的概率大于 的概率大于 , H0,即不能作出药的效果与给药方式有关的结论。 即不能作出药的效果与给药方式有关的结论。

湘教版列联表独立性分析案例

例3:气管炎是一种常见的呼吸道疾病,医药研究人 :气管炎是一种常见的呼吸道疾病, P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 员对两种中草药治疗慢性气管炎的疗效进行对比, 员对两种中草药治疗慢性气管炎的疗效进行对比, x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 所得数据如表所示, 它们的疗效有无差异? 所得数据如表所示,问:它们的疗效有无差异? 复方江剪刀草 胆黄片 合计 有效 184 91 275 无效 61 9 702

合计 245 100 345

两种中草药的治疗效果没有差异。 解:设H0:两种中草药的治疗效果没有差异。

345(184 × 9 61 × 91) 2 ≈ 11.098 χ = 275 × 70 × 245 × 100

因当H 成立时, 的概率为0.001,故有 因当 0成立时,χ2≥10.828的概率为 的概率为 ,故有99.9%的把握 的把握 认为,两种药物的疗效有差异。 认为,两种药物的疗效有差异。

湘教版列联表独立性分析案例

课堂小结 1.在统计学中,独立性检验就是检验两个分类变量是否有关 系的一种统计方法。2.为使不同的样本容量的数据有统一

的评判标准,构造了一

n(n11n22 n12 n21 ) 2 2 个随机变量 χ = n1+ n2+ n+1n+2P(χ2 ≥x0) 0.50 0.40 0.25 0.15 x0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

作业 P87 习题 10

本文来源:https://www.bwwdw.com/article/ete1.html

Top