04 第四节 正态总体的置信区间

更新时间:2023-10-13 15:43:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第四节 正态总体的置信区间

与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。在构造正态总体参数的置信区间的过程中,t分布、?2分布、F分布以及标准正态分布N(0,1)扮演了重要角色.

本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间;

4. 双正态总体均值差(方差已知)的置信区间;

5. 双正态总体均值差(方差未知但相等)的置信区间; 6. 双正态总体方差比的置信区间.

注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为1??的置信区间, 其区间长度在所有这类区间中是最短的.

内容分布图示

★ 引言

★ 单正态总体均值(方差已知)的置信区间

★ 例1 ★ 例2

★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4

★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ *双正态总体均值差(方差未知)的置信区间

★ 例7 ★ 例8

★ *双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4

内容要点:

一、单正态总体均值的置信区间(1)

设总体X~N(?,?2), 其中?2已知, 而?为未知参数, X1,X2,?,Xn是取自总体X的一个样本. 对给定的置信水平1??, 由上节例1已经得到?的置信区间

?????X?u?,X?u? ??/2?/2??,

nn??

二、单正态总体均值的置信区间(2)

设总体X~N(?,?2),其中?,?2未知, X1,X2,?,Xn是取自总体X的一个样本. 此时可用?2的无偏估计S2代替?2, 构造统计量

X??T?,

S/nX??~t(n?1). 从第五章第三节的定理知T?S/n对给定的置信水平1??, 由

??X??P??t?/2(n?1)??t?/2(n?1)??1??,

S/n???SS?即 P?X?t?/2(n?1)????X?t?/2(n?1)???1??,

nn??因此, 均值?的1??置信区间为

?SS???X?t(n?1)?,X?t(n?1)??/2?/2??.

nn??

三、单正态总体方差的置信区间

上面给出了总体均值?的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差?2进行区间估计.

设总体X~N(?,?2),其中?,?2未知,X1,X2,?,Xn是取自总体X的一个样本. 求方差

?2的置信度为1??的置信区间. ?2的无偏估计为S2, 从第五章第三节的定理知,

n?12S~?2(n?1), 2?对给定的置信水平1??, 由

n?1??2P??12??/2(n?1)?2S2???(n?1)??1??,/2??? 22??(n?1)S??(n?1)SP?2??2?2??1??,???(n?1)?(n?1)1??/2??/2?于是方差?2的1??置信区间为

2??(n?1)S2(n?1)S????2(n?1),?2(n?1)?

1??/2??/2?而方差?的1??置信区间

?(n?1)S2(n?1)S2???. ,22????1??/2(n?1)?/2(n?1)??

四、双正态总体均值差的置信区间(1)

在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。

2设X是总体N(?1,?12)的容量为n1的样本均值, Y是总体N(?2,?2)的容量为n2的样本

2均值, 且两总体相互独立, 其中?12,?2已知.

因X与Y分别是?1与?2的无偏估计, 从第五章第三节的定理知

对给定的置信水平1??, 由

???(X?Y)?(?1??2)?P??u?/2??1??,

22?/n??/n2??112??可导出?1??2的置信度为1??的置信区间为

2222???X?Y?u??1??2,X?Y?u??1??2?.

?/2?/2?n1n2n1n2???(X?Y)?(?1??2)?122/n1??2/n2~N(0,1),

五、双正态总体均值差的置信区间(2)

设X是总体N(?1,?2)的容量为n1的样本均值, Y是总体N(?2,?2)的容量为n2的样本

均值, 且两总体相互独立, 其中?1,?2及?未知.从第五章第三节的定理知

T?2其中Sw?(X?Y)?(?1??2)Sw1/n1?1/n2~t(n1?n2?2).

n1?1n2?12S12?S2.

n1?n2?2n1?n2?2对给定的置信水平1??, 根据t分布的对称性, 由

P{|T|?t?/2(n1?n2?2)}?1??,

可导出?1??2的1??置信区间为

???(X?Y)?t?/2(n1?n2?2))?Sw1?1,(X?Y)?t?/2(n1?n2?2))?Sw1?1?. ?n1n2n1n2???

六、双正态总体方差比的置信区间

22设S12是总体N(?1,?12)的容量为n1的样本方差, S2是总体N(?2,?2)的容量为n2的样本

2222方差, 且两总体相互独立, 其中?1,?1未知. S12与S2分别是?12与?2的无偏估计, ,?2,?2从第五章第三节的定理知

??2?S12F??????S2~F(n1?1,n2?1),

?1?2对给定的置信水平1??, 由

P{F1??/2(n1?1,n2?1)?F?F?/2(n1?1,n2?1)}?1??, ?1S12?121S12?P??2?2??2??1??, F(n?1,n?1)S?F(n?1,n?1)S2?2221??/212??/212可导出方差比?12/?2的1??置信区间为

?1S121S12???2?. ?F(n?1,n?1)?S2,F?21??/2(n1?1,n2?1)S2?2??/212

例题选讲:

单正态总体均值的置信区间(1)

例1(讲义例1)某旅行社为调查当地一旅游者的平均消费额, 随机访问了100名旅游者, 得知平均消费额x?80元. 根据经验, 已知旅游者消费服从正态分布, 且标准差??12元, 求该地旅游者平均消费额?的置信度为95%的置信区间.

对于给定的置信度 1???0.95, ??0.05, ?/2?0.025,

查标准正态分布表u0.025?1.96, 将数据n?100, x?80, ??12, u0.025?1.96, 代入x?u?/2??n计算得?的置信度为95%的置信区间为(77.6,82.4), 即在已知??12情形下, 可以95%的置信度认为每个旅游者的平均消费额在77.6元至82.4元之间.

例2(讲义例2)设总体X~N(?,?2), 其中?未知, ?2?4,X1,?,Xn为其样本. (1) 当n?16时, 试求置信度分别为0.9及0.95的?的置信区间的长度. (2) n多大方能使?的90%置信区间的长度不超过1? (3) n多大方能使?的95%置信区间的长度不超过1? 解 (1) 记?的置信区间长度为A, 则

??(X?u?/2??/n)?(X?u?/2??/n)?2u?/2??n,

于是当1???90%时, ??2?1.65?2/16?1.65, 当1???95%时, ??2?1.96?2/16?1.96.

(2) 欲使??1, 即2u?/2??/n?1, 必须n?(2?u?/2)2, 于是, 当1???90%时,

n?(2?2?1.65)2, 即n?44, 即n至少为44时, ?的90%置信区间的长度不超过1. (3) 当1???95%时,类似可得n?62.

注: ①由(1)知, 当样本容量一定时, 置信度越高, 则置信区间长度越长, 对未知参数的估计精度越低.

②在置信区间的长度及估计精度不变的条件下, 要提高置信度, 就须加大样本的容量n,以获得总体更多的信息.

单正态总体均值的置信区间(2)

例3(讲义例3)某旅行社随机访问了25名旅游者, 得知平均消费额x?80元, 样本标准差s?12元, 已知旅游者消费额服从正态分布, 求旅游者平均消费额?的95%置信区间.

对于给定的置信度95%(??0.05),t?/2(n?1)?t0.025(24)?2.0639,

将x?80, s?12, n?25, t0.025(24)?2.0639, 代入计算得?的置信度为95%的置信区间为(75.05,84.95), 即在?2未知情况下, 估计每个旅游者的平均消费额在75.05元至84.95元之间, 这个估计的可靠度是95%.

注: 与例1相比, 在标准差?未知时, 用样本的标准差S给出的置信区间偏差不太大.

例4(讲义例4) 有一大批糖果.现从中随机地取16袋, 称得重量(以克计)如下:

506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496

设袋装糖果的重量近似地服从正态分布, 试求总体均值?的置信水平为0.95的置信区间.

1???0.95, ?/2?0.025, n?1?15, t0.025(15)?2.1315,

由给出的数据算得x?5.03.75, s?6.2022. 可得到均值?的一个置信水平为0.95的置信区间为(503.75?2.1315?6.2022/16), 即(500.4,507.1).

这就是说, 估计袋装糖果重量和均值在500.4克与507.1克之间, 这个估计的右信程度为95%. 若以此区间内任一值作为?的近似值, 其误差不大于

2?2.1315?6.2022/16?6.61(克)

这个误差估计的可信程度为95%.

单正态总体方差的置信区间

例5(讲义例5)为考察某大学成年男性的胆固醇水平, 现抽取了样本容量为25的一样本, 并测得样本均值x?186, 样本标准差s?12. 假定所论胆固醇水平X~N(?,?2),?与

?2均未知. 试分别求出?以及?的90%置信区间.

?的置信度为1??的置信区间为(x?t?/2(n?1)?s/n.

按题设数据??0.1,x?186,s?12,n?25, 查表得t0.1/2(25?1)?1.7109, 于是

t?/2(n?1)?s/n?1.7109?12/25?4.106, 即(181.89,190.11).

?(n?1)S2?(n?1)S2?的置信度为1??置信区间为?,22???/2(n?1)?1??/2(n?1)????. ??22查表得?0.1/2(25?1)?36.42,?1?0.1/2(25?1)?13.85, 于是, 置信下限和置信上限分别为

24?122/36.42?9.74,所求?的90%置信区间为(9.74,15.80).

24?122/13.85?15.80,

双正态总体均值差的置信区间(1)

例6(讲义例6)2003年在某地区分行业调查职工平均工资情况: 已知体育、卫生、社会福利事业职工工资X (单位:元)~N(?1,2182); 文教、艺术、广播事业职工工资Y (单位:元)

~N(?2,2272), 从总体X中调查25人, 平均工资1286元, 从总体Y中调查30人, 平均工资1272元, 求这两大类行业职工平均工资之差的99%的置信区间.

由于1???0.99, 故??0.01, 查表得u0.005?2.576,

22又n1?25, n2?30, ?1?2182, ?2?2272, x?1286, y?1272,

于是?1??2的置信度为99%的置信区间为[?140.96,168.96], 即两大类行业职工平均工资相差在?140.96~168.96之间, 这个估计的置信度为99%.

双正态总体均值差的置信区间(2) 例7 (讲义例7) A, B两个地区种植同一型号的小麦. 现抽取了19块面积相同的麦田, 其中9块属于地区A, 另外10块属于地区B, 测得它们的小麦产量(以kg计)分别如下:

地区A: 100, 105, 110, 125, 110, 98, 105, 116, 112;

地区B: 101, 100, 105, 115, 111, 107, 106, 121, 102, 92.

设地区A的小麦产量X~N(?1,?2), 地区B的小麦产量Y~N(?2,?2), ?1,?2,?2均未知. 试求这两个地区小麦的平均产量之差?1??2的90%置信区间.

由题意知所求置信区间的两个端点分别为(X?Y)?t?/2(n1?n2?2)?Sw?11?. n1n2由??0.1, n1?9, n2?10, 查表得t0.1/2(17)?1.7396, 按已给数据计算得

22x?109,y?106,s1?550/8,s2?606/9, 22(n1?1)s1?(n2?1)s2??68,sw?8.246,

n1?n2?22sw

本文来源:https://www.bwwdw.com/article/zr4f.html

Top