统计学第五版课后答案(贾俊平)
更新时间:2023-04-14 03:42:01 阅读量: 实用文档 文档下载
第四章统计数据的概括性度量
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:
Statistics
10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75
单位:周岁
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)计算众数、中位数:
排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
1
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
2
3
1、确定组数: ()l g 25l g () 1.398
111 5.64l g (2)l g 20.30103
n K =+
=+=+=,取k=6
2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
分组后的直方图:
客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
Mean7
Std. Deviation0.714143
Variance0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:
Statistics
百货公司每天的销售额(万元)
4
30
Missing 0 Mean 274.1000 Median 272.5000 Std. Deviation 21.17472 Percentiles 25 260.2500
50 272.5000
75
乙的低成本的产品多。
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:
Statistics
120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis
5
100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?
(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1=x x
s
-
=
5560
5
-
=-1;Z2=
x x
s
-
=
6560
5
-
=1,根据经验规则,男生大约有68%的人体重在55kg
一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 计算标准分数:
Z1=x x
s
-
=
4050
5
-
=-2;Z2=
x x
s
-
=
6050
5
-
=2,根据经验规则,女生大约有95%的人体重在40kg
一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
Z A=x x
s
-
=
115100
15
-
=1;Z B=
x x
s
-
=
425400
50
-
=0.5
因此,A项测试结果理想。
6
7
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该
(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么
? 均值不相等,用离散系数衡量身高差异。 (2)
4.12 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:
8
要求:
(1)你准备采用什么方法来评价组装方法的优劣?
均值不相等,用离散系数衡量身高差异。
(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。
解:对比均值和离散系数的方法,选择均值大,离散程度小的。
方法A 方法B 方法C
平均 165.6 平均 128.7333333 平均 125.5333333
标准差 2.131397932 标准差 1.751190072 标准差
2.774029217 离散系数: V A =0.01287076,V B = 0.013603237,V C = 0.022097949
均值A 方法最大,同时A 的离散系数也最小,因此选择A 方法。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计量来反映投资的风险?
标准差或者离散系数。
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
选择离散系数小的股票,则选择商业股票。
(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?
考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。
第五章 概率与概率分布
5.1 略
5.2 P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35%
5.3 因为()()P AB P AB P(AB)=1/3++;()()
P B (A(B+B))=P(AB)P AB =1/3P =+ ()()P A (A(B+B))=P(AB)P AB =1/3-1/9=2/9P =+
5.4 ()()P AB P AB P(AB)P(AB)=1+++;
()()P A|B P AB /()1/6P B ==;
()P AB 1/6*1/31/18∴==
()()P A (A(B+B))=P(AB)P AB P =+;()P AB 1/31/185/18=-=
同理()()P B (B(A+A))=P(AB)P AB P =+;()
P AB =518/ ()()11/185/185/18P A|B P AB /()7/1211/3
P B ---==
=- 5.5 (1)()P(A)P B 0.8*0.70.56==;(2)()P A+B (A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94P = (3)()P A+B (A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38P =
5.6 ()()(A P B|A 96%*75%=0.72P B P ==)
5.7 ()()1/2P A|B P AB /()2/334
P B ===/
9 5.8 贝叶斯公式:
()()()()
k k k P A )P(B|A 10%*20%P A |B 3.63%P A P B|A 10%*20%50%*50%40%*70%=
==++∑ ()()()()
k k k P A )P(B|A 50%*50%P A |B 45.45%P A P B|A 10%*20%50%*50%40%*70%===++∑ ()()()()k k k P A )P(B|A 40%*70%P A |B 50.9%P A P B|A 10%*20%50%*50%40%*70%===++∑
5.9 贝叶斯公式: ()()()()
k k k P A )P(B|A 30%*0.1P A |B 0.249P A P B|A 30%*0.127%*0.0525%*0.218%*0.15===+++∑ ()()()()k k k P A )P(B|A 27%*0.05P A |B 0.112P A P B|A 30%*0.127%*0.0525%*0.218%*0.15
===+++∑ 5.10 P(x=0)=0.25; P(x=1)=0.5; P(x=2)=0.25
5.11 (1) P(x=1)=0.20; P(x=10)=0.01; P(x=100)=0.001
(2)Ex=1*0.2+10*0.01+100*0.001=0.4 5.12 (1) 2
31378
x dx θθ=?,2θ∴= (2) 3213 1.58x Ex dx ==?;21340.158x Dx dx ==? 5.13 (5,0.25)x B ,学生凭猜测至少答对4道的概率为:
(4)(5)P x P x =+==441550550.250.750.250.75C C +=164 5.14 P(x=k)=λ^k×e^(-λ)/k!①
P(x=k+1)=λ^(k+1)×e^(-λ)/(k+1)!②
②/①得 P(x=k+1)/P(x=k)=λ/(k+1)
令P(x=k+1)/P(x=k)>1, 则λ>k+1, k<λ-1
令P(x=k+1)/P(x=k)<1, 则λ
若λ<2, 则P(x=k)随着k 增大而减小, ∴k=1时最大
若λ>2, 则P(x=1)<……
P(x=[λ-1]+2)>……,
∴k=[λ-1]+1=[λ]是最大
综上, λ<2时,k=1;λ>2时,k=[λ](写成分段的形式,[]是取整符号)
5.16 (1)0.6997 (2)0.5
5.17 173.913
5.18 (1)0.9332 (2)0.383
第六章 统计量及其抽样分布
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从()2,N
n σμ的正态分布,由正态分布,标准化得到标准正态分布:
x ()0,1N ,因此,样本均值不超过总体均值的概率P 为: ()0.3P x μ-≤
=P ?≤
=x P ??≤≤ =()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159
10 因此,()
0.3P x μ-≤=0.6318 6.2 ()0.3P Y μ-≤
=P ?≤
=x P ??≤≤
=(||P z ≤
=(21φ-=0.95
查表得: 1.96= 因此n=43
6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使
得6210.95i i P Z b =??≤= ???
∑ 解:由于卡方分布是由标准正态分布的平方和构成的:
设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量
222212χ=+++n Z Z Z 服从自由度为n 的χ2分布,记为χ2~ χ2(n )
因此,令622
1i i Z χ==∑,则()62
22
16i i Z χχ==∑,那么由概率6210.95i i P Z b =??≤= ???∑,可知: b=()210.956χ-,查概率表得:b=12.59
6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差2221
1(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得
212()0.90p b S b ≤≤=
解:更加样本方差的抽样分布知识可知,样本统计量:
2
22(1)~(1)
n s n χσ-- 此处,n=10,21σ=,所以统计量
2
2222(1)(101)9~(1)1
n s s s n χσ--==- 根据卡方分布的可知:
()()2212129990.90P b S b P b S b ≤≤=≤≤=
又因为:
()()()2221221911P n S n ααχχα--≤≤-=-
因此:
()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-=
()()()()2222121999191P b S b P n S n ααχχ-?≤≤=-≤≤-
()()()2220.950.059990.90P S χχ=≤≤=
则:
()()2210.9520.05
99,99b b χχ?==()()220.950.051299,9
9b b χχ?== 查概率表:()20.959χ=3.325,()20.059χ=19.919,则 ()20.95199b χ==0.369,()20.05299b χ==1.88
11 第七章 参数估计
7.1
(1) x σ
==
(2) 2x z α?=
=1.96=1.5495
7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15
元,求样本均值的抽样标准误差。x σ
===2.143 (2)在95%的置信水平下,求估计误差。
x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z α
因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2
(3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x
z x z αα?-+ ?=()120 4.2,120 4.2-+=(115.8,124.2)
7.3 2x z x z αα?-+ ?
=104560±(87818.856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???或2,s x N n μ?? ??
?
置信区间为:22x z x z αα?-
+ ?
=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97)
(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35)
(3)构建μ的99%的置信区间。
2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09)
7.5 (1)2x
z α±25 1.96±(24.114,
25.886) (2)2
x z α±119.6 2.326±=(113.184,
126.016) (3)2
x z α± 3.419 1.645±(3.136,3.702)
7.6 (1)2x
z α±8900 1.96±=(8646.965,
9153.035) (2)2
x z α±8900 1.96±=(8734.35,
9065.65) (3)2
x z α±8900 1.645±=(8761.395,9038.605)
12 (4
)2x z α±
8900 2.58±(8681.95,9118.05) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他
解:
(1
)样本均值x =3.32,样本标准差s=1.61
1α-=0.9,
t=2z α=0.05z =1.645,2x z α± 3.32 1.645±=(2.88,3.76) 1α-=0.95,t=2z α=0.025z =1.96
,x z α± 3.32 1.96±(2.79,3.85) 1α-=0.99,t=2z α=0.005z =2.576
,2x
z α± 3.32 2.76±(2.63,4.01) 7.8 2
x t α±
=10 2.365±7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:
10 3 14 8
6 9 12 11
7 5 10
15 9 16 13 2
假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本,总体方差未知,用t 统计量x t =()1t n -
均值=9.375,样本标准差s=4.11, 1α-=0.95,n=16,()21t n α
-=()0.02515t =2.13 置信区间:()()2
11x t n x t n αα?--+- ?
=9.375 2.13 2.13?-+ ?=(7.18,11.57)
7.10 (1) 2x z α±149.5 1.96±=(148.8695,150.1305) (2)中心极限定理
7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某天生产的一批产品中按(1)确定该种食品平均重量的95%的置信区间。
解:大样本,总体方差未知,用z 统计量:x z =()0,1N
13 样本均值=101.4,样本标准差s=1.829,1α-=0.95,2z α=0.025z =1.96
置信区间:22x z x z αα?-+ ?
=101.4 1.96 1.96?-+ ?=(100.89,101.91) (2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计。大样本,总体方差未知,用z 统计量:
z =()0,1N
样本比率=(50-5)/50=0.9,1α-=0.95,2z α=0.025z =1.96
置信区间:
22p z p z αα? -+ ?
=
0.9 1.96 1.96? -+ ?=(0.8168,0.9832) 7.12 正态分布,大样本,方差未知
2x z α
±=16.128 2.576±(15.679,16.576) 7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工。得到
解:小样本,总体方差未知,用t 统计量:x t =()1t n -
均值=13.56,样本标准差s=7.801,1α-=0.90,n=18
,()1
t n α
-=()0.0517t =1.7369
置信区间: ()()211
x t n x t n αα?--+-
?
=13.56 1.7369 1.7369?-+
?
=(10.36,16.75)
7.14 (1)
2p z α±0.51
2.576±(0.33159,0.7041) (2
)2p z α±0.82 1.96±(0.7765,0.8635) (3)2p z α±0.48 1.645±(0.4558,0.5042) 7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。
解:总体比率的估计
14 大样本,总体方差未知,用z 统计量:
z =()0,1N 样本比率=0.23,1α-=0.90,2z α=0.025z =1.645
置信区间:
22p z p z αα? -+ ?
=
0.23 1.645 1.645? -+ ?=(0.1811,0.2789) 1α-=0.95,z α=0.025z
=1.96
22p z p z αα? -+ ?
=
0.23 1.96 1.96? -+ ?=(0.1717,0.2883) 7.16 2222()z s n E
α==22
22.5761000200=166 7.17 (1)222()(1)z n E
αππ-==222.050.4(10.4)0.02-=2522 (2)222
()(1)z n E αππ-==221.960.5(10.5)0.04-=601 (当π未知是,取0.5) (3)222
()(1)z n E αππ-==221.6450.55(10.55)0.05-=328 7.18 (1
)2p z α±
0.64 1.96±(0.5070,0.7731) (2)222()(1)z n E αππ-==221.960.8(10.8)0.1-=62 7.19
7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:
要求:
(1)构建第一种排队方式等待时间标准差的95%的置信区间。
解:估计统计量:()()2221~1n S n χσ
-- 经计算得样本标准差22s =3.318,1α-=0.95,n=10,
()221n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7
15 置信区间:()()()()222222121111n S n S n n αασχχ---≤≤--=90.227290.2272,19.02 2.7???? ???
=(0.1075,0.7574) 因此,标准差的置信区间为(0.3279,0.8703)
(2)构建第二种排队方式等待时间标准差的95%的置信区间。
解:估计统计量:()()2221~1n S n χσ
-- 经计算得样本标准差21s =0.2272,1α-=0.95,n=10,
()221n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7
置信区间:()()()()2
22222121111n S n S n n αασχχ---≤≤--=9 3.3189 3.318,19.02 2.7???? ???
=(1.57,11.06) 因此,标准差的置信区间为(1.25,3.33)
(3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小。
7.21 正态总体,独立小样本,方差未知但相等:
12()x x -±222112212(1)(1)2p n s n s s n n -+-=+-,12(2)df n n +-)
(1)()212
1t n n α+-=()0.051472t +-=1.7291,代入略 (2)()12
1t n n α+-=()0.0251472t +-=2.0930,代入略 (3)()121t n n α+-=()0.051472t +-=2.8609,代入略
7.22
(1)正态或非正态总体,独立大样本,方差未知
12()x x -±(2)正态总体,独立小样本,方差未知但12σσ=:
12()x x -±222
112212(1)(1)2p
n s n s s n n -+-=+-,12(2)df n n +-) (3)正态总体,独立小样本,方差未知12σσ≠但12n n =,122df n n =+-
12()x x -±(4)正态总体,独立小样本,方差未知但12σσ=,12n n ≠:
12()x x -±222112212(1)(1)2p
n s n s s n n -+-=+-,12(2)df n n +-) (5)正态总体,独立小样本,方差未知但12σσ≠,12n n ≠
12()x x -±(其中22212122222
112212()()()11
s s n n df s n s n n n +=+--)
16
(1)计算A 与B 各对观察值之差,再利用得出的差值计算和d s 。 d =1.75,d s =2.62996
(2)设12μμ和分别为总体A 和总体B 的均值,构造12d μμμ=-的95%的置信区间。 解:小样本,配对样本,总体方差未知,用t 统计量
d t =
()1t n -
均值=1.75,样本标准差s=2.62996,1α-=0.95,n=4,()1t n α-=()0.0253t =3.182
置信区间:(
)(
)211d
t n d t n αα?
--+- ?
=1.75 3.182 3.182?
-+ ?
=(-2.43,5.93)
7.24小样本,配对样本,总体方差未知:()2
1t n α
-=()0.025101t -=2.2622
(
)1d t n α±-
=11 2.2622±=(6.3272,15.6728) 7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1p =40%,来自总体2的样本比例为2p =30%。要求: (1)构造12ππ-的90%的置信区间。 (2)构造12ππ-的95%的置信区间。 解:总体比率差的估计
大样本,总体方差未知,用z 统计量:
p p z ππ---=
()0,1N
样本比率p1=0.4,p2=0.3,
置信区间:
122122p p z p p z αα? ---+ ? 1α-=0.90,z α=0.025
z =1.645
122122p p z p p z αα? ---+
? =
0.1 1.645 1.645? -+ ? =(3.02%,16.98%)
1α-=0.95,z α=
0.025z =1.96
122122p p z p p z αα? ---+
? =
0.1 1.96 1.96? -+ ? =(1.68%,18.32%)
17
7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是
要求:构造两个总体方差比1σ/2σ的95%的置信区间。
解:统计量:
2
12
122
2
2
s s
σσ()121,
1F n n --
置信区间:22
112222
12112,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???
21s =0.058,2
2s =0.006,n1=n2=21,1α-=0.95,()2121
,1F n n α--=()0.02520,20F =2.4645, ()12121,1F n n α---=
()
2211
1,1F n n α--
()12121,1F n n α---=()0.97520,20F =
()
0.0251
20,20F =0.4058
()()22
112222
121212,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???
=(4.05,24.6)
7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求估计误差(边际误差)不超过4%,应抽取多大的样本? 解:2
z α
?=
,()
222
1p
z p p n α??-=
?, 1α-=0.95,2z α=0.025z =1.96
()222
1p
z p p n α??-=?=221.960.020.98
0.04??=47.06,取n=48或者50。
7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:2222
x
z n ασ
?=
?
,1α-=0.95,2z α=0.025z =1.96,
222
2x
z n ασ?=
?22
2
1.9612020
?==138.3,取n=139或者140,或者150。
18 第八章 假设检验
8.1 提出假设:H 0:μ=4.55;H 1:μ≠4.55
构建统计量(正态,小样本,方差已知)
:x z
=
=-1.83 求临界值:α=0.05,z α=0.025z =1.96
决策:因为2z z α>-,所有,不拒绝H 0
结论:可以认为现在生产的铁水平均含碳量是4.55
8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:提出假设:H 0:μ≥700;H 1:μ<700
构建统计量(正态, 大样本,方差已知)
:x z
=
=-2 求临界值:当α=0.05,查表得z α=1.645。
决策:因为z <-z α,故拒绝原假设,接受备择假设
结论:说明这批产品不合格。
8.3提出假设:H 0:H 0:μ≤250;H 1:μ>250
构建统计量(正态,小样本,方差已知)
:x z
=
求临界值:α=0.05,z α=0.05z =1.645
决策:因为2z z α>,所有,拒绝H 0
结论:明显增产
8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)?
解:提出假设:H 0:μ=100;H 1:μ≠100
构建统计量(正态, 小样本,方差未知):
x t =
-0.055 求临界值:当α=0.05,自由度n -1=8时,查表得()8t α
=2.306。 决策:因为
t <2t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设
结论:说明打包机工作正常。
8.5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)?
解:提出假设: H 0:π≤0.05;H 1:π>0.05
构建统计量:
Z =
=2.271
求临界值:当α=0.05,查表得z α=1.645。
决策:因为z >z α,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设
结论:说明该批食品不能出厂。
8.6 提出假设:H 0:μ≤25000;H 1:μ>25000
19 构建统计量(正态,小样本,方差已知)
:x t =
1.549 求临界值:当α=0.05,查表得z α=1.645。
决策:因为z <z α,故不能拒绝原假设
结论:没有充分证据证明该厂家的广告是真实的
8.7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命显著地大于225小时(a =0.05)?
解:提出假设:H 0:μ≤225;H 1:μ>225
构建统计量(正态,小样本,方差已知)
:x t =
0.669 求临界值:当α=0.05,自由度n -1=15时,查表得()15t α
=1.753 决策:因为t <t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设
结论:说明元件寿命没有显著大于225小时。
8.8
8.9
8.10 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下: 甲方法:31 34 29 32 35 38 34 30 29 32 31 26
乙方法:26 24 28 29 30 29 32 26 31 29 32 28
两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a =0.05)?
解:提出假设:H 0:μ1-μ2=0;H 1:μ1-μ2≠0
构建统计量(总体正态,小样本抽样,方差未知,方差相等):
x x t -=
根据样本数据计算,得1n =12,2n =12,1x =31.75,1s =3.19446,2x =28.6667,2s =2.46183。
()()221
112212112p
n s n s s n n -+-=+-=()()221210.922161210.7106712122-?+-?+-=
8.1326 x x t -==2.648 求临界值:α=0.05时,临界点为()2122t n n α
+-=()0.02522t =2.074 决策:此题中t >2t α,故拒绝原假设
结论:认为两种方法的装配时间有显著差异
8.11 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点(a =0.05)?
解:提出假设:H 0:π1≤π2;H 1:π1>π2
p 1=43/205=0.2097 n1=205 p 2=13/134=0.097 n2=134
构建统计量:
p p d z --=
0.20980.0970-- 3 求临界值:当α=0.05,查表得z α=1.645
20 决策:因为z >z α,拒绝原假设
结论:说明吸烟者容易患慢性气管炎
8.12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得x =68.1万元,s=45。用a =0.01的显著性水平,采用p 值进行检验。
解:提出假设:H 0:μ≤60;H 1:μ>60
构建统计量(大样本,方差未知)
:x z =
=2.16 求临界值:由于x >μ,因此P 值=P (z ≥2.16)=1-()2.16φ,查表的()2.16φ=0.9846,P 值=0.0154 决策:由于P >α=0.01,故不能拒绝原假设
结论:说明贷款的平均规模没有明显地超过60万元。
8.13 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)持续3年之后进行检测,样本1中有104人患心脏病,样本2中有189人患心脏病。以a =0.05的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。
解:提出假设:H 0:π1≥π2;H 1:π1<π2
p 1=104/11000=0.00945 n1=11000 p 2=189/11000=0.01718 n2=11000
构建统计量:
p p d z --=
0.009450.017180--=-5 求临界值:当α=0.05,查表得z α=1.645
决策:因为z <-z α,拒绝原假设 结论:说明用阿司匹林可以降低心脏病发生率。
8.14
8.15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水平α=0.02,从上述数据中能得到什么结论?
解:方差比检验:
提出假设:H 0:21σ=22σ;H 1:21σ≠2
2σ
(已知:n1=25,21s =56,n2=16,22s =49) 构建统计量:2122
s F s ==5649=1.143 求临界值:当α=0.02时,()2
24,15F α=3.294,()1224,15F α-=0.346。
决策:由于()1224,15F α-<F <()224,15F α,检验统计量的值落在接受域中,所以接受原假设 结论:说明总体方差无显著差异。
检验均值差:
提出假设:H 0:μ1-μ2≤0;H 1:μ1-μ2>
0 构建统计量(总体正态,小样本抽样,方差未知,方差相等): x x t -=
21
根据样本数据计算,得1n =25,2n =16,1x =82,21s =56,2x =78,2
2s =49
()()22
1112212112
p
n s n s s
n n -+-=
+-=53.308;
x x t -==1.711
求临界值:α=0.02时,临界点为(122t n n α+-=)0.0239t =2.125,t <t α,故不能拒绝原假设
结论:不能认为大学中男生的学习成绩比女生的学习成绩好。
第9章 分类数据分析
158 251 118 130 117
140
140
527
第一步:提出假设: H 0:收入与购买习惯无关(相互独立);H 1:收入与购买习惯有关(相互不独立)
或者 H 0:ij
i j P P P =?;H 1:ij i j P P P ≠?
第二步:构建统计量: 利用公式:i j
ij N N E N
?=先计算期望频次分布,如上表括号中数据。
由2
2
211()((1)(1))c r
ij ij i j j n E r c Ei χ
χ==-=--∑∑
得
2
2
11
()c
r ij ij i j j
n E Ei χ==-=∑∑
=
22
(2538.98)(4035.08)38.9835.08
--++=17.63 (p=0.007227)
第三步:求临界值:2
0.1(6)10.6446χ=
(注意:①对于r ×c 列联表的自由度是:df=(r-1)×(c-1); ②按右侧检验方法) 第四步:决策: 因为2
2
11
()c
r
ij ij i j j
n E Ei χ
==-=∑∑
=17.63大于2
0.1
10.6446χ=,所以拒绝H 0
第五步:结论:所以收入与购买习惯有关
9.2 假设:H 0:1
23450.1,0.2,0.3,0.2,0.2πππππ=====;H 1:至少有一个不成立
统计量:2
2
1
()n
o e i e f f f χ=-==∑
22222
(0.140.1)(0.280.2)(0.240.3)(0.180.2)(0.160.2)0.10.20.30.20.2
-----++++=0.07
临界值:2
0.1(51)7.7794χ-= (P=0.9994)
决策:因为22
1
()n
o e i e f f f χ=-==∑0.07小于2
0.1(4)7.7794χ=,所以不能拒绝原假设。
结论:没有发生变化。
9.3
正在阅读:
统计学第五版课后答案(贾俊平)04-14
试验示范方案(中建三局) - 图文03-29
鸟的迁徙观后感04-01
中国书法家协会会员2013全07-24
以读书为话题的作文600字03-31
2018年师德师风动员讲话稿-word范文模板(3页)03-07
毛概形考111-15
小学生2-4年级转述句练习题讲解03-08
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 统计学
- 课后
- 答案
- 贾俊平
- 野生动物保护法考题1
- 煤矿考核员培训班学员须知
- 《逢入京使》岑参中考复习题及答案【部编版七年级下册】
- 电大复习题_英语1(2).doc
- 中国减震器行业市场发展现状及投资前景预测报告
- 2022年中兴交换机常用命令
- 《神之刃》战宠图鉴宠物界面属性全面分析
- 2022年河北省九地市初三模拟联考(一)语文答案
- 江苏省公务员公共基础知识真题附答案
- 朗读教学的感情基调与育人功效|朗读的感情基调
- 天津箭牌售后售后电话是多少-天津箭牌马桶售后电话查询-天津箭牌
- 【味蕾上的乡愁】味蕾上的乡愁阅读答案
- 财务管理学笔记讲义
- 硫酸库安全设计规程范本
- 2022年民间抵押房产借贷合同范本
- 部分大建设路桥项目智能交通设备升级改造项目公开征集方案需求
- 2022版中国被套市场现状调研及未来发展趋势预测报告
- 2022年西安石油大学材料科学与工程学院815材料力学考研强化五套
- 租赁合同范本简易标准版本
- 河道清淤阶段验收样表(质监站认可)