统计学人大版课后习题答案(贾俊平、何小群、金勇进) - 图文

更新时间:2023-03-13 09:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B D A B C D B B A C

E A D A B A E A D B

C C B C C C C C B C

C B C D E B C E C E

A C C E D C A E C D

D D A A B D D A A B

C E E B C E C B E C

B C D D C C B D D C

A E C D B E A D C B

E E B C C B E C B C

要求:

(1)指出上面的数据属于什么类型。 顺序数据

(2)用Excel制作一张频数分布表。 用数据分析——直方图制作:

接收 频率

E 16

D 17

C 32 B 21

A 14

(3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作:

直方图40频率200EDC接收BA频率

(4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:

接收 频数 频率(%) 累计频率(%) C B D E A

32 21 17 16 14

32 21 17 16 14

32 53 70 86 100

35302520151050CDBAE120100806040200频数累计频率(%)

3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 105 117 97

124 119 108 88

129 114 105 123

116 115 110 115

100 87 107 119

103 103 137 138

92 118 120 112

95 142 136 146

127 135 117 113

104 125 108 126

要求:

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数:

lg?4?0lgn()1.60206 K?1?,取?1??1??6.32k=6

lg(2)lg20.301032、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3、分组频数表 销售收入 80.00 - 89.00 90.00 - 99.00 100.00 - 109.00 110.00 - 119.00 120.00 - 129.00 130.00 - 139.00 140.00 - 149.00 150.00+ 总和 频数 频率% 累计频数 2 3 9 12 7 4 2 1 40 5.0 7.5 22.5 30.0 17.5 10.0 5.0 2.5 100.0 2 5 14 26 33 37 39 40 累计频率% 5.0 12.5 35.0 65.0 82.5 92.5 97.5 100.0

(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

先进企业 良好企业 一般企业 落后企业 总和 频数 10 12 9 9 40 频率% 25.0 30.0 22.5 22.5 100.0 累计频数 10 22 31 40 累计频率% 25.0 55.0 77.5 100.0 3.3 某百货公司连续40天的商品销售额如下:

单位:万元

41 46 35 42

25 36 28 36

29 45 46 37

47 37 34 37

38 37 30 49

34 36 37 39

30 45 44 42

38 43 26 32

43 33 38 36

40 44 44 35

要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: K?1?lg?4?0lgn()1.60206,取?1??1??6.32k=6

lg(2)lg20.301032、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5 3、分组频数表 销售收入(万元) <= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+ 总和 频数 1 5 6 14 10 4 40 频率% 2.5 12.5 15.0 35.0 25.0 10.0 100.0 累计频数 1 6 12 26 36 40 累计频率% 2.5 15.0 30.0 65.0 90.0 100.0 频数1614121086420<= 2526 - 3031 - 3536 - 4041 - 4546+频数频数销售收入

3.4 利用下面的数据构建茎叶图和箱线图。

57 23 35 18 21 21

6029 47 51 26 46 43 29 23 39 50 41 19 36 28 18 29 52 42 31 28 46 33 28 20

5040302010data

data Stem-and-Leaf Plot

Frequency Stem & Leaf

3.00 1 . 889 5.00 2 . 01133 7.00 2 . 6888999 2.00 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 . 667 3.00 5 . 012 1.00 5 . 7

Stem width: 10 Each leaf: 1 case(s)

3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:

单位:g

57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47 53 51 48 53 50 52 40 45 57 53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51 59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48 要求:

(1)构建这些数据的频数分布表。 (2)绘制频数分布的直方图。 (3)说明数据分布的特征。

解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

1、确定组数:

K?1?lg?10?0lgn()2,取?1??1??6.64k=6或7

lg(2)lg20.301032、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5 组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3, 3、分组频数表

组距3,上限为小于

有效 40.00 - 42.00 43.00 - 45.00 46.00 - 48.00 49.00 - 51.00 52.00 - 54.00 55.00 - 57.00 58.00+ 合计 频数 3 9 24 19 24 14 7 100 百分比 3.0 9.0 24.0 19.0 24.0 14.0 7.0 100.0 累计频数 3 12 36 55 79 93 100 累积百分比 3.0 12.0 36.0 55.0 79.0 93.0 100.0 直方图:

组距3,小于3020Frequency10Mean =5.22Std. Dev. =1.508N =10000246810组距3,小于

组距4,上限为小于等于

有效 <= 40.00 41.00 - 44.00 45.00 - 48.00 49.00 - 52.00 53.00 - 56.00 57.00 - 60.00 61.00+ 合计 频数 1 7 28 28 22 13 1 100 百分比 1.0 7.0 28.0 28.0 22.0 13.0 1.0 100.0 累计频数 1 8 36 64 86 99 100 累积百分比 1.0 8.0 36.0 64.0 86.0 99.0 100.0 直方图:

组距4,小于等于4030Frequency2010Mean =4.06Std. Dev. =1.221N =100002468组距4,小于等于

组距5,上限为小于等于

有效 <= 45.00 46.00 - 50.00 51.00 - 55.00 56.00 - 60.00 61.00+ 合计 频数 12 37 34 16 1 100 百分比 12.0 37.0 34.0 16.0 1.0 100.0 累计频数 12.0 49.0 83.0 99.0 100.0 累积百分比 12.0 49.0 83.0 99.0 100.0 直方图:

组距5,小于等于5040Frequency302010Mean =2.57Std. Dev. =0.935N =10000123456组距5,小于等于分布特征:左偏钟型。

3.8 下面是北方某城市1——2月份各天气温的记录数据:

-3 2 -4 -7 -11 -1 7

14 6 -8 -14

-18 -8 -6 -22

-15 -12 -15 -13

-9 -16 -11 -9

-6 -19 -12 -6

-1 -15 -19 0 -1

0 -22 -25 -1 7

8 5 -25 -24 5 5

9 -4 -24 -18 -4 -6

-6 -9 -19 -17 -9 -5

-3 2 -4 -4 -16 要求:

(1)指出上面的数据属于什么类型。 数值型数据

(2)对上面的数据进行适当的分组。

1、确定组数:

K?1?lg?6?0lgn()1.778151,取?1??1??6.90989k=7

lg(2)lg20.301032、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5

3、分组频数表 温度 -25 - -21 -20 - -16 -15 - -11 -10 - -6 -5 - -1 0 - 4 5 - 9 10+ 合计 频数 6 8 9 12 12 4 8 1 60 频率% 10.0 13.3 15.0 20.0 20.0 6.7 13.3 1.7 100.0 累计频数 6 14 23 35 47 51 59 60 累计频率% 10.0 23.3 38.3 58.3 78.3 85.0 98.3 100.0

(3)绘制直方图,说明该城市气温分布的特点。

频数14121086420-25 - -21-20 - -16-15 - -11-10 - -6-5 - -10 - 45 - 910+12912868频数41

3.11 对于下面的数据绘制散点图。 x y 解:

2 25 3 25 4 20 1 30 8 16 7 18

35302520151050024x

y68103.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下: 考试成绩 优 良 中 及格 不及格 人数 甲班 3 6 18 9 4 乙班 6 15 9 8 2 要求: (1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。

201816141210864201815人数 甲班人数 乙班42963698优良中及格不及格

2894366优良中及格不及格91815(2)比较两个班考试成绩分布的特点。

甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。

(3)画出雷达图,比较两个班考试成绩的分布是否相似。

不及格优20151050良人数 甲班人数 乙班及格中

分布不相似。

3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):

单位:亿元 国内生产总值 年份 第一产业 第二产业 第三产业

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117390.2 136875.9 11993 13844.2 14211.2 14552.4 14471.96 14628.2 15411.8 16117.3 16928.1 20768.07 28538 33613 37223 38619 40558 44935 48750 52980 61274 72387 17947 20428 23029 25174 27038 29905 33153 36075 39188 43721

要求:

(1)用Excel绘制国内生产总值的线图。

国内生产总值160000140000120000100000800006000040000200000国内生产总值1995199619971998199920002001200220032004

(2)绘制第一、二、三产业国内生产总值的线图。

80000700006000050000400003000020000100000第一产业第二产业第三产业1995199619971998199920002001200220032004

(3)根据2004年的国内生产总值及其构成数据绘制饼图。

国内生产总值20768.07,15C721, 32%第一产业第二产业第三产业72387, 53%

第四章 统计数据的概括性描述

4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:

2 4 7 10 10 10 12 12 14 15 要求:

(1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。 解:

Statistics

汽车销售数量 N

Valid Missing

Mean Median Mode Std. Deviation Percentiles

25 50 75

10 0 9.60 10.00 10 4.169 6.25 10.00 12.50

Histogram32Frequency1Mean =9.6Std. Dev. =4.169N =1002.557.51012.515 汽车销售数量 4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 单位:周岁

19 23 30 23 41

15 21 20 27 20

29 38 19 22 31

25 22 19 34 17

24 18 16 24 23

要求;

(1)计算众数、中位数:

1、排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄 15 16 17 Valid 18 19 20 21 Frequency 1 1 1 1 3 2 1 Percent 4.0 4.0 4.0 4.0 12.0 8.0 4.0 Cumulative Frequency 1 2 3 4 7 9 10 Cumulative Percent 4.0 8.0 12.0 16.0 28.0 36.0 40.0

22 23 24 25 27 29 30 31 34 38 41 Total 2 3 2 1 1 1 1 1 1 1 1 25 8.0 12.0 8.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 100.0 12 15 17 18 19 20 21 22 23 24 25 48.0 60.0 68.0 72.0 76.0 80.0 84.0 88.0 92.0 96.0 100.0 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;

Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773

(5)对网民年龄的分布特征进行综合分析:

分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图:

32Count10151617181920212223242527293031343841网络用户的年龄

为分组情况下的概率密度曲线:

3.02.5Count2.01.51.0151617181920212223242527293031343841网络用户的年龄 分组:

1、确定组数: K?1?lg?2?5lgn()1.398,取?1??1??5.64k=6

lg(2)lg20.301032、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5

3、分组频数表

网络用户的年龄 (Binned)

<= 15 16 - 20 21 - 25 Valid 26 - 30 31 - 35 36 - 40 41+ Total Frequency 1 8 9 3 2 1 1 25 Percent 4.0 32.0 36.0 12.0 8.0 4.0 4.0 100.0 Cumulative Frequency 1 9 18 21 23 24 25 Cumulative Percent 4.0 36.0 72.0 84.0 92.0 96.0 100.0 23.3000 7.02377 49.333 1.163 分组后的均值与方差:

Mean Std. Deviation Variance Skewness

Kurtosis 1.302

分组后的直方图:

108Frequency642Mean =23.30Std. Dev. =7.024N =25010.0015.0020.0025.0030.0035.0040.0045.0050.00组中值 4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一

种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:

5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求:

(1)画出第二种排队方式等待时间的茎叶图。

第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot

Frequency Stem & Leaf 1.00 Extremes (=<5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88

Stem width: 1.00 Each leaf: 1 case(s)

(2)计算第二种排队时间的平均数和标准差。

Mean Std. Deviation Variance

7 0.714143

0.51

(3)比较两种排队方式等待时间的离散程度。

第二种排队方式的离散程度小。

(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,均值小,离散程度小。

4.4 某百货公司6月份各天的销售额数据如下:

单位:万元

257 271 272

276 292 284

297 261 268

252 281 303

238 301 273

310 274 263

240 267 322

236 280 249

265 291 269

278 258 295

要求:

(1)计算该百货公司日销售额的平均数和中位数。 (2)按定义公式计算四分位数。 (3)计算日销售额的标准差。 解:

Statistics

百货公司每天的销售额(万元) N

Valid Missing

Mean Median Std. Deviation Percentiles

25 50 75

30 0

274.1000 272.5000 21.17472 260.2500 272.5000 291.2500

4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 名称 A B C 单位成本 (元) 15 20 30 甲企业 总成本(元) 2100 3000 1500 140 150 50 甲企业 2 100 3 000 1 500 乙企业 产品数 217 75 50 3255 1500 1500 总成本(元) 乙企业 3 255 1 500 1 500 要求:比较两个企业的总平均成本,哪个高,并分析其原因。 产品名称 A B C 单位成本(元) 15 20 30 产品数 总成本(元) 平均成本(元) 19.41176471 18.28947368 调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。

4.6 在某地区抽取120家企业,按利润额进行分组,结果如下: 按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合 计 要求:

(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解:

Statistics

企业利润组中值Mi(万元) N

Valid Missing

Mean Std. Deviation Skewness

Std. Error of Skewness Kurtosis

Std. Error of Kurtosis

120 0

426.6667 116.48445

0.208 0.221 -0.625 0.438

企业数(个) 19 30 42 18 11 120

Histogram5040Frequency302010Mean =426.67Std. Dev. =116.484N =120200.00300.00400.00500.00600.00700.000企业利润组中值Mi(万元) 4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。

(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?

(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大? (3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大? 解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身

高。

(2)不一定相同,样本量少的标准差大的可能性大。

(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。

4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生

的平均体重为50kg,标准差为5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么?

女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。 都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05

Cases weighted by 企业个数

磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? 计算标准分数:

Z1=

x?x55?60x?x65?60==-1;Z2===1,根据经验规则,男生大约有68%s5s5的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 计算标准分数:

Z1=

x?x40?50x?x60?50==-2;Z2===2,根据经验规则,女生大约有95%s5s5的人体重在40kg一60kg之间。

4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是

100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?

解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。

ZA=

x?x115?100x?x425?400==1;ZB===0.5 s15s50因此,A项测试结果理想。

4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低

于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制? 时间 产量(件) 时间 产量(件) 日平均产量 日产量标准差 标准分数Z 标准分数界限 3 -0.6 -0.2 -2 2 -2 2 -2 2 周一 周二 周三 周四 周五 周六 周日 3850 3670 3690 3720 3610 3590 3700 3700 50 0.4 -1.8 -2.2 -2 2 -2 2 -2 2 0 -2 2 周一 周二 周三 周四 周五 周六 周日 3 850 3 670 3 690 3 720 3 610 3 590 3 700 周六超出界限,失去控制。

4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求:

(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大?

成年组 平均 标准差 离散系数 172.1 平均 4.201851 标准差 0.024415 离散系数 幼儿组 71.3 2.496664 0.035016 幼儿组的身高差异大。

4.12 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随

机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:

单位:个 方法A 164 167 168 165 170 165 164 168 164 162 163 166 167 166 165 方法B 129 130 129 130 131 ]30 129 127 128 128 127 128 128 125 132 方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125

要求:

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:对比均值和离散系数的方法,选择均值大,离散程度小的。

方法A

方法B

方法C

165.6 平均 平均 128.7333333 平均 125.5333333 2.131397932 1.751190072 2.774029217 标准差 标准差 标准差

离散系数: VA=0.01287076,VB= 0.013603237,VC= 0.022097949

均值A方法最大,同时A的离散系数也最小,因此选择A方法。

4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预

期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类

型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险? 标准差或者离散系数。

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 选择离散系数小的股票,则选择商业股票。

(3)如果进行股票投资,你会选择商业类股票还是高科技类股票? 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为?盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差??1.0盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。

解:总体方差知道的情况下,均值的抽样分布服从N标准化得到标准正态分布:z=为:

??,?n的正态分布,由正态分布,

2?x??~N?0,1?,因此,样本均值不超过总体均值的概率P

?n?x????0.3x??0.3?0.3?P?x???0.3?=P?????=P??

??n?n??19?n19?=P??0.9?z?0.9?=2??0.9?-1,查标准正态分布表得??0.9?=0.8159 因此,Px???0.3=0.6318

6.3 Z1,Z2,??,Z6表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得 ?62?P??Zi?b??0.95 ?i?1???解:由于卡方分布是由标准正态分布的平方和构成的: 设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量

22 ?2?Z12?Z2???Zn服从自由度为n的χ2分布,记为χ2~ χ2(n)

?62?因此,令???Z,则???Z???6?,那么由概率P??Zi?b??0.95,可知:

i?1i?1?i?1?22i22i266b=?12?0.95?6?,查概率表得:b=12.59

6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差?2?1的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这

1n22(Yi?Y)2),确定一个合适的范围使得有10个观测值我们可以求出样本方差S(S??n?1i?1较大的概率保证S2落入其中是有用的,试求b1,b2,使得 p(b1?S2?b2)?0.90

1??=0.95,z?2=z0.025=1.96

22z?2?p??1?p?1.96?0.02?0.98n?==47.06,取n=48或者50。 2?20.04p

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约

为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:n?22z?2???2x,1??=0.95,z?2=z0.025=1.96,

n?

22z???2?2x1.962?1202=138.3,取n=139或者140,或者150。 ?2027.29 假定两个总体的标准差分别为:?1?12,?2?15,若要求误差范围不超过5,相应

的置信水平为95%,假定n1?n2,估计两个总体均值之差?1??2时所需的样本量为多大? 解:n1=n2=n?222z?2???1??2??2x1?x2,1??=0.95,z?2=z0.025=1.96,

n1=n2=n?

222z?2???1??2??2x1?x2=

1.962??122?152?52=56.7,取n=58,或者60。

7.30 假定n1?n2,边际误差E=0.05,相应的置信水平为95%,估计两个总体比例之

差?1??2时所需的样本量为多大? 解:n1=n2=n?p1=p2=0.5, n1=n2=n?2z?2???p1?1?p1??p2?1?p2???2z?2???p1?1?p1??p2?1?p2????2p1?p2,1??=0.95,z?2=z0.025=1.96,取

?2p1?p2=

1.962??0.52?0.52?0.052=768.3,取n=769,

或者780或800。

8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,

测得其平均寿命为680小时。已知该元件寿命服从正态分布,?=60小时,试在显著性水平0.05下确定这批元件是否合格。 解:H0:μ≥700;H1:μ<700

已知:x=680 ?=60

由于n=36>30,大样本,因此检验统计量:

z?x??0sn=680?700=-2

6036当α=0.05,查表得z?=1.645。因为z<-z?,故拒绝原假设,接受备择假设,说明这批产

品不合格。

8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机

工作是否正常。某日开工后测得9包重量(单位:千克)如下:

99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5

已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)? 解:H0:μ=100;H1:μ≠100

经计算得:x=99.9778 S=1.21221 检验统计量:

t?x??0sn=99.9778?100=-0.055

1.2122192当α=0.05,自由度n-1=9时,查表得t??9?=2.262。因为t<t?2,样本统计量落

在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50

袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)? 解:解:H0:π≤0.05;H1:π>0.05

已知: p=6/50=0.12 检验统计量:

Z?p??0?0?1??0?n=0.12?0.050.05??1?0.05?50=2.271

当α=0.05,查表得z?=1.645。因为z>z?,样本统计量落在拒绝区域,故拒绝原假设,

接受备择假设,说明该批食品不能出厂。

8.7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170

问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)? 解:H0:μ≤225;H1:μ>225

经计算知:x=241.5 s=98.726 检验统计量:

t?x??0sn=241.5?225=0.669

98.72616当α=0.05,自由度n-1=15时,查表得t??15?=1.753。因为t<t?,样本统计量落在接

受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。

8.10 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳

动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:

甲方法:31 34 29 32 35 38 34 30 29 32 31 26 乙方法:26 24 28 29 30 29 32 26 31 29 32 28

两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a=0.05)? 解:建立假设

H0:μ1-μ2=0 H1:μ1-μ2≠0

总体正态,小样本抽样,方差未知,方差相等,检验统计量

t??x1?x2?sp11?n1n2

根据样本数据计算,得n1=12,n2=12,x1=31.75,s1=3.19446,x2=28.6667,

s2=2.46183。

s2p2n1?1?s12??n1?1?s2? ?n1?n2?212?1??0.922162??12?1??0.710672? ==8.1326

12?12?2t??x1?x2?sp11?n1n2=2.648

α=0.05时,临界点为t?2?n1?n2?2?=t0.025?22?=2.074,此题中t>t?2,故拒绝原假设,认为两种方法的装配时间有显著差异。

8.11 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134

名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”

这种观点(a=0.05)? 解:建立假设

H0:π1≤π2;H1:π1>π2

p1=43/205=0.2097 n1=205 p2=13/134=0.097 n2=134 检验统计量

z??p1?p2??d p1?1?p1?p2?1?p2??n1n2 =?0.2098?0.097??0 0.2098?1?0.2098?0.097?1?0.097??205134=3

当α=0.05,查表得z?=1.645。因为z>z?,拒绝原假设,说明吸烟者容易患慢性气管炎。 8.12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。

随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得x=68.1万元,s=45。用a=0.01的显著性水平,采用p值进行检验。 解:H0:μ≤60;H1:μ>60

已知:x=68.1 s=45

由于n=144>30,大样本,因此检验统计量:

z?x??0sn=68.1?60=2.16

45144由于x>μ,因此P值=P(z≥2.16)=1-??2.16?,查表的??2.16?=0.9846,P值=0.0154 由于P>α=0.01,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。

8.13 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员

把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)持续3年之后进行检测,样本1中有104人患心脏病,样本2中有189人患心脏病。以a=0.05的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。 解:建立假设

H0:π1≥π2;H1:π1<π2

p1=104/11000=0.00945 n1=11000 p2=189/11000=0.01718 n2=11000 检验统计量

z??p1?p2??d p1?1?p1?p2?1?p2??n1n2

=?0.00945?0.01718??0

0.00945?1?0.00945?0.01718?1?0.01718??1100011000=-5

当α=0.05,查表得z?=1.645。因为z<-z?,拒绝原假设,说明用阿司匹林可以降低心脏

病发生率。

8.15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了

25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水平α=0.02,从上述数据中能得到什么结论? 解:首先进行方差是否相等的检验:

建立假设

22H0:?12=?2;H1:?12≠?2 22n1=25,s1=56,n2=16,s2=49

56s12=1.143 F?2=49s2当α=0.02时,F?2?24,15?=3.294,F1??2?24,15?=0.346。由于F1??2?24,15?<F<F?2?24,15?,检验统计量的值落在接受域中,所以接受原假设,说明总体方差无显著差异。

检验均值差: 建立假设

H0:μ1-μ2≤0 H1:μ1-μ2>0

总体正态,小样本抽样,方差未知,方差相等,检验统计量

t??x1?x2?sp11?n1n2

22根据样本数据计算,得n1=25,n2=16,x1=82,s1=56,x2=78,s2=49

2n1?1?s12??n1?1?s2?=53.308 ?s2pn1?n2?2t??x1?x2?sp11?n1n2=1.711

α=0.02时,临界点为t??n1?n2?2?=t0.02?39?=2.125,t<t?,故不能拒绝原假设,不能

认为大学中男生的学习成绩比女生的学习成绩好。

10.3 一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据:

机器l 4.05 4.01 4.02 4.04 4.00 4.00 机器2 3.99 4.02 4.01 3.99 4.00 机器3 3.97 3.98 3.97 3.95 机器4 4.00 4.02 3.99 4.0l 取显著性水平a=0.01,检验4台机器的装填量是否相同? 解:

ANOVA

每桶容量(L) 组间 组内 总数

平方和

0.007 0.004 0.011

df

3 15 18

均方

0.002 0.000

F

8.721

显著性

0.001

不相同。

10.7 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果; 方差分析表 差异源 组间 组内 总计 SS 420 3836 4256 df 2 27 29 MS 210 — F 1.47810219 — P-value — — F crit — — 0.245946 3.354131 142.0740741 — 要求:

(1)完成上面的方差分析表。

(2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异? 解:(2)P=0.025>a=0.05,没有显著差异。

10.9 有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表: 1 2 3 4 5 品种 施肥方案 1 12.0 13.7 14.3 14.2 13.0 2 9.5 11.5 12.3 14.0 14.0 3 10.4 12.4 11.4 12.5 13.1 4 9.7 9.6 11.1 12.0 11.4 检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响

是否有显著差异(a=0.05)?

解:这线图: 均值收获量15.00施肥方法施肥方法1施肥方法2施肥方法3施肥方法4似乎交互作用不明显:

(1)考虑无交互作用下的方差分析:

主体间效应的检验

因变量: 收获量 源 校正模型 截距

Fertilization_Methods Variety 误差 总计 校正的总计

a. R 方 = .825(调整 R 方 = .723)

结果表明施肥方法和品种都对收获量有显著影响。 (2)考虑有交互作用下的方差分析:

主体间效应的检验

因变量: 收获量 源 校正模型 截距

Fertilization_Methods Variety

Fertilization_Methods * Variety

III 型平方和

45.150(a) 2,930.621 18.182 19.067 7.901

df

19 1 3 4 12

均方

2.376 . 2,930.621 .

6.061 . 4.767 . 0.658 .

F

. . . . .

Sig.

14.0013.0012.0011.0010.009.00品种1品种2品种3品种4品种5品种__

III 型平方和

37.249(a) 2,930.621 18.182 19.067 7.901 2,975.770 45.150

df

7 1 3 4 12 20 19

均方

5.321 2,930.621

6.061 4.767 0.658

F 8.082 4,451.012

9.205 7.240

Sig.

0.001 0.000 0.002 0.003

误差 总计 校正的总计

a. R 方 = 1.000(调整 R 方 = .)

0.000 2,975.770 45.150

0 . 20 19

由于观测数太少,得不到结果!

10.11 一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数 量对销售额是否有显著影响。下面是获得的月销售额数据(单位:万元)。 超市位置 位于市内居民小区 位于写字楼 竞争者数量 0 41 30 45 25 31 22 18 位于郊区 29 33 1 38 31 39 29 35 30 72 17 25 2 59 48 51 44 48 50 29 28 26 3个以h 47 40 39 43 42 53 24 27 32 取显著性水平a=0.01,检验:

(1)竞争者的数量对销售额是否有显著影响?

(2)超市的位置对销售额是否有显著影响?

(3)竞争者的数量和超市的位置对销售额是否有交互影响? 解:画折线图:

均值月销售额万元55.00超市位置位于市内居民小区位于写字楼位于郊区交互作用不十分明显。

(1)进行无交互方差分析:

主体间效应的检验

因变量: 月销售额(万元) 源 III 型平方和 df 均方 F Sig. 校正模型 2814.556(a) 5 562.911 15.205 0.000 截距 44,802.778 1 44,802.778 1,210.159 0.000 Location_SuperMaket 1,736.222 2 868.111 23.448 0.000 Amount_competitors 1,078.333 3 359.444 9.709 0.000 误差 1,110.667 30 37.022 总计 48,728.000 36 校正的总计 3,925.222 35 a. R 方 = .717(调整 R 方 = .670)

看到超市位置有显著影响,而竞争者数量没有显著影响,且影响强度仅为0.327,因此考虑是否存在交互作用。

(2)有交互方差分析:

看到超市位置有显著影响,而竞争者数量和交互作用均无显著影响。

主体间效应的检验

因变量: 月销售额(万元) 源 校正模型 III 型平方和 3317.889(a) df 11 均方 301.626 F Sig. 11.919 0.000 50.00()45.0040.0035.0030.0025.000个竞争者1个竞争者2个竞争者3个以上竞争者竞争者数量

本文来源:https://www.bwwdw.com/article/kdfx.html

Top