统计学贾俊平_第四版课后习题答案 2

更新时间:2023-07-27 14:04:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

3.3 某百货公司连续40天的商品销售额如下:

单位:万元

41 46 35 42

25 36 28 36

29 45 46 37

47 37 34 37

38 37 30 49

34 36 37 39

30 45 44 42

38 43 26 32

43 33 38 36

40 44 44 35

要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: K 1lg 4 0lgn()1.60206

,取 1 1 6.32k=6

lg(2)lg20.30103

2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5

(1) 对这个年龄分布作直方图;

(2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)

(2)年龄分布的特点:自学考试人员年龄的分布为右偏。

解:

(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。

3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):

要求:

(2)绘制第一、二、三产业国内生产总值的线图。

4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:

2 4 7 10 10 10 12 12 14 15 要求:

(1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。 解:

Statistics

汽车销售数量 N

Valid Missing

Mean Median Mode Std. Deviation Percentiles

25 50 75

10 0 9.60 10.00 10 4.169 6.25 10.00 12.50

种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:

5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求:

(1)画出第二种排队方式等待时间的茎叶图。

第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot

Frequency Stem & Leaf 1.00 Extremes (=<5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88

Stem width: 1.00 Each leaf: 1 case(s)

(2)计算第二种排队时间的平均数和标准差。

Mean Std. Deviation

7 0.714143

Variance 0.51

(3)比较两种排队方式等待时间的离散程度。

第二种排队方式的离散程度小。

(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,均值小,离散程度小。

(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解:

Statistics

企业利润组中值Mi(万元) N

Valid Missing

Mean Std. Deviation Skewness

Std. Error of Skewness Kurtosis

Std. Error of Kurtosis

120 0

426.6667 116.48445

0.208 0.221 -0.625 0.438

17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。

(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?

(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大? (3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大? 解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身

高。

(2)不一定相同,样本量少的标准差大的可能性大。

(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。

4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生

的平均体重为50kg,标准差为5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么?

女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。 都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05

磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? 计算标准分数:

Z1=

x 55 60x 65 60

==-1;Z2===1,根据经验规则,男生大约有68%s5s5

的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 计算标准分数:

Z1=

x 40 50x 60 50

==-2;Z2===2,根据经验规则,女生大约有95%s5s5

的人体重在40kg一60kg之间。

4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是

100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?

解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。

ZA=

x 115 100x 425 400

==1;ZB===0.5 ss1550

因此,A项测试结果理想。

4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低

于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?

周六超出界限,失去控制。

4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预

期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险? 标准差或者离散系数。

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 选择离散系数小的股票,则选择商业股票。

(3)如果进行股票投资,你会选择商业类股票还是高科技类股票? 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

解:(1)方差或标准差;(2)商业类股票;(3)(略)。

7.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差等于多少?

(2) 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25, (1)样本均值的抽样标准差

σ

5=0.7906

(2)已知置信水平1-α=95%,得 Zα/2=1.96,

于是,允许误差是E

=Zα/2

σ

6×0.7906=1.5496。 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客

组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

=2.143 (2)在95%的置信水平下,求边际误差。

t ,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z 2 因此, t z z0.025 =1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为:

, = 120 4.2,120 4.2 =(115.8,124.2) 7.10

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产

的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量的95

%的置信区间。 解:大样本,总体方差未知,用z统计量

z

N 0,1

样本均值=101.4,样本标准差s=1.829 置信区间:

z z 2

2

1 =0.95,z

2=z

0.025=1.96

z z 2 2

= 101.4 1.96 1.96=(100.89,101.91) (2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计

大样本,总体方差未知,用z统计量

z

N 0,1

样本比率=(50-5)/50=0.9 置信区间:

p z 2 p z 2 1 =0.95,z 2=z

0.025=1.96

p z 2

p z 2

=(0.8168,0.9832) = 0.9 1.96 1.96

7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了

假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%的置信区间。

解:小样本,总体方差未知,用t统计量

t

t n 1

均值=13.56,样本标准差s=7.801 置信区间:

tn 1 tn 1

2

1

=0.90,n=18,t

n 1 =t0.05 17 =1.7369

tn 1 tn 1 2

= 13.56 1.7369 1.7369=(10.36,16.75)

7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的

电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:总体比率的估计

大样本,总体方差未知,用z统计量

z

N 0,1

样本比率=0.23 置信区间:

p z 2 p z 2 1 =0.90,z 2=z

0.025=1.645

p z 2

p z 2

= 0.23 1.645 1.645 =(0.1811,0.2789)

1 =0.95,z 2=z

0.025=1.96

p z 2

p z 2

=(0.1717,= 0.23 1.96 1.96 0.2883)

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约

为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:n

22z 2

2

,1 =0.95,z 2=z0.025=1.96,

n

22z 2

21.962 1202

202

=138.3,取n=139或者140,或者150。

8. 1

8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,

测得其平均寿命为680小时。已知该元件寿命服从正态分布, =60小时,试在显著

性水平0.05下确定这批元件是否合格。 解:H0:μ≥700;H1:μ<700

已知:=680 =60

由于n=36>30,大样本,因此检验统计量:

z

=-2

当α=0.05,查表得z =1.645。因为z<-z ,故拒绝原假设,接受备择假设,说明这批产

品不合格。

8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机

工作是否正常。某日开工后测得9包重量(单位:千克)如下:

99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5

已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)? 解:H0:μ=100;H1:μ≠100

经计算得:=99.9778 S=1.21221 检验统计量:

t

-0.055

2

当α=0.05,自由度n-1=9时,查表得t

9 =2.262。因为t<t 2,样本统计量落

在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50

袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)? 解:解:H0:π≤0.05;H1:π>0.05

已知: p=6/50=0.12 检验统计量:

Z

=2.271

当α=0.05,查表得z =1.645。因为z>z ,样本统计量落在拒绝区域,故拒绝原假设,

接受备择假设,说明该批食品不能出厂。

8.7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170

问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)? 解:H0:μ≤225;H1:μ>225

经计算知:=241.5 s=98.726 检验统计量:

t

0.669

当α=0.05,自由度n-1=15时,查表得t 15 =1.753。因为t<t ,样本统计量落在接

受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。 9.1 9.2 9.3 9.4 10.2 10.4

10.7 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果;

要求:

(1)完成上面的方差分析表。

(2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异? 解:(2)P=0.025>a=0.05,没有显著差异。

11.3 11.4

11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

方差分析表

参数估计表

要求:

(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(a=0.05)。 解:(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。 (3)r=0.9877。

(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。 (5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。 回归直线的检验:p=2.17E—09<α,回归直线显著。 11.10

13.1 下表是1981年—1999年国家财政用于农业的支出额数据

(1)绘制时间序列图描述其形态。 (2)计算年平均增长率。

(3)根据年平均增长率预测2000年的支出额。

详细答案:

(1)时间序列图如下:

从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。

(2)年平均增长率为:

(3

13.2 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)

(1)绘制时间序列图描述其形态。

(2)用5期移动平均法预测2001年的单位面积产量。

(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案:

(1)时间序列图如下:

(2)2001年的预测值为:

|

(3)由Excel输出的指数平滑预测值如下表:

2001年a=0.3时的预测值为:

a=0.5时的预测值为:

比较误差平方可知,a=0.5更合适。

13.3 下面是一家旅馆过去18个月的营业额数据

(1)用3期移动平均法预测第19个月的营业额。

(2)采用指数平滑法,分别用平滑系数a=0.3、a=0.4和a=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适? (3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。 详细答案:

(1)第19个月的3期移动平均预测值为:

(2)

本文来源:https://www.bwwdw.com/article/d0jm.html

Top