复习及答案

更新时间:2023-11-14 06:46:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1、从均值为100、标准差为25的总体中,抽取n=100的简单随机样本,用样本均值估计总体均值。

(1) 样本均值的数学期望是多少? (2) 样本均值的标准差是多少? (3) 样本均值的抽样分布是什么?

(4)样本方差S的抽样分布是什么? 解:(1)100;(2)

2

?n=

25100=2.5;(3)正态分布;(4)?2(100-1)。

2、从一个标准差为10的总体中抽出一个容量为50的样本,样本均值为20。

(1)样本均值的抽样标准差σx等于多少; (2)在95%的置信水平下,边际误差是多少?

解: (1)样本均值的抽样标准差σx=σ/n =10/50=1.41

(2)在95%的置信水平下,边际误差=Zμ=1.96*σx=1.96*10/50=2.7636 3、某收购站对某商品的收购资料如下: 地 区 单价(元/公斤) 甲 乙 丙 12 10.5 收购额(万元) 2.4 3.15 3.6 9 计算该商品的平均收购价格。 解:x??M?Mx?24000?31500?360002400012?3150010.5?360009?915009000?10.17(元/公斤)

4、某信息传呼机服务台两名接线员5天中每天接呼次数资料如下: A接线员:120 108 76 184 165

B接线员:94 68 113 55 99

要求:根据以上资料,分别计算A、B两个接线员接线次数的全距和标准差,并从日均次数的代表性接线次数日分布的均衡角度作出简要评价和分析。 解: A接线员:

R=最大变量值 — 最小变量值=184-76=108 x??x=130.6

nσ=

??x?x?n2=39.09 或S=

??x?x?n?12=43.7

v???x?100%=29.93% 或v??sx?100%=33.46%

B接线员:

1

R=最大变量值 — 最小变量值=113-55=58 x??x=85.8

nσ=

??x?x?n2=21.198或S=

??x?x?n?12=23.7

v???x?100%=24.71% 或v??sx?100%=27.6%

B更具代表性

5、什么是“二手资料”?使用“二手资料”需要注意些什么? 6、 P111 4.11

答案: (1)离散系数 因为二个组变量值水平不同,用离散系数可以消除其影响。 (2)成年组:平均数=172.1 标准差=4.2 标准差系数=0.024 幼儿组: 平均数=71.2 标准差=2.3 标准差系数=0.032 幼儿身高差异大

7、 P110 4.5 解:x甲??M?Mx?2100?3000?1500210015?300020?150030?19.41 (元)

x乙??M?Mx?3255?1500?1500325515?150020?150030?18.29 (元)

甲企业的总平均成本高,因为这个企业单位成本低的产品产量比乙企业少,而单位成本较高的产品产量比乙企业多,使其总平均成本高。

8、P155 5.17一工厂生产的电子管寿命X(以小时计算)服从期望值为μ=160正态分布,若要求p{120<X<200}≥0.08,允许标准差σ最大为多少? (Ф(0.11)≥0.54 )

解: p{120<X<200}=Φ(40/σ)- Φ(-40/σ)=2Φ(40/σ)-1=0.08 则Φ(40/σ)=0.54 40/σ=0.11 所以σ=363即允许标准差σ最大为363.

9、 P207 7.15

7.15在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解: n=200 p=23%

?p

=P(1-P)/n=0.23*0.77/200=0.0298 ΔP=Z?p

F(Z)=90% Z=1.645时,

根据以下公式: p-ΔP≤P≤p+ΔP 得置信区间[18% , 28%]

即有90%的概率保证拥有某品牌电视机的家庭的比例在18%--28%之间。

2

F(Z)=95% Z=1.96时,

根据以下公式: p-ΔP≤P≤p+ΔP 得置信区间[17% , 29%]

即有95%的概率保证拥有某品牌电视机的家庭的比例在17%--29%之间。

10、 P206 7.8

7.8从一个正态总体中随机抽取容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。

解: n=8 样本平均数=10 s=3.464 α=0.05时,tα/2(n-1)=2.3646

?x=S/n= 3.464/8=1.225(小时)

2置信区间:

上限=10+2.3646*1.225=12.897

下限=10-2.3646*1.225=7.103

11、 P247 8.4

8.4糖厂用自动打包机打包,每包标准重量是100kg。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量如下:

99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常。(α=0.05) 解:μ0=100公斤 s=1.212 n=9 平均数=99.98 ①H0:μ=100 H1:μ≠100 ② t=

x??0sn= (99.98-100)/1.212/3=-0.049

③取α=0.05 查表得:tα/2(n-1)=t0.025(8)=2.306 ④因为︱t︱<︱tα/2(n-1)︱ 所以接受H0,即该日打包机工作正常.

12、 P247 8.5

8.5某种大量生产的袋装食品,按规定不得少于250g。今从一批该食品中任意抽取50袋,发现有6袋低于250g。若规定不符合标准的比例超过5%就不得出厂,该批食品能否出厂?(α=0.05)

解:μ0=250克 n=50 л0=5% P=12% ①H0: л0≤5% H1: л0>5% ② Z=

p??0?0?1??0?n=(12%-5%)/0.031=2.258

③取α=0.05 查表得:Zα=Z0.05=1.645 ④因为Z>Zα

所以拒绝H0,即这批食品不能出厂.

13、为什么要计算离散系数?

3

14、某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客

组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差;

(2)在95%的置信水平下,求边际误差。 解:(1)假定总体标准差为15元,

样本均值的抽样标准误差=σ/n=15/49=2.143(元)

(2)在95%的置信水平下,

边际误差=Zμ=1.96*2.143=4.2(元)

15、P78 3.2

16.根据如下11名学生的英语考试成绩,绘制相应的箱线图.

编号成绩17629039747857069578688396010771175

解: 已知n?11,由样本数据求得

min?60,QL?75,Me?78,QU?90,max?97 (

3nn44??114334?2.75?8.25QL?70?0.75?(75?70)?73.75QU?86?0.25?(90?86)?87

则相应的箱线图如下

17.说明直方图与条形图的主要差别. 解: 主要区别有

(1)条形图用宽度表示类别,宽度都相等,而直方图用宽度表示组距,宽度可以不相等.

(2)条形图通常分开排列,而直方图则是连续排列.

(3)条形图主要用于表示分类数据,直方图则主要用于表示数值型数据.

18.说明在参数估计和假设检验中大样本方法与小样本方法的主要区别是什么?

4

解:(1)大样本方法对总体分布没有要求,但对样本量有要求(本课程要求样本量不小于30),只能得到统计量的渐近分布.

(2)小样本方法对总体分布有要求(本课程要求总体为正态分布),但对样本量没有要求,可以得到统计量的精确分布.

19.从某企业生产的一批袋装食品中随机抽取50包,测得每包重量(单位:克)如下,设每包重量服从正态分布,求

重量99以下99-100100-101101以上

包数423203

(1)该批袋装食品平均重量?的0.95置信区间; (2)该批袋装食品方差?2的0.95置信区间. 解: 已知总体正态,n?50.由样本数据得 x?99.94,s2?0.5371?0.732 (1)由于

??2.02?0.7350?0.21

得?的0.95置信区间为x?Zs0.73290.025?n?99.94?1.96?50

即:(99.73 , 100.15)

(2) 由于?n?1?S22?n?1?S2?2???2?n?1???2 1??2?n?1? ?n?1?S249?0.5371?0.83 , ?n?1?S249?0.5371?2?1?=

1??2?n31.55?21?=

?2?n?70.22?0.37得?2的0.95置信区间为(0.37 , 0.83)

20、下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:

地区 人均GDP(元)x 人均消费水平(元)y 北京 22460 7326 辽宁 11 226 4 490 上海 34 547 11 546 江西 4 851 2 396 河南 5 444 2 208 贵州 2 662 1 608 陕西 4 549 2 035 (1)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

5

(2)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数,并解释其意义。

(4)检验回归方程线性关系的显著性。(α=0.05)

(5)如果某地区的人均GDP为5 000元,预测其人均消费水平。

(n=7 Σx=85739 Σx2=1904918867 Σy=31609 Σy2=224483461 Σxy=651007421

F0.05(1,5)=6.61 t0.025(5)=2.5706 )

解:(1) 线性相关系数??2n?xy?n?x?yn?x???x?2n?y?2??y?2=0.9981

说明两个变量之间的关系很密切。

22

(2) ??1= (nΣxy -ΣxΣy )/[nΣx-(Σx)] =0.3087

?=Σy /n-??Σx /n=734.69 所以y?+??x =734.69+0.3087x ?=??1100??1=0.3087说明人均GDP每增加1元,人均消费水平平均增加0.3087元.

(3)计算判定系数r:

22?Σy-??Σxy SSE=∑e=Σy-?102

SST=Σy-(Σy)/n r2=1-SSE/SST=0.9964

说明人均消费水平的变动有99.64%是由人均GDP变动引起来的. (4)对回归方程的线性关系进行F检验(α=0.05):

H0: β1=0 H1: β1≠0

22?Σy-??Σxy SSE=∑e=Σy-?1022

SST=Σy2-(Σy)2/n

构造F统计量 F=(SST-SSE)/SSE/(n-2)=1382.23

取α=0.05 查F分布表得F0.05(1,n-2)=F0.05(1,5)= 6.61

因为F>F0.05(1,n-2),所以拒绝H0,接受H1即回归系数、回归方程显著,人均消费水平与人均GDP之间存在显著的线性相关关系。

(5)如果某地区的人均GDP为5 000元,预测其人均消费水平。

将x0=5000代入一元线性回归模型得 ?+??x =2274.69(元) ?=?y1021、1980年进行的一项美国人口统计研究发现,有40%的新车买主是妇女。假定在n=120名1995年的新车买主所组成的随机样本中有57人是妇女。此项证据是否表明1995年新车

买主中妇女所占的真正比例显著大于1980年的0.40?试在?=0.05显著性水平下用拒绝区方法对这个问题进行假设检验。

解:我们希望完成对总体比例丌的大样本检验:

Ho:丌?0.40 (即从1980年到1995年比例不变)

H1: 丌>0.40(即1995年新车买主中妇女所占比例比1980年大)

在?=o.05显著性水平下,单尾检验的拒z绝区由满足如下条件的所有z值组成: z0.05=1.645

6

样本比例p=

57120?0.475

代入检验统计量公式,得到Z=

p??0?0?1??0?n=1.68

这个z值落在拒绝区内,于是我们得出结论:1995年新车买主中妇女所占的比例比1980年的o.40有显著增加。这样说犯第1类错误的概率(拒绝事实为真的Ho的概率)为?=0.05。

22、某企业生产某种产品的产量和单位成本资料如下: 月份 产量(千件)x 1 2 4 6 3 8 4 7 5 8 6 9 69 单位成本(元/件)y 73 72 71 72 70 22Σx=42 Σx=310 Σy=427 Σy=30399 Σxy=2977 要求:①分析判断产量和单位成本之间是否存在相关关系?其相关程度如何? ②确定单位成本对产量的一元线性回归模型,并指出其回归系数的意义。 ③对该模型拟合优度进行评价。 ④计算该回归模型的估计标准误。 解: ①γ=

n?xy??x?yn?x???x?22n?y???y?2=- 0.9115

2说明产量和单位成本之间高度相关。 ??②?1LxyLxx?n?xy?n?x2?x?y= —0.75

???x?2??y???x=76.42 ?01????x=76.42 – 0.75x ???y01??1= - 0.75说明产量每增加一千件,单位成本平均会下降0.75元

nn2i③SSE =

?ei?1??i?1??y??yi??xiyi=30399- 76.42?427?0.75?2977=0.41 0?1?2ii?1i?1nnnSST = S总=?yi2?i?1?n???yi??i?1?n2=30399- 4272/6=10.83

R2= SSR/SST = 1--SSE/SST=1- 0.41/10.83= 0.9621 说明单位成本的变动中,有96.21%是由产量变动引起的.

④Sy???yi?i??y2n?2?ssen?2?MSE=

0.416?2=0.32(元/件)

7

本文来源:https://www.bwwdw.com/article/yz1v.html

Top