17年12月考试《统计学》复习题

更新时间:2024-04-21 07:06:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学复习题及答案

一、判断题

1、几何平均数是计算平均比率的比较适用的一种方法,符合人们的认识实际。 2、平均数反映了总体分布的集中趋势,它是总体分布的重要特征值。 3、标志变异指标说明变量的集中趋势。

4、平均差是各标志值对其算数平均数的离差的平均数。 5、平均增长速度是环比增长速度连乘积开n次方根。

6、区间估计可根据样本估计值精确地推断出总体参数必定所在的范围。

7、回归分析是指对相关现象的关系转变为函数关系,并建立变量关系的数学表

达式,来研究变量之间数量变动关系的统计分析方法。

8、编制工业产品产量总指数过程中多使用的同度量因素(又称权数)是用不变

权数(不变价格),所以指数数列中各环比指数的连乘积等于定基指数。

答案:1、对 2、对 3、错 4、错 5、错 6、错 7、对 8、错

二、多项选择题

1. 在数据离散程度的测量值中,不受极端值影响的测度值是( )

A. 极差 B. 异众比率 C. 四分位差 D. 标准差 E. 离散系数 2. 以下分布中属于离散型随机变量的概率模型有( )

A.泊松分布 B. 正态分布 C.二项分布 D.超几何分布 3. 用切贝谢夫不等式对概率的陈述正确的有( )

A.??2?里最多包含全部概率的3 B.??2?里至少包含全部概率的3

44C.??3?里至少包含全部概率的1 D.??3?里至少包含全部概率的8

994. 以下说法正确的有( )

A.样本是唯一的 B.全及总体是唯一确定的 C.样本指标是随机变量 D.总体指标只有一个

5. 关于假设检验和区间估计的区别和联系,以下表述正确的有( )

A.前者要对总体参数作出某种假设,然后根据抽样分布规律确定可以接受的临界值

B.后者不需要对总体参数作出假设,它根据抽样分布规律找出恰当的区间,并给出这一区间包含总体参数的概率

C.二者都是对总体参数的推断,都是运用概率估计得到自己的结论 D.假设检验和区间估计都有两类错误 6. 在样本容量n固定的条件下( )

A.缩小显著性水平,就扩大了拒绝域,从而增加犯第一类错误的概率 B.缩小显著性水平,可缩小拒绝域,从而减少犯第一类错误的概率 C.缩小显著性水平,可缩小拒绝域,从而增加犯第二类错误的概率 D.不可能同时减少犯两类错误的概率 7. 应用相关分析与回归分析需要注意( )

A.在定性分析的基础上进行定量分析 B.要具体问题具体分析

C.要考虑社会经济现象的复杂性

D.要对相关与回归分析结果的有效性进行假设检验 8. 能够用来判断现象相关方向的指标有( )

A.回归系数 B.相关系数 C.回归方程参数 D.x,y的平均数

答案:1、BC 2、ACD 3、 BD 4、 BC 5、 ABC 6、BCD 7、 ABCD 8、AB

三、计算题 1、在某饮料公司生产的10000罐饮料中,饮料包装上标注的每罐重量是500克。现按不重复简单随机抽样方法抽取50罐进行检查,测得平均每罐的重量为497克。已知该种罐装饮料的重量服从正态分布,且标准差为5克。试以95%的置信度估计该种饮料平均重量的置信区间。如果要求估计的误差不超过2克,这时的置信度是多少?

【解】 (1)查标准正态分布表或利用Excel的NORM.S.INV函数得到临界值 。

本例中置信度为95%,即1-α=95%,则α=5%,在Excel中输入“=NORM.S.INV(0.025)”得到临界值z?/2?z0.025??1.96 。

已知 =497克,n=50, =5克。

由于总体服从正态分布,不重复抽样,所以置信区间上下限是:

x?z?/2?nN?nN?1?497?1.96?55010000?5010000?1?497?1.38

因此,该种饮料置信度为95%的平均重量的置信区间为495.62~498.38克。显然,平均来说,罐上标注的重量与实际情况不符。

(2)要求极限误差等于2克,即? =2克。

由z?/2???nN?nN?1?255010000?5010000?1?20.71?2.84 ,有

查标准正态分布表或利用Excel的NORM.S.DIST函数得到临界值z?/2 对应的置信度。本例中,在Excel中输入“=NORM.S.DIST(2.84,TRUE)”得到双尾置信度1???99.77% 。上述结果表明,罐装饮料的平均重量介于495~499克之间的概率是99.77%。

2、某家银行设立自助服务台供客户使用,原来客户服务时间平均4分钟,在进行系统升级后,银行希望了解平均服务时间是否发生变化。假设客户使用自助服务系统时间的标准差是2分钟,抽取了400名客户进行调查,发现新的平均服务时间是3.7分钟。调查结果显示客户服务时间是否发生变化?(该显著性水平? 为0.05) 【解】(1)建立假设。

银行希望客户服务时间均值能有变化但并不清楚变化的方向,那么备择假设就是:均值不等于原来的4分钟;原假设是:均值等于原来的4分钟。则双侧检验如下:

H0:??4;H1:??4

(2)选择合适的检验统计量。

本例是对单个总体均值的检验,且总体方差已知,那么使用Z检验。

(3)确定显著性水平?。在本例中?为0.05。 (4)确定临界值和拒绝域。

因为本例是双侧检验,临界值有两个,且?为0.05,所以分布曲线两侧各

Z?Z0.025?1.96有?2的面积,即0.025。查标准正态分布,得右侧临界值?2,则左

?Z??Z0.025??1.96侧临界值?2,相应的拒绝域为(??,?1.96)和(1.96,?)。

(5)收集样本数据计算检验统计量。已知,x?3.7,n?400,??2,以及??4,那么可以算出

x??3.7?4Z????3?n2400

(6)将检验统计量和临界值进行比较,由于检验统计量为-3,小于分布左侧的临界值-1.96,说明检验统计量 落入拒绝域之内,如图所示。

Z的分布0.0250.025?3?1.9601.96

(7)得出结论。拒绝原假设,顾客平均服务时间有明显的不同,在对收银设备和程序做改进后其时间的变化是统计显著的。

3、某集团在华南、华中、华北、东北四个地区各拥有一家分公司,简称为A公司、B公司、C公司、D公司,从这四家公司中分别随机抽取六个月的收益,资料如下表所示。分析这四家分公司的平均月收益是否相同,即确定区域因素是否对公司收益有影响(?=0.05)。利用软件计算输出的结果如表2所示,试对表2中的方差分析结果中的各项内容加以解释。

表1 四家分公司的平均月收益 (单位:万元) 第一个月 第二个月 第三个月 第四个月 第五个月 第六个月 A公司 300 360 270 240 330 280 B公司 210 330 240 390 300 330 C公司 420 240 360 300 330 360 D公司 320 340 260 330 300 320

表2

【解】

如果把每一家分公司的月收益看成一个总体,以上问题的实质是检验这四个总体的均值是否相等:

H0:?1??2??3??4 H1:?1,?2,?3,?4四者不全相等

?1,?2,?3,?4分别为这四家分公司的平均月收益。

由上表2可得:SST=59183.33,SSA=5416.667,SSE=53766,MSA=1805.556,MSE=2688.333,样本的统计量F=1805.556/2688.333=0.672,临界值F?=3.1,P值是0.579。P值大于显著性水平0.05,接受H0。即区域因素对四家分公司的月收益没有显著性影响。

4、表3是1993-2012年我国国内生产总值(现价)和发电量的有关资料,试利用表3中的数据计算我国年底国内生产总值和发电量的回归方程。(注:发电量为因变量)

年份 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 国内生产总值(千亿元)Xi 35.334 48.198 60.794 71.177 78.973 84.402 89.677 99.215 109.655 120.333 135.823 表3 我国近年来国内生产总值和发电量相关数据 发电量(千亿千22Xi Yi 瓦小时)Yi 8.395 9.281 10.070 10.813 11.356 11.670 12.393 13.556 14.808 16.540 19.106 1248.486 2323.033 3695.878 5066.107 6236.740 7123.745 8041.974 9843.528 12024.256 14479.956 18447.821 70.476 86.137 101.411 116.923 128.948 136.189 153.586 183.765 219.277 273.572 365.030 XiYi 296.628 447.324 612.211 769.640 896.781 984.975 1111.368 1344.952 1623.776 1990.303 2594.996 2004 2005 2006 2007 2008 2009 2010 2011 2012 合计 159.878 184.937 216.314 265.810 314.045 340.903 401.513 473.104 519.322 3809.407 22.033 25.003 28.657 32.816 34.958 37.147 42.072 47.130 49.378 457.180 8 25561.083 34201.830 46791.931 70655.119 98624.529 116214.72161212.525 223827.395 269695.340 1135316.004 485.457 625.130 821.239 1076.859 1222.034 1379.863 1770.020 2221.255 2438.157 13875.328 3522.614 4623.915 6198.979 8722.706 10978.278 12663.350 16892.286 22297.481 25642.926 124215.487

【解】

我们利用表3中已给出我国近年来国内生产总值和发电量的数据,来估计我国发电量的基础水平与发电量边际值。

假设总体回归模型为Yi??0??1Xi??i

将表3中合计栏的有关数据代入式回归系数公式,可得

???120?124215.487?3809.407?457.180?0.09120?1135316.004?3809.4072i 样本回归方程为i式中,0.091是发电量边际值,表示国内生产总值每增加1单位,发电量会增加0.091单位;5.596是发电量基本水平,即与国内生产总值无关最基本的发电量为5.596单位。

??457.180?20?0.091?3809.407?20?5.596?0 ?Y?5.596?0.091X

5、某企业生产3种产品,基期和报告期的销售量及价格如表4所示。利用

综合指数体系分析价格变动和销售量变动对销售额的影响。

表4 某企业3种商品的价格及销售量

商品名称 甲 乙 丙 合计

计量单位 吨 件 米 -

销售量 基期 报告期q0 q1 1200 1500 500 -

1500 2000 600 -

价格/元 基期 报告期p0 p1 3.6 2.3 9.8 -

4.0 2.4 10.6 -

基期 p0q0 4320 3450 4900 12670

销售额/元 报告期基期p1q1 p0q1 6000 4800 6360 17160

5400 4600 5880 15880

报告期p1q0 4800 3600 5300 13700

【解】

?销售额指数

?pq?pq110111?0017160?135.44670

pq??pq价格指数??17160?108.06880

?销售量指数

?pq?pq01?0015880?125.34670

三者之间的数量关系为:135.44%?108.06%?125.34%。

即1999年与1998年相比,该粮油商店3种商品的销售额提高了35.44%。其中,由于零售价格的变动,使销售额提高了8.06%;由于销售量的变动,使销售额提高了25.34%。 从绝对变动水平看,根据公式(12-14), 销售额变动

=?pq??pq1100?17160?12670?44901101(元)

价格变动对销售额的影响

=?pq??pq?17160?15880?1280(元)

=销售量变动对销售额的影响

?pq??pq0100?15880?12670?3210(元)

三者之间的数量关系为:4490(元)=1280(元)+3210(元)。即1999年与1998年相比,该粮油商店3种商品的销售额增加了4490元。其中,由于零售价格的变动,使销售额增加了1280元;由于销售量的变动,使销售额增加了3210元。

?销售量指数

?pq?pq01?0015880?125.34670

三者之间的数量关系为:135.44%?108.06%?125.34%。

即1999年与1998年相比,该粮油商店3种商品的销售额提高了35.44%。其中,由于零售价格的变动,使销售额提高了8.06%;由于销售量的变动,使销售额提高了25.34%。 从绝对变动水平看,根据公式(12-14), 销售额变动

=?pq??pq1100?17160?12670?44901101(元)

价格变动对销售额的影响

=?pq??pq?17160?15880?1280(元)

=销售量变动对销售额的影响

?pq??pq0100?15880?12670?3210(元)

三者之间的数量关系为:4490(元)=1280(元)+3210(元)。即1999年与1998年相比,该粮油商店3种商品的销售额增加了4490元。其中,由于零售价格的变动,使销售额增加了1280元;由于销售量的变动,使销售额增加了3210元。

本文来源:https://www.bwwdw.com/article/9cxp.html

Top