统计学复习题1

更新时间:2023-12-09 20:24:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 绪论 一、填空

1、统计数据按测定层次分,可以分为分类数据 、 顺序数据和 数值型数据 ;如果按时间状况分,可以分为 截面数据 和 时间序列数据 。

2、由一组频数2,5,6,7得到的一组频率依次是 0.1 、 0.25 、 0.3 和 0.35 ,如果这组频数各增加20%,则所得到的频率 不变 。

3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为 640,其组中值为620 。

4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。

5、中位数Me可反映总体的 集中 趋势,四分位差Q.D可反映总体的 离散 程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大 2 倍,而频数都减少为原来的 1/3 ,那么算术平均数 扩大为原来的2倍 。 四、计算题

1、某班的经济学成绩如下表所示: 43 77 84

55 77 86

56 78 87

56 79 88

59 80 88

60 81 89

67 82 90

69 83 90

73 83 95

75 83 97

(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数 (2)计算该班经济学成绩的众数、四分位差和离散系数。

(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间?

4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组 按身高分组(cm) 150~155 155~160 160~165 165~170 人数(人) 22 108 95 43 青少年组 按身高分组(cm) 70~75 75~80 80~85 85~90 人数(人) 26 83 39 28 170以上 32 90以上 24 合计 300 合计 200 要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。

(2)说明成年组和青少年组平均身高的代表性哪个大?为什么? 6、设甲、乙两单位职工的工资资料如下: 甲单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 2 4 10 7 6 4 30 乙单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 1 2 4 12 6 5 30 要求:试比较哪个单位的职工工资差异程度小。

8、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是 100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想? KEY: 1、(1)77, 80.5,68.5,87.25 (2)83,18.75,0.173

(3)中位数,是数据分布明显左偏又是顺序数据。 (4)左偏 组中值y yf y^2 身高(cm) 频数f x 22 152.5 -2 -44 4 150~155 108 157.5 -1 -108 1 155~160 95 162.5 0 0 0 160~165 43 167.5 1 43 1 165~170 32 172.5 2 64 4 170以上 300 -45 合 计 (y^2)f 88 108 0 43 128 367 令y?y?x?ax?162.5 ?b5?yf45????0.15 ?f300x?a?by?162.5?5*(?0.15)?161.75

?y2f367y???1.223

?f3002标准差: ?y?y2?y2?1.0957

575. ?x?b?y?5?1.09? 4标准差变异系数:

?5.4784C????0.03387

X161.75成人组的平均身高为161.75cm,标准差为5.4784cm,标准差系数为0.03387。 青少年组 身高频率f 组中值 y yf y^2 (y^2)f (cm) 26 72.5 -2 -52 4 104 70~75 83 77.5 -1 -83 1 83 75~80 39 82.5 0 0 0 0 80~85 28 87.5 1 28 1 28 85~90 24 92.5 2 48 4 96 90以上 合 200 -59 311 计 令y?y?x?ax?82.5 ?b5?yf59????0.295 ?f200x?a?by?82.5?5*(?0.295)?81.025

?y2f311y???1.555

?f2002标准差: ?y?y2?y2?1.2116

57 ?x?b?y?5?1.09?6 .标准差变异系数: ?6.058C????0.074767

X81.025成人组的平均身高为81.025cm,标准差为6.058cm,标准差系数为0.074767。 (2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。

xf2705026000???819.70(元);    x乙??866.67(元) 6、解:x甲?f3330??甲=138.14(元);          ?乙=124.05(元)

138.14124.05?16.85%;         V乙=?14.31%

819.70866.67? V甲?V乙,所以乙单位职工工资差异程度小 V甲=第二章 统计量及其分布 习题 一、填空题

1、简单随机抽样样本均值X的方差取决于 样本量 和总体方差_,要使X的标准差降低到原来的50%,则样本容量需要扩大到原来的 4 倍。 2、设X1,X2,,X17是总体N(?,4)的样本,S2是样本方差,若P(S2?a)?0.01,则

222?0.995(17)?35.7, ?0.99(16)?32.0, ?0.995(16)?34.2)

a?__32。

2 (注:?0.99(17)?33.4,

3、若Xt(5),则X2服从_F(1,5)______分布。

4、已知F0.95(10,5)?4.74,则F0.05(5,10)等于____0.21_______。

5、中心极限定理是说:如果总体存在有限的方差,那么,随着 样本量 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 正态分布 。 四、计算题

1、从正态总体N(52,6.32)中随机抽取容量为36的样本,要求: (1)求样本均值x的分布;

(2)求x落在区间(50.8,53.8)内的概率;

(3)若要以99%的概率保证|x?52|?2,试问样本量至少应取多少?

这个简答题,我到时候发照片给你们吧!

第三章 参数估计 习题

一、填空题

1、无偏性、 有效性 和 一致性 是对估计量最基本的要求。

2、总体X~N(?,?2),(X1,X2,X3)是来自X的一个容量为3的样本,三个?的

11132111无偏估X1?X2?X3,X1?X2,X1?X2?X3计量中,最有效的一个是

33355236111X1?X2?X3。 3333、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为 (0.088,0.232)。

4、若总体X的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为 0.5 ,总体方差的矩估计值为 0.25 。 5、小样本,方差?2未知,总体均值的区间估计为 x?t四、计算题

1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米。请确定该苗圃中树苗平均高度的置信区间,置信水平95%。 1、解:x?z1??/2sn?62?1.96?8.264?62?2.01

?21?S。 n该苗圃中树苗平均高度的置信水平为95%的置信区间为(59.99,64.01)厘米。 第四章 假设检验

填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、

填空

1、在做假设检验时容易犯的两类错误是 拒真错误 和 纳伪错误 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 双侧检验 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 单侧检验

3、假设检验有两类错误,分别是 拒真错误也叫第一类错误,它是指原假设H0是 真实的,却由于样本缘故做出了 拒绝 H0的错误;和 纳伪错误 叫第二类错误,它是指原假设H0是 假 的, 却由于样本缘故做出 接受 H0的错误。

4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 显著性水平 。

5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 小概率原理。

6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,在显著性水平α下,否定域为 下面有答案

7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为H0:t≥1000 H1:t<1000(用H0,H1表示)

8、一般在样本的容量被确定后,犯第一类错误的概率为?,犯第二类错误的概

率为?,若减少?,则? 增大

9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 有 (有,没有)达到该标准。

6、1.25>z?

1?2

二、 计算

1、下面是某个随机选取20只部件的装配时间(单位:分)

9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7

(?=0.05)设装配时间的总体服从正态分布,参数均未知,可否认为装配时间的

均值为10? 2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。一直这种原件的寿命服从正态分布,标准差为100小时。试求在显著性水平为0.05下,确定厂家的声明是否可信? 4、在一批产品中抽 40 件进行调查,发现次品有 6 件,试按显著水平为 0.05 来判断该批产品的次品率是否高于 10 %。 KEY:

1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所

22(?=0.05)问进行区分。由题设知总体X~N(?,?),?,?均未知,要求在水平

下检验假设H0:??10,H1:??10

x??0s2n (1) 因?未知,采用t检验,取检验统计量为:

?t??n?1??t0.025(19)?2.0930??0.05x(2) 由于n=20,=10.2,s=0.51,,2

t??t?(3) 绝对域为:

x??0?t??n?1?s2n

?(4) 经计算t?1.75?2.0930即检验统计量不落在拒绝域内,故在水平

??0.05下接受原假设H0,即认为装配时间均值可认为是10。

2、解:HO:??1000cm

H1:: ?<1000cm

z?x??n在显著性水平=0.05时,Z?=1.96

2?~N(0,1)代入数值,得到z=

950?1000=-2.5

10025Z>Z?, 拒绝原假设HO。结论:该厂家的声称不可信。

2

4、解:提出假设:H0 :p≤10% H1 :p>10% 建立检验统计量:

p?p0 z?p0(1?p0)nP=6/40=0.15 n=40 ∴Z=1.05

对于显著性水平0.05,查正态分布表得1.65,故接受原假设,可以认为该批产品的次品率不高于18%

一、 填空

1、现象之间普遍存在的相互关系可以概括为两类:一类是 函数关系 ,另一类是 相关关系 。

2、在简单回归分析中,因变量y的总离差可以分解为 回归平方和 和 残差平方和 。 3、若相关系数为r=0.92,表示两变量之间呈 强正 关系。

?的意义是 当x=0时,y的期望值为10。 ??10?0.5x中,截矩?4、线性回归方程y0?的意义是 X每增加一个单位,y平均下降0.8个??12?0.8x中,斜率?5、线性回归方程y1单位

四、计算

1、下表是一小卖部某6天卖出热珍珠奶茶的杯数与当天气温的对比表. 气温(℃)x 杯数26 20 18 24 13 34 10 38 4 50 -1 64 y 现在的问题是:如果某天的气温是-5℃,这天小卖部大概要准备多少杯热珍珠奶茶比较好一些?

2、某种商品的需求量y(斤) 和商品价格 x(元) 有关,现取得10对观测数据经计算得如下数据:

?x?60,?y?800,?x2?390,?y2?67450,?xy?4500

??a?bx(3)解释b的意义。 要求:(1)计算相关系数;(2)求y 对x 的线性回归方程y3、某地区某企业近8年产品产量与生产费用的相关情况如下表所示:

年份 1997 1998 产品产量 (千吨)x 1.2 2.0 生产费用 (万元)y 62 86 1999 2000 2001 2002 2003 2004 3.1 3.8 5.0 6.1 7.2 8.0 80 110 115 132 135 160 要求:(1)分析产品产量与生产费用的相关关系;

参考答案:

四、计算题。

1、解:为求回归方程,先计算有关数据: 序号 1 2 3 4 5 6 Σ xi 26 18 13 10 4 -1 70 yi 20 24 34 38 50 64 230 xi2 676 324 169 100 16 1 1286 yi2 400 576 1156 1444 2500 4096 10172 xiyi 520 432 442 380 200 -64 1910 由表中数据得: x=11.67 y=38.33

Sxx??xi2?nx2i?1nn=469.33

Sxy??xiyi?nxyi?1= -773.33

将以上数据代入,于是可得

Sxy?b??Sxx-1.65

????y?bxa57.56

于是得到回归方程

y?57.56-1.65x

如果某天的气温是-5℃,这天小卖部大概要准备珍珠奶茶=57.56-1.65×(-5)=66杯

2. 某种商品的需求量y(斤) 和商品价格 x(元) 有关,现取得10对观测数据经计算得如下数据:

?x?60,?y?800,?x2?390,?y2?67450,?xy?4500

3、答案: (1)相关系数r?10*4500?60*80010*390?60210*67450?8002=-0.9325;

?(2)回归方程y?140?10x;

(3)该商品价格每增加1元,需求量平均减少10斤。

125、解:

(1)计算相关系数

r?8?45446?36.4?88008?207.54?36.4?8?10421400?880022?0.9697

因此可判断出产品产量与生产费用是正相关的。 (2)建立一元回归模型:

??b0?b1xy

b1x?x??y?y?????128.9599(x?x)?2b0?y?b1x?513.2323?

一元线性回归模型为:y?513.2323?128.9599x

第七章 时间序列分析

一、 填空

1、下表为两个地区的财政收入数据:

年份 1997 1998 A地区财政收入(亿元) 40 60 B地区财政收入(亿元) 7 11 则A地区财政收入的增长速度是 50% ,B地区财政收入的增长速度是 57.14% ,A地区财政收入的增长1%的绝对值为 0.4 ,B地区财政收入的增长1%的绝对值为 0.07 。

2、已知环比增长速度为7.1%、3.4%、3.6%、5.3%,则定基增长速度是 20.81% 。

3、年劳动生产率r(千元)和职工工资y (元)之间的回归方程为y?120?110x,这意味着年劳动生产率每提高1千元时,职工工资平均 增加110元 。

4、拉氏价格或销售量指数的同度量因素都是选基期,而派许指数的同度量因素则选 期。

5、动态数列的变动一般可以分解为四部分,即趋势变动、 季节变动、 循环 变动和不规则变动。

四、计算题

1、以下为某高校某专业15年报考考生人数的历史数据: 年份 报考人数(人) 年份 报考人数(人) 1991 1111 1999 1290 1992 1145 2000 1306 1993 1146 2001 1323 1994 1183 2002 1358 1995 1213 2003 1388

1996 1244 2004 1402 1997 1282 2005 1432 1998 1282 要求:用一次线性模型预测该学校2006年报考人数。

2、已知某化肥厂近年生产情况,请填入表中空缺的指标值并计算年平均增长量、年平均发展速度

年份 产量(吨) 累计增长量(吨) 定基发展速度(%) 1998 1999 2000 2001 2002 2003 100 20 100 125 120 130 环比发展速度(%)

1、解:

(1)画散点图。

可以看出,数据大致成线性模型。

(2)对数据运用线性模型进行拟合:yt?b0?bt1

?t?1097.6?22t 得到最终拟合方程为:y2其中,调整的R?0.9922,F?823.8?F0.05(1,13),则方程通过显著性检验,拟合效果

本文来源:https://www.bwwdw.com/article/abc5.html

Top