2014年统计学第五版复习重点+简答题+2套考试题目题型(个人筛选编

更新时间:2024-06-10 10:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《统计学》 第五版

《统计学》

考试题型:

1、单项选择题(20分,每题1分) 2、填空题(10分,每空1分) 3、简答题(20分,4题,每题5分)

4、分析计算题(50分,共4题,包括均值和方差等计算,参数估计,假设检验、回归分析、指数计算,要求携带计算器)

第一章 导论

? 统计学的概念

? 统计的2类方法:描述统计和推断统计

? 统计数据类型:(分类数据、顺序数据、数值型数据),(观察数据与实验数据),(截面数据与时

间序列数据)

? 数据测量的尺度:分类尺度、顺序尺度、间隔尺度、比率尺度 ? 总体与样本的概念,总体的确定

第二章 数据的搜集

? 概率抽样,简单随机抽样,分层抽样,整群抽样,系统抽样,抽样误差

第三章 数据的图表展示

? 条形图,直方图,两者之间的异同

第四章 数据的概括性度量

? 众数、中位数、平均数的概念及其应用范围、比较 ? 异众比率

? 均值与方差的计算,离散系数

第六章 统计量及其抽样分布

? 统计量的概念 ? 三个重要的抽样分布

? 样本均值、样本比例、样本均值之差、样本方差的抽样分布,中心极限定理,两个样本方差比的

抽样分布

第七章 参数估计

? 估计量的概念

? 点估计与区间估计,置信水平 ? 要求理解区间估计的原理 ? 估计量的评价标准

- 1 -

《统计学》 第五版

? 总体均值的区间估计问题

? 样本容量的确定,估计误差与样本容量、置信水平、总体方差等的关系

第八章 假设检验

? 原假设、备择假设,假设检验的步骤 ? 两类错误的概念 ? 假设检验的原理 ? P值决策

? 单侧检验的方向设定问题 ? 检验结论的解释

? 实际问题的检验(一个总体)

第十章 方差分析

? 方差分析的思想和原理 ? 误差分解 ? 自由度的确定

? 单因素方差分析,结果解释

第十一章 一元线性回归

? 相关关系(解决的问题、相关系数的特点) ? 回归分析(数据关系,结果解释,自由度确定问题) ? 判定系数,估计标准误差,

? 显著性检验(线性关系检验,回归系数显著性检验) ? 预测问题

第十二章 多元回归(公共事业管理专业)

与一元回归相同,注意差异

第十三 时间序列分析

时间序列含有的成分与分解,平滑方法的应用 增长率分析(增长率、平均增长速度,注意基本概念)

第十四章 指数

重点掌握加权综合指数(拉氏指数和帕氏指数)、加权平均指数的计算

- 2 -

《统计学》 第五版

一、 试述概率抽样的含义及其特点

概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。 特点:

① 抽样时是按一定的概率以随机原则抽取样本; ② 每个单位被抽中的概率是已知的或可以计算出来的;

③ 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。

二、 简述方差分析中的基本假定

① 每个总体都应服从正态分布; ② 各个总体的方差σ2必须相同; ③ 观测值是独立的。

三、 相关分析主要解决哪些方面的问题

相关分析就是对两个变量之间线性关系的描述与度量。它解决的问题有: ① 变量之间是否存在关系? ② 如果存在关系,那是什么关系? ③ 变量之间的关系强度如何?

④ 样本所反映的变量之间的关系能否代表总体变量之间的关系?

四、 简述直方图和条形图的区别

① 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方

图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义;

② 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列; ③ 条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

五、 回归分析主要解决哪些方面的问题

① 从一组样本数据出发,确定出变量之间的数学关系式;

② 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量

的影响是显著的,哪些是不显著的;

③ 利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这

种估计或预测的可靠程度。

六、 举例说明统计量的定义

对原始数据进行一定的运算,以算出某些代表性的数字,足以反映数据某些方面的特征,这种数据称为统计量。

设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量。

- 3 -

《统计学》 第五版

七、 简述线性相关系数的特点

① 相关系数r取值范围为[-1,1],即–1≤r≤+1,若0<r≤1,表示x与y之间存在正线性相关关

系;若-1≤r<0,表示x与y之间存在负线性相关关系;若r=1,表示x与y之间存在完全正线性相关关系;若r=-1,表示x与y之间存在完全负线性相关关系;若r=0,表示两变量之间不存在线性相关关系。 ② r具有对称性,即rxy=ryx;

③ r的数值大小与x和y的原点及尺度无关;

④ r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系;

⑤ r虽然是两个变量之间线性关系的一个度量,但不一定意味着x与y一定有因果关系。

八、 简述假设检验中P值的含义

如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。P值是假设检验中的另一个决策工具,对于给定的显著性水平α,若P<α,则拒绝原假设。

九、 简述众数、中位数和均值的特点及应用场合

① 众数是一组数据中出现次数最多的变量值,用M0表示。众数主要用于测度分类数据的集中趋势,

当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。

② 中位数是一组数据排序后处于中间位置上的变量值,用Me表示。中位数主要用于测度顺序数据

的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。

③ 均值是一组数据相加后除以数据的个数得到的结果。均值主要适用于数值型数据,但不适用于分

类数据和顺序数据。

十、 简述样本容量与置信水平、总体方差和估计误差的关系

① 样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大; ② 样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;

③ 样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量就越小。

十一、 简述假设检验的步骤

① 首先提出原假设和备择假设; ② 需要确定适当的检验统计量; ③ 进行统计决策。

十二、 简述中心极限定理的内容

从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值μ的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

- 4 -

《统计学》 第五版

模拟试题一

一. 单项选择题(每小题2分,共20分)

1. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们

选择在网上购物的主要原因是“价格便宜”。这里的参数是( )

A. 1000个消费者 B. 所有在网上购物的消费者

C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额

2. 为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,

这种抽样方法属于( )

A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样

3. 某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以

判断考试分数在70到90分之间的学生大约占( ) A. 95% B. 89% C. 68% D. 99%

4. 已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的数学

期望和抽样分布的标准误差分别为( )

A. 50,8 B. 50,1 C. 50,4 D. 8,8

5. 根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间

为75分~85分。全班学生的平均分数( )

A.肯定在这一区间内 B.有95%的可能性在这一区间内

C.有5%的可能性在这一区间内 D.要么在这一区间内,要么不在这一区间内

6. 一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机

抽取120个新车主中有57人为女性,在??0.05的显著性水平下,检验2005年新车主中女性

的比例是否有显著增加,建立的原假设和备择假设为( )

A.H0:??40%,H1:??40% B.H0:??40%,H1:??40% C.H0:??40%,H1:??40% D.H0:??40%,H1:??40%

7. 在回归分析中,因变量的预测区间估计是指( )

A. 对于自变量x的一个给定值x0,求出因变量y的平均值的区间 B. 对于自变量x的一个给定值x0,求出因变量y的个别值的区间 C. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间 D. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间

8. 在多元线性回归分析中,如果F检验表明线性关系显著,则意味着( )

A. B. C. D.

在多个自变量中至少有一个自变量与因变量之间的线性相关系著 所有的自变量与因变量之间的线性关系都显著

在多个自变量中至少有一个自变量与因变量之间的线性关系不显著 所有的自变量与因变量之间的线性关系都不显著

9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( )

- 5 -

《统计学》 第五版

A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型

10. 设p为商品价格,q销售量,则指数?p0q1p0q0?的实际意义是综合反映( )

A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度

C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度

二. 简要回答下列问题(每小题5分,共15分)

1. 简述直方图和茎叶图的区别。 2. 简述假设检验中P值的含义。 3. 解释指数平滑法。

三. (15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙

班考试成绩的分布如下:

考试成绩(分) 60以下 60—70 70—80 80—90 90—100 合计 (1) (2) (3)

学生人数(人) 2 7 9 7 5 30 画出乙班考试成绩的直方图。

计算乙班考试成绩的平均数及标准差。

比较甲乙两个班哪个班考试成绩的离散程度大?

四. (25分) 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的

一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:

每包重量(克) 96-98 98-100 100-102 102-104 104-106 合计 假定食品包重服从正态分布,要求: (1) (2) (3)

包数 2 3 34 7 4 50 确定该种食品平均重量95%的置信区间。

如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间。 采用假设检验方法检验该批食品的重量是否符合标准要求?(??0.05,写出检验的具体步骤)。

五. (25分)一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价

格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。利用Excel得到下面的回归结果(??0.05): 方差分析表 变差来源 df 回归 残差

SS MS 4008924.7 - 6 -

F — Significance F 8.88341E-13 — 《统计学》 第五版

总计 29 参数估计表 Intercept X Variable 1 X Variable 2 X Variable 3 13458586.7 Coefficients 7589.1025 -117.8861 80.6107 0.5012 — 标准误差 2445.0213 31.8974 14.7676 0.1259 — t Stat 3.1039 -3.6958 5.4586 3.9814 — P-value 0.00457 0.00103 0.00001 0.00049 (1) 将方差分析表中的所缺数值补齐。 (2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回

归系数的意义。 (3) 检验回归方程的线性关系是否显著?检验各回归系数的显著性。 (4) (5)

计算判定系数R2,并解释它的实际意义。 计算估计标准误差sy,并解释它的实际意义。

模拟试题一解答

一、单项选择题

1. A;2. D;3. C;4. B;5. D;6. C;7. B;8. A;9. D;10. B。

二、简要回答下列问题

1. (1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。

(2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

2. 如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值P值是假设检验中的另一个决策工具,对于给定的显著性水平?,若P??,则拒绝原假设。

3. 指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1期的预测值等于t期的实际观察值与第t期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法,其模型为Ft?1??Yt?(1??)Ft。

三、(1)乙班考试成绩的直方图如下:

- 7 -

《统计学》 第五版

1086420人数60以下90-10060-7070-8080-90考试成绩乙班考试成绩分布的直方图k

(2)x??Mi?1ifi?n55?2?65?7?75?9?85?7?95?52310??77分

3030s???

?(Mi?1ki?x)2fin?1(55?77)2?2?(65?77)2?7?(75?77)2?9?(85?77)2?7?(95?77)2?530?14080?11.86分29 (3)甲班考试分数的离散系数为:v甲?s12??0.1395。 x86s11.86乙班考试分数的离散系数为:v乙???0.1540。

x77由于v甲?v乙,所以甲班考试成绩的离散程度小于乙班。

四、(1)已知:n?50,z0.052?1.96。

样本均值为:x??Mi?1kifi?nk5066?101.32克, 50?x)2fi?样本标准差为:s??(Mi?1in?1130.88?1.634克。 49由于是大样本,所以食品平均重量95%的置信区间为:

- 8 -

《统计学》 第五版

x?z?2sn?101.32?1.96?1.63450?101.32?0.453

即(100.867,101.773)。

(2)提出假设:H0:??100,H1:??100 计算检验的统计量:z?x??0sn?101.32?1001.63450?5.712

由于z?5.712?z0.052?1.96,所以拒绝原假设,该批食品的重量不符合标准要求。

五、(1)

方差分析表 变差来源 df 回归 残差 总计 3 26 29 SS 12026774.1 1431812.6 13458586.7 MS 4008924.7 55069.7 — F 72.80 — — Significance F 8.88341E-13 — — ??7589.1025?117.8861x1?80.6107x2?0.5012x3。 (2)多元线性回归方程为:y???117 ?.886表示:在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,11??80.6107表示:在销售价格和广告费用不变的情况下,销售量平均下降117.8861个单位;?2??0.5012表示:在年销售价年人均收入每增加一个单位,销售量平均增加80.6107个单位;?3格和人均收入不变的情况下,广告费用每增加一个单位,销售量平均增加0.5012个单位。

(3)由于Significance F=8.88341E-13

(4)R2?SSR12026774.1??89.36%,表明在销售量的总变差中,被估计的多元线性SST13458586.7回归方程所解释的比例为89.36%,说明回归方程的拟合程度较高。

(5)se?SSE?MSE?55069.7?234.67。表明用销售价格、年人均收入和广

n?k?1告费用来预测销售量时,平均的预测误差为234.67。

- 9 -

《统计学》 第五版

模拟试题二

一. 单项选择题(每小题2分,共20分) 1. 根据所使用的计量尺度不同,统计数据可以分为( A )

A. 分类数据、顺序数据和数值型数据 B. 观测数据和试验数据

C. 截面数据和时间序列数据 D. 数值型数据和试验数据

2.

饼图的主要用途是( A )

A. 反映一个样本或总体的结构 B. 比较多个总体的构成 C. 反映一组数据的分布 D. 比较多个样本的相似性

如果一组数据是对称分布的,则在平均数加减2个标准差之内的数据大约有( C ) A. 68% B. 90% C. 95% D. 99%

从均值为200、标准差为50的总体中,抽出n?100的简单随机样本,用样本均值x估计总体均值?,则x的数学期望和标准差分别为( A )

A. 200,5 B. 200,20 C. 200,0.5 D. 200,25 95%的置信水平是指( C )

A.总体参数落在一个特定的样本所构造的区间内的概率为95% B.总体参数落在一个特定的样本所构造的区间内的概率为5%

C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5% 在假设检验中,如果所计算出的P值越小,说明检验的结果( A ) A.越显著 B.越不显著 C.越真实 D.越不真实

在下面的假定中,哪一个不属于方差分析中的假定( D ) A.每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0

在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是( C ) A. 一个样本观测值之间误差的大小 B. 全部观测值误差的大小

C. 各个样本均值之间误差的大小 D. 各个样本方差之间误差的大小 在多元线性回归分析中,t检验是用来检验( B ) A. 总体线性关系的显著性 B. 各回归系数的显著性 C. 样本线性关系的显著性 D. H0:?1??2????k?0

3. 4.

5.

6.

7.

8.

9.

10.

A.

下面的哪种方法不适合对平稳序列的预测( D )

简单平均法 B. 移动平均法 C. 指数平滑法 D. 线性模型法

二. 简要回答下列问题(每小题5分,共20分)

1. 简述直方图和条形图的区别。 2. 简述中心极限定理。

3. 回归分析主要解决以下几个方面的问题? 4. 解释拉氏价格指数和帕氏价格指数。

- 10 -

本文来源:https://www.bwwdw.com/article/65b6.html

Top