2019年长沙理工大学数学与计算科学学院432统计学考研仿真模拟五套题

更新时间:2023-04-30 22:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

考研专业课资料、辅导、答疑一站式服务平台

第 1 页,共 38 页

目录

2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题(一) . 2 2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题(二) . 9 2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题(三)15 2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题(四)23 2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题(五)32

考研专业课资料、辅导、答疑一站式服务平台

第 2 页,共 38 页 2019年长沙理工大学数学与计算科学学院432统计学[专业硕士]考研仿真模拟五套题

(一)

特别说明:

1-本资料为2019考研初试学员使用,严格按照该科目历年常考题型及难度仿真模拟;

2-资料仅供考研复习参考,与目标学校及研究生院官方无关,如有侵权、请联系我们立即处理。 ————————————————————————————————————————

一、简答题

1. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

2. 什么是置信区间估计和预测区间估计?二者有何区别?

【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;预测区间估计,它是对x 的一个给定值求出y 的一个个别值的估计区间,这一区间称为预测区间。

(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个

这两个区间的宽度也是不一样的,预测

区间要比置信区间宽一些。

3. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤:

考研专业课资料、辅导、答疑一站式服务平台

第 3 页,共 38 页

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立)

(其中是行变量,是列变量)

选取统计量:

(其中,

为列联表中第i 行第j 列类别的实际频数;为列联表中第i 行第j 列类别的期望频数;并且

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

4. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

5. “假设检验的基本思路是:概率性质的反证法,主要依据的是:小概率事件原理”。你同意这种说法吗?简要叙述你对假设检验的理解和检验步骤。

【答案】同意。

假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。例如,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件次品的概率就为此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中任意抽取1件,恰好是次品,我们就可以断定,该次品率应该不是很小的,否则我们就不会那么轻易的就能抽到次品。从而,我们就有足够的理由否认产品的次品率是很低的假设。

假设检验的基本步骤为:第一,对所考察总体的分布形式或总体的某些未知参数做出某些假

考研专业课资料、辅导、答疑一站式服务平台

第 4 页,共 38 页 设,称之为原假设。第二,根据检验对象构造合适的检验统计量,并通过数理统计分析确定在原假设成立的条件下该检验统计量的抽样分布。第三,在给定的显著性水平下,根据抽样分布得出原假设成立时的临界值,由临界值构造拒绝域和接受域。第四,由所抽取的样本资料计算样本统计量的取值,并将其与临界值进行比较,从而对所提出的原假设做出接受还是拒绝的统计判断。

假设检验就是利用样本中所蕴含的信息对事先假设的总体情况做出推断。假设检验不是毫无根据的,而是在一定的统计概率下支持这种判断。

6. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0,存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用

检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法或仍用法,但使用方差-协方差矩阵的稳健估计值。

二、计算题

7. 一学生接连参加同一课程的两次考试。第一次及格的概率为P ,若第一次及格则第二次及格的概率也为p ;若第一次不及格则第二次及格的概率为

若至少有一次及格则他能取得某种资格,求他取得该资格的概率。

【答案】设事件A 为第一次及格,事件B 为第二次及格,事件C

为至少有一次及格。则有

则至少有一次及格的概率:

考研专业课资料、辅导、答疑一站式服务平台

第 5 页,共 38 页

即他取得该资格的概率为

8. 假定某高校学生的日常消费服从正态分布,抽取了 100名同学的月消费总额构成了一随机样本,现:

(1)若已知总体标准差为160元、样本均值为605元

,求总体均值在95%的置信水平下的置信区间;

2)若总体标准差为未知,

样本标准差s 为170元,求总体标准差在95%的置信水平下的置信区间。

【答案】

(1)根据题意可知,

总体服从正态分布,且方差已知,

样本均值也服从正态分布。

可得总体均值在95%的置信水平下

的置信区间为

(2)根据样本方差的抽样分布可知,样本方差服从自由度为(n_l )的分布,即

已知

分布表可得

所以,总体标准差的置信区间为:

9. 设随机样本

来自正态总体

为方差,正态分布.

密度函数为

(1)求未知参数的极大似然估计量; (2)是的相合估计量(g 卩:

时,依概率收敛到)吗?请说明理由;

考研专业课资料、辅导、答疑一站式服务平台

第 6 页,共 38 页 (3)从无偏性与均方误差两个方面对的3个估计量

【答案】(1)似然函数:

对数似然函数:

似然方程:

求解似然方程: 即参数的极大似然估计量为:

(2)即说明

具体过程略。

进行评价。

注1:估计量

的均方误差定义

注2:自由度为的分布的期望与方差分别为与 (3)从无偏性考虑:

可见,是的无偏估计量,与是的有偏估计量。

10.投一枚硬币,直到出现正面为止,记下在第k 次投掷时首次出现正面的频数

如表1所示,

问是否相信该硬币是均匀对称的。

1

【答案】设首次出现正面需投掷硬币的次数为X ,若硬币是均匀的,则第k 次投掷时首次出现正面的概率为 依据题意我们可以对其分布建立假设,即

该硬币是均匀对称的,即出现正面的概率和出现反面的概率相等

本文来源:https://www.bwwdw.com/article/a99e.html

Top