2017年华东交通大学经济管理学院432统计学之统计学原理考研冲刺密押题

更新时间：2023-05-01 04:26:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

华东交通大学经济管理学院官网推荐度：
相关推荐

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押题（一） (2)

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押题（二） (11)

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押题（三） (20)

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押题（四） (29)

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押题（五） (38)

第1 页，共45 页

第 2 页，共 45 页 2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研冲刺密押

题（一）

注意：①本试题所有答案应写在答题纸上，不必抄题，写清题号，写在试卷上不得分；

②答卷需用黑色笔（钢笔，签字笔，圆珠笔）书写，用铅笔、红色笔等其他颜色笔答题，试题作废；

③答卷上不得做任何与答题无关的特殊符号或者标记，否则按零分处理；

④考试结束后试题随答题纸一起装入试题袋中交回。

————————————————————————————————————————

一、简答题

1．简述系数、c 系数、系数的各自特点。

【答案】（1）相关系数是描述

列联表数据相关程度最常用的一种相关系数。它的计算公式为：式中，《为列联表中的总频数，也即样本量。说系数适合

列联表，是因为对于

列联表中的数据，计算出的系数可以控制在这个范围。

（2）列联相关系数又称列联系数，简称c 系数，主要用于大于

列联表的情况。C 系数的计算公式为：

当列联表中的两个变量相互独立时，系数c=0,但它不可能大于1。c 系数的特点是，其可能的最大值依赖于列联表的行数和列数，且随着R 和C 的增大而增大。

（3）克莱默提出了 V 系数。V 系数的计算公式为：

当两个变量相互独立时，当两个变量完全相关时，所以V 的取值在之间。如果列联表中有一维为2，即

则V 值就等于值。

2．简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差，其中最常用的是

方差和标准差。（1）极差是指一组数据的最大值与最小值之差。用R 表示，其计算公式为：

极差是描述数据离散程度的最简单测度值，计算简单，易于理答，但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息，不能反映出中间数据的分散状况，因而不能准确描述出数据的分散程度。

（2）平均差也称平均绝对离差，它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心，反映了每个数据与平均数的平均差异程度，它能全面准确地反映一组数据的离散状

第 3 页，共 45 页况。平均差越大，说明数据的离散程度越大；反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题，平均差在计算时对离差取了绝对值，以离差的绝对值来表示总离差，这就给计算带来了不便，因而在实际中应用较少。但平均差的实际意义比较清楚，容易理答。

（3）方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号，然后再进行平均，方差开方后即得到标准差，方差或标准差能较好地反映出数据的离散程度，是实际中应用最广泛的离散程度测度值。与方差不同的是，标准差是具有量纲的，它与变量值的计量单位相同，其实际意义要比方差清楚。因此，在对实际问题进行分析时更多地使用标准差。

3．多元线性回归模型中有哪些基本的假定？

【答案】多元回归模型的基本假定有：

（1）自变量

是非随机的、固定的，且相互之间互不相关（无多重共线性）；（2）误差项是一个期望值为0的随机变量，即（3）对于自变

量

的所有

值的方

差都相同，且不序列相关，

即

（4）误差项是一个服从正态分布的随机变量，且相互独立，即

4．解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量（标志）的取值所形成的分布。假设X 为总体随机变量，那么总体分布就是指X 的分布。很显然，同一变量不同的总体或同一总体不同的变量，其分布是不同的。

样本分布就是样本中所有个体关于某个变量（标志）的取值所形成的分布。假设x 为总体随机变量X 在样本中的体现，那么样本分布就是指x 的分布，或者说是关于《个观测值的分布。同样，同一变量不同的样本或同一样本不同的变量，其分布是不同的。

一般意义上说，抽样分布就是样本统计量的概率分布，它由样本统计量的所有可能取值和与之对应的概率组成。如果说样本分布是关于样本观测值的分布，那么抽样分布则是关于样本统计量的分布，而样本统计量是由样本观测值计算而来的。具体地说，抽样分布就是从容量为W 的总体中抽取容量为n 的样本时，所有可能的样本统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本，那么把所有m 个样本统计值形成频率分布，就是抽样分布。可以说，抽样分布是研宄样本分布与总体分布之间的桥梁。

5．概述相关分析与回归分析的联系与区别。

【答案】（1）相关分析和回归分析的联系

它们具有共同的研宄对象，都是对变量间相关关系的分析，二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度，只有当变量间存在相当程度的相关关系时，进行回归分析

第 4 页，共 45 页去寻求变量间相关的具体数学形式才有实际的意义。同时，在进行相关分析时，如果要具体确定变量间相关的具体数学形式，又要依赖于回归分析，而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。

（2）相关分析和回归分析的区别

①从研究目的上看，相关分析是用一定的数量指标（相关系数）度量变量间相互联系的方向和程度；回归分析却是要寻求变量间联系的具体数学形式，是要根据自变量的固定值去估计和预测因变量的平均值。

②从对变量的处理看，相关分析对称地对待相互联系的变量，不考虑二者的因果关系，也就是不区分自变量和因变量，相关的变量不一定具有因果关系，均视为随机变量；回归分析是在变量因果关系分析的基础上研宄其中的自变量的变动对因变量的具体影响，必须明确划分自变量和因变量，所以回归分析中对变量的处理是不对称的，在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量，只有因变量是具有一定概率分布的随机变量。

6．简述假设检验的过程。

【答案】假设检验的过程如下：

（1）根据所研宄问题的要求提出原假设（或称为零假设、无效假设）和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

（2）选择合适的检验方法，确定适当的检验统计量，确定统计量的分布，并由假设计算其数值。

（3）根据统计量确定值，做出统计推断。根据计算的统计量，查阅相应的统计表，确定值，以值与显著性水平比较，若则拒绝接受

若则不拒绝

7．解释总平方和、回归平方和、残差平方和的含义，并说明它们之间的关系。

【答案】（1）总平方和（S^T ）是实际观测值与其均值的离差平方和，即

（2）回归平方和（^狀）是各回归值

与实际观测值的均值y 的离差平方和，即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分，它是可以由回归直线来解释的变差部分。

（3）残差平方和（SSE ）是各实际观测值与回归值的离差平方和，即

它是除了的线性影响之外的其他因素对变差的作用，是不能由回归直线来解释的变差部分。其又称为误差平方和。