统计学测试卷及答案

更新时间:2024-06-09 15:32:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、单项选择题

1.下面各族有两个变量,前一个是连续变量,后一个是离散的一组( D ) A计划 程度和设备的能力 B 工人数和工时利用率

C 工人的技术等级数和劳动生产率 D 劳动生产率和工人的技术等级数

2、假设职工用于上下班路途的时间服从正态分布,凭抽样调查得知,这一时间为1.2小时。调查人员根据调查经验,认为这一时间没有多大变化,为证实这一看法,所采取假设检验方法有( A )

A双侧检验 B 单侧检验 C 左侧检验 D 右侧检验

3.在估计某一总均值时,随机抽取n各单元做样本,用样本均值作估计量,在构造置信区间时,发现置信区间太宽,其中原因是( A )

A.样本容量太小 B.估计量缺乏有效性 C.选择的估计量有偏 D.抽取样本时破坏了随机性 4.根据某地区关于工人工资的样本资料估计出的该地区的工人平均工资的95%的置信区间为(700,1500),下列说法最准确( C )

A 该地区平均工资有95%的可能性落入该置信区间 B该地区平均工资只有95%的可能性落入该置信区间 C 该置信区间有95%的概率包含该地区的平均工资 D 该置信区间的误差不会超过5%

5.某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例还要高,随机抽取100人中发现有30人营养不良,被检验该说法是不正确,取显著性水平a =0.05,则 ( A ) A 假设形式为H0:π ≤ 0.2, H1:π > 0.2 可能犯第一类错误 B 假设形式为H0:π ≤ 0.2, H1:π > 0.2 可能犯第二类错误 C 假设形式为H0:π ≥0.2, H1:π <0.2 可能犯第一类错误 D 假设形式为H0:π ≥0.2, H1:π <0.2 可能犯第二类错误

6. 一个由n=50的随机样本,算得样本均值x=32 ,总体标准差为6 。总体均值?的95%的置信区间为( A )

A 32?1.66 B 32?2.66 C 32?3.66 D 32?4.66

7. 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该计划的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅,则其原假设和备择假设是( B )

A H0:??8 ,H1:?>8 B H0:?≥8 , H1:?<8

C H0:?≤7 , H1:?>7 D H0:?≥7 , H1:?<7 8.在进行区间估计时( B )

A、置信概率越小,相应的置信区间长度越大 B、置信概率越小,相应的置信区间长度越小 C、置信概率越大,相应的置信区间长度越小 D、置信概率的大小不影响置信区间的长度

9. 某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则( C )

A 体重越重,运动员平均能举起的重量越多 B 平均来说,运动员能举起其体重60%的重量

C 如果运动员体重增加10公斤,则可多举6公斤的重量 D 举重能力的60%归因于其体重

10、一元回归方程中,y+12.84—0.14x,则下列说法中正确( C ) A 自变量平均增长一个单位,因变量减少0.14个单位 B 自变量和因变量之间成正相关关系

C y+0.14x = 12.84 D y-0.14x = 12.84

11、对于样本均值为估计量,对总体均值进行区间估计,且总体方差已知 ( A) A 95%的置信区间比90%置信区间宽 B 样本容量较小的置信区间较大

C相同置信区间下, 样本容量大的置信区间较小 D 样本均越值小,区间越大 12.下面属于连续变量的是( C )

A、职工人数 B、机器台数 C、工业总产值 D、车间数

13.现有两个指标,一个是全国人均粮食产量,另一个是全国农民人均粮食产量,则( D )

A、两个都是平均指标 B、两个都是强度相对指标

C、第一个是平均指标,第二个是强度相对指标 D、第一个是强度相对指标,第二个是平均指标

14.加权算术平均数的大小( C)

A、只受各组标志值大小的影响,而与各组次数的多少无关 B、只受各组次数多少的影响,而与各组标志值的大小无关 C、既受各组次数多少的影响,也受各组标志值的大小的影响 D、与各组标志值大小及各组次数的多少无关 15.下列时间数列属于时期数列的是( B )

A、高校在校学生人数时间数列 B、出生人口数时间数列 C、耕地面积时间数列 D、工业劳动生产率时间数列

16. 为了解女性对某种品牌的化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。这种调查方式是( C )

A 简单随机抽样 B 分层抽样 C 方便抽样 D 自愿抽样

17. 某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现有些居民户有虚报或瞒报情况。这种调查产生的误差属于( A )

A 有意识误差 B 抽样框误差 C 回答误差 D 无回答误差 18.不同总体间的标准差不能进行简单对比,这是因为(B ) A、总体单位数不一致 B、平均数不一致 C、离散程度不一致 D、离差平方和不一致 19.如果生活费用指数上涨20%,则现在1元钱( A ) A、只值原来的0.83元 B、只值原来的0.17元 C、与原来的1元钱等值 D、只值原来的0.78元

2

20.在方差分析中,用于度量自变量与因变量之间关系强度的统计量是R,其计算方法是( B ) A R=

2B

组间平方和组内平方和 B R=

2

组间平方和总平方和

C R2=

组间方差组内方差 D R2=

组内平方和总平方和

二、名词解释

1.简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。 2.方差分析:就是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响

3.单因素方差分析:方差分析中只涉及一个分类型自变量

区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到

4.离散系数:一组数据的标准差与其相应的平均数之比,也称变异系数

5.最小二乘法:也称最小平方法,它是通过因变量的观察值Yi与估计值^Yi,之6.间的离差平方和达到最小估计β。和β1的方法

7.条件概率:当某一时间B已经发生时,求事件A的概率,称这种概率为事件B发生条件下事件A发生的条件概率

8.中心极限定理 :设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布

9.集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势测度就是寻找数据水平的代表值或中心值,低层数据的集中趋势测度值适用于高层次的测量数据,能够揭示总体中众多个观察值所围绕与集中的中心,反之,高层次数据的集中趋势测度值并不适用于低层次的测量数据。

10.系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规范的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样

三、简答

1. 简述分类数据、顺序数据和数值型数据的区别。

答:分类数据:1只能归于某一类的非数字型数据,2对事物进行分类的结果,数据表示为类别,用文字表示。

顺序数据:只能归于某一类有序的非数字型数据

数值型数据:按照数字尺度测量的观察值,其结果表现为具体的数值。

2. 众数、中位数与平均数的特点和应用场合。

答:众数是一组数据分布的峰值,是一种位置代表值,不受极端值的影响。其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合于作为分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值,它也是位置代表值,其特点是不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个较好的选择,中位数主要适合于顺序数据的集中趋势测度值。 平均数是就数值型数据计算的,是实际中应用最广泛的集中趋势测度值。平均数容易受数据极端值的影响,对于偏态分布的数据,平均数多的代表性较差。平均数主要适合于作为数值型数据的集中趋势测度值。

3. 编制频数分布表的具体步骤。

答: 第一步:确定组数。一组数据分多少组一般与数据本身 的特点及数据的多少有关。一般情况下,一组数据所分的组数不应该少于五组且不应该多于十五组,即5≤k≤15。

第二步确定各组的组距。组距是一个组的上限与下限的差。组距=(最大值—最小值)/组数。

第三步:根据分组整理成频数分布表。

4. 条形图和直方图的区别和联系。

答:区别:首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或者频率,宽度则表示各组的组距,因此高度宽度均有意义。其次,由于分组数据的连续性,直方图的各个矩形通常是连续排列的,而条形图则是分开排列的。最后,条形图主要用于展示分类数据,而直方图则主要是用于展示数值型数据。 联系:高度表视频数

5. 简述经验法则和切比雪夫不等式。 答:经验法则

当一组数据对称分布时,经验法则表明:

约有68%的数据在平均数加减一个标准差的范围内。 约有95%的数据在平均数加减两个标准差的范围内 约有99%的数据在平均数加减单个标准差的范围内

切比雪夫不等式

如果一组数据不是对称分布,经验法则就不再适用,这是可以用切比雪夫不等式,它对任何分布形状的数据都适用。切比雪夫不等式提供的是“下界”,也就是“所占比列至少是多少”,对于任意形态分布的数据,根据切比雪夫不等式,至少有(1—1/k2)的数据落在k个标准差之内。其中k是大于1的任意值,但不一定是整数。对于k=2,3,4,该不等式的含义是 至少有75%的数据落在平均数加减2个标准差的范围内。 至少有89%的数据落在平均数加减3个标准差的范围内。 至少有94%的数据落在平均数加减4个标准差的范围内。

6.评价估计量的主要标准有哪些?请对每一个标准作出说明。 答:1无偏性

无偏性是指估计量抽样分布的数学期望等于被估计总体参数。 2有效性

一个无偏的估计量并不是意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。

有效性是指对同一总体参数的两个无偏的估计量,有更小标准的估计量更有效。在无偏估计下,估计量的方差越小,估计也就越有效。

3一致性

一致性是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更加接近总数的参数。

7.价设检验的理论基础和推理方法是什么? 答:1:假设的表达式

统计的语言是用一个等式或者不等式表达问题的原假设。

H。表示原假设,μ是我们要检验的参数,μ。表示感兴趣的数值,原假设一般的表达式为: H。:μ=μ。 或者H。:μ—μ。=0

尽管原假设陈述的是两个总体的均值相等,却并不表示它是既定的事实,仅仅是假设而已。如果原假设不成立就要拒绝原假设,而需要在另一个假设中做出选择。这个假设称为备择假

设。

H1表示备择假设:备择假设一般的表达式为: H1:μ≠μ。 或者H1:μ-μ。≠0 2:两类错误

一类错误是原假设H。为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或者弃真错误。

另一个错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称为β错误或者取伪错误。 3假设检验的流程 ①提出原假设和备择假设

②需要确定适当的检验统计量,并计算其数值。

在进行假设检验时利用的是小概率原理,小概率原理是指发生的概率很小随机事件在一次试验中几乎不可能发生的。根据这一原理可以作出是否拒绝原假设的决定。著名的英国统计学家费希尔把小概率的标准定为0.05,虽然费希尔没有对为什么选择0.05给出充分的解释,但是人们还是沿用了这个标准,吧0.05或者比0.05更小的概率看成为小概率。 ④进行统计决策。

8.假设检验和区间估计的区别和联系是什么?

答:联系:区间估计和假设检验是统计推断的两个组成部分,两者都是利用样本对未知参数进行统计推断。

区别:区间估计是在一定的概率条件下,利用样本信息推断总体参数的可能区间范围;而假设检验则是先对总体参数提出假设,然后用样本信息判断这一假设是否成立 9. 说明计算?2统计量的步骤。

答:步骤一:用观察值f。减去期望值fe

步骤二:将(f。—fe)之差平方。 步骤三:将(f。—fe)2的结果除以fe 步骤四:将步骤三的结果加以总结。

10.单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

答:实质:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。 分析步骤: 1提出假设

H。自变量对因变量没有显著影响,H1自变量对因变量有显著影响 2构造检验的统计量

(1)计算各个样本的均值 (2)计算全部观测值的总均值 (3)计算各个误差平方和 (4)计算统计量

本文来源:https://www.bwwdw.com/article/p7o6.html

Top