应用统计学复习题 2

更新时间:2024-04-27 19:42:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

应用统计学复习题

一、在德国的汽车拥有者中,有一辆Porsche的概率是0.07,有一辆Mercedes的概率是0.29。 1、有一辆Porsche或者一辆Mercedes的概率是多少?

2、有一辆Porsche以及一辆Mercedes的概率是多少?(假定有两辆车是独立事件) 3、这两种车一辆也没有的概率是多少?

二、对于如下数据,计算样本容量、中位数、样本均值、众数、样本方差:

0,2,2,2,5,10 ,14

三、随机抽检了14袋产品的重量(单位:千克):

195,210,210,193,195,198,212,182,190,210,204,206,200,201 给出这种产品袋装含量的区间估计。

四、设两个分类变量X、Y的观察值如下,对变量X、Y作卡方分析。

Y y1 y2 X

x1 2 5 x2 4 6

参考答案

一、1、0.36, 2、0.0203, 3、0.66;

二、样本容量7,中位数2,样本均值5,众数2,样本方差26.33;

三、区间估计:(195.31, 205.55);

四、p值为0.63,不能拒绝零假设,因此认为两个变量没有显著的统计关系;

第一章习题

第一节 统计学的基本概念与主要思想 (16) 单选题

下列学科那个是是研究如何收集、分析与处理数据,并且由此作出决策的一门学科?

A. 逻辑学 B. 数学 C. 统计学 D. 社会学

2.一家小食品加工厂,为了了解一种新产品是否受欢迎,以问卷形式做了市场调查,请问这种以问卷形式做市场调查的方法属于统计学中的那类:

A.收集数据 B. 分析数据 C. 计算数据 D. 由数据作出决策 3. 一家小食品加工厂,为了了解一种新产品是否受欢迎,以问卷形式做了市场调查,该家厂将收集来的数据,整理成表格形式,如下:

表1.1

对新产品的喜欢程度

总计

125

100

喜欢 不喜欢

女性 102 23

性别 男性 15 85

请问这种将数据以表格形式表示出来属于统计学中的那类:

A.收集数据 B. 分析数据 C.计算数据 D. 由数据作出决策 4. 一家小食品加工厂,为了了解一种新产品是否受欢迎,以问卷形式做了市场调查,该家厂由调查来的数据进行推断:这种新产品更受女性消费者的欢迎。请问这种推断属于统计学中的那类:

A.收集数据 B. 分析数据 C.计算数据 D. 由数据作出决策 5.

抛掷一个硬币,有时会正面向上,有时会反面向上,这说明了抛

掷硬币这个事件具有某种:

A.随机性 B. 不可预见性 C.确定性 D. 规律性

6. 当抛掷一个硬币100次时,差不多会得到50次正面向上,50次反面

向上,这说明抛掷硬币这个事件具有某种:

A.随机性 B. 不可预见性 C.确定性 D. 规律性

7.从概率的角度来看,你认为下列生活中的哪一种现象具有合理的成分?

A. 某同学认为某门课程太难,考试不可能及格,因此放弃了努力学习;

B. 某人总是用一个固定的号码去买彩票,她坚信总有一天这个号码会中奖;

C. 某人总是抢先第一个抽签,认为这样抽到好签的可能性最大; D. 某足球教练认为比赛时他的衣服颜色与比赛的结果有关,所以总穿着同一件“幸运服”去指挥比赛。 多选题

1.下列生活、社会活动中,能用到统计的有那些:

A.民意调查 B. 科学研究 C. 质量控制 D.体育比赛 E. 新药的使用

2.对“概率”这一词的理解主要有那两种:

A.某一系统的一个内在特性 B. 频数的极限 C. 对某一陈述相信程度的度量 D. 0~1间的一个数 E. 不确定性

3. 某灯泡厂生产了100箱灯泡,在进行产品检验时,下列那些事件是随机事件:

A.某一个特定的箱中是否含有废品 B. 随机取10箱,其中有两箱含有废品 C. 这100箱中,含有2件废品的箱数 D. 任取一箱,其中含有废品 判断题:

1. 抛一个质量均匀的硬币,当抛掷的次数不断增加时,正面向上的比例在1/2附近波动,并且越来越接近1/2,这说明随机事件能够表现出某种规律性。

2. 抛一个质量均匀的硬币100次,其中52次正面朝上,再抛100次,其中46次正面朝上,这说明随即事件的规律性中也表现出某种随机性。 3. 只要用正确的统计方法由某个样本数据得到的关于总体的结论一定都是正确的。

4. 统计可以看做是一项研究随机性中的规律性的科学。

5. 抛一个质量均匀的硬币,其正面向上的概率为1/2,因此在抛这个硬币100次时,不可能出现没有正面向上的情况。

6.在无放回抽样下,从容量为N的总体中抽取容量为n的样本,则所有可能的样本个数为N个。

n参考答案

第一节 统计学的基本概念与主要思想 (16) 单选题

1. C 2. A.3. B. 4. D. 5. A. 6. D. 7. B. 多选题

1. AB CDE 2. AC3. B D

判断题:1. 对2. 对3. 错4. 对5. 错6.错

参考答案

一、1、0.36, 2、0.0203, 3、0.66;

二、样本容量7,中位数2,样本均值5,众数2,样本方差26.33;

三、区间估计:(195.31, 205.55);

四、p值为0.63,不能拒绝零假设,因此认为两个变量没有显著的统计关系;

第二章 习题

第一节 观测数据 (33)

单选题

1. 某大学为了了解教师作科研的情况,以问卷形式作调查,其中一项问题为:“论文的发表数量为多少?”为了不发生岐义,请为论文数量这个变量选个合理的定义: A.论文发表总数 B. 近五年发表的论文总数

C. 近五年在国内外核心期刊上发表的论文总数

D. 近五年在国内外核心期刊上发表的论文总数,其中重复发表的不计 2. 要了解20家工业企业职工的工资情况,则总体是:

A、20家工业企业 B、20家工业企业职工的工资总额 C、20家工业企业每个职工的工资 D、每一个工业企业的职工

3. 某大型城市,市有关部门想了解近两年来的人均年收入情况,考虑要节省时间、资金等因素,你认为作那种调查更合适一些:

A.普查 B.抽样调查 C.选取某一单位的职工进行调查 D. 选取某小区居民进行调查

4. 抽样调查的目的在于:

A、了解总体的基本情况 B、用样本对总体信息进行推断 C、对样本进行全面调查 D、了解样本的基本情况

5. 把总体随机划分成一些小群体,对抽到的小群体进行普查,这种抽样方法是: A.简单随机抽样 B.系统抽样 C.分层抽样 D. 整群抽样

6. 某公司在甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点。公司为了调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,其中在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,则完成这两项调查宜采用的抽样方法依次为: A.分层抽样法,系统抽样法 C.系统抽样法,分层抽样法 7. 简单随机样本的含义是什么

A.总体中的每个个体以相等的概率进入样本中 B. 总体中的每个个体以确定的概率进入样本中 C. 总体中的每个个体以随机的概率进入样本中 D. 容易调查的个体形成的样本

8. 医学研究者做研究时,经常取自己病人的信息进行研究,这种现象在统计中称为:

A.随机样本 B.方便样本 C. 简单样本 D. 简单随机样本

9. 某音像商为了调查他的公司音像制品受欢迎的情况,他请了一些访问员在音像商店门口随机的采访了一些来买东西的人,请问该调查的结果适合推广到什么总体中:

A.经常买该音像公司产品的消费者 B. 以邮购形式购买音像制品的消费者 C. 经常去音像制品商店买东西的消费者

B.分层抽样法,简单随机抽样法 D.简单随机抽样法,分层抽样法

D. 经常买音像制品的消费者

10. 在电话调查中,当响应率比较低时,对于无人接电话的情况如何处理比较合理: A.再接着拨打这个号码,直到有响应 B. 随机的选取其他号码代替无人接听的号码 C. 用得到的数据进行研究,不考虑没人接听的情况 D. 用得到的数据去估计没人接听的情况 11. 在抽样调查中,下列那个误差是必然存在的:

A.未响应误差 B. 响应误差 C. 计算误差 D. 抽样误差 12. 未响应误差是指:

A、 由于样本的随机性而产生的误差 B、 在调查中违反随机性原则出现的系统误差 C、由于样本中有部分人未回答而造成的误差

D、由于样本中部分人没有按他们的真实想法回答而造成的误差 13. 抽样误差是指:

A、由于样本的随机性而产生的误差

B、在调查过程中由于观察、测量等出现差错而引起的误差 C、在调查中违反随机性原则出现的系统误差 D、人为原因所造成的误差 14. 抽样调查中,抽样误差是:

A.可以避免但不可控制的 B.可以避免且可控的 C.不可避免且不可控制的 D.不可避免但可以控制的 多选题

1. 抽样调查是:

A、是一种非全面调查 B、按照随机原则选取调查对象 C、永远存在抽样误差 D、目的在于对样本进行全面调查 E、是一种全面调查 2. 抽样调查法可应用在:

A、税务局对所有纳税企业有无偷税漏税情况的检查 B、对电视机使用寿命的检查

C、对产品的质量进行控制

D、对有破坏性产品的质量检验 3. 某大学为了了解现在学生的心里健康状况,决定从在校的2万多名学生中随机选取1200人进行调查,你认为下列那些方案是可行的:

A.随机选取大二年级的1200名学生

B. 将所有学生的学号写在纸条上,在放入一个箱子里搅匀,然后随机抽取1200名

C. 下课时,随机调查从教学大楼里走出的1200名学生

D. 将所有学生按1、2、3、?顺序编号,然后通过随机数表产生1200个随机数并取对应的学生做为调查对象

E. 周六到学生寝室随机调查1200名学生 4. 下列那些例子容易产生方便样本 A.网络调查

B. 某商场组织的有奖调查 C. 某杂志需邮寄的问卷调查

D. 医生对主动去医院检查的人的资料进行的分析 5. 除简单随机抽样外,其它常用的抽样方式有那些: A.多阶抽样B.系统抽样 C.分层抽样 D. 整群抽样 6. 抽样调查中,样本的容量通常由那些因素决定: A、总体标准差的大小 B、允许的抽样误差的大小 C、总体均值的大小 D、调查经费的多少 E、需要调查的问题的多少 7. 在抽样调查中,抽样误差是:

A、是不可避免要产生的 B、是可以通过改进调查方法来消除的 C、是可以事先计算出来的 D、只能在调查结束之后才能计算出来 E、其大小是可以控制的

8. 在抽样调查中,下列那些调查形式的未响应误差往往会比较高: A.某杂志的邮寄调查

B. 随机的调查某小区在花园内散步的居民 C. 敏感问题的调查

D. 随机调查某写字楼内正在赶时间上班的人群 E. 某商场举行的有奖调查

9. 在进行问卷调查时,应注意问题有那些: A.问题的措辞 B. 问题的位置 C. 访员的选择 D. 隐私的保护 E. 问题的备选答案 判断题

1.正确进行数据收集的第一步必须包括给出所需的变量一个明确的定义。

2. 某大学为了了解学生的英语掌握情况,就调查了外语学院大二年纪两个班的学生,这些学生英语四级通过率为75%,因此得出结论:该校学生英语能力为良好,这个结论是合理的。

3. 在问卷调查中,需要较长时间回答,较花精力的问题应放在问卷的最后。 4. 在问卷调查中,有关政治倾向的问题(如:你是党员吗?)排在前面会对于后面的问题产生政治影响。

5. 在问卷调查中,给出问题的备选答案有助于对该问题的答案进行分析。 6. 一般的,在一次抽样中,由样本得到的估计值与总体真值之间是有差别的。 7.对于同一总体的两次不同抽样,由于包含的样本不完全相同,一般的,所得到的结论也就会有差别。

8. 抽样误差是指抽样得到的估计值与总体的未知参数之差。 9. 抽样误差与样本容量有关,样本容量越小抽样误差也越小。

10. 某减肥药生产厂研发了一种新药,想了解一下市场的需求情况,因此派了某些受过专业训练,且身材比较肥胖的访员调查了一些胖人的减肥情况,考虑到访员可能会对调查结果产生影响,因此这样安排是合理的。

第二节 实验数据 (10)

单选题

1. 在实验中控制实验对象而收集得到的数据称为:

A. 观测数据 B. 实验数据 C. 分组数据 D. 频数

2. 某生物科技研究所,想了解磷肥的实施是否影响玉米的产量,下面做法可行的是:

A. 收集某个种植区实施磷肥的量与玉米的产量进行研究 B. 收集某几个种植区实施磷肥的量与玉米的产量进行研究

C. 选取若干块土地种植玉米,并都实施磷肥,然后收集实施磷肥的量与玉米产量进行分析

D. 选取若干块土地种植玉米,随机的选取其中部分土地实施磷肥,并保证其他的种植条件都一样,然后收集实施磷肥的量与玉米产量进行分析 3. 在实验中,实验组与对照组选取的原则是: A. 随机分配 B. 使得实验尽量简单 C. 根据自愿 D. 指定分配 多选题

1. 实验数据与观测数据有那些区别:

A.观测数据是观测现实世界时收集得到的数据

B. 观测数据是为了从收集得到的样本中得出有关总体的一些结论 C. 观察数据用来对提出的问题研究各种导致它的可能性

D. 实验数据是在实验中通过控制一个或多个变量而得到的测量结果 E. 实验数据用来发现造成结果的原因,即鉴别因果关系

2. 在进行实验分析时,需要选取对照组,对于对照组下列说法正确的是: A. 没有对照组也可以一样的进行实验

B. 没有对照组,对于实验结果就没有办法确定是由实验中感兴趣的变量或者其他变量还是它们的联合变量引起的 C. 选取对照组的原则是随机分配

D. 在对照组中,通过控制实验中不感兴趣的变量,使之与实验组中一样,因此可以消除不感兴趣的变量对实验结果的影响 3. 以人为对象的实验中,经常会遇到如下问题: A.人们未必服从研究者的安排

B. 人们都有自己的计划和兴趣,未必会服从研究者的研究兴趣

C. 人们可能对安排在他们身上的研究非常敏感,因此使得他们注意自我,从而对他们的行为产生了很多约束

D. 某些实验可能因为道德问题而无法进行 4. 在实验分析中统计有何作用: A.确定样本容量(即数据规模) B. 在实验开始前详细设计与分析 C. 确定研究费用

D. 研究与发明新的统计分析方法 判断题

1. 对照组是指实验对象中的一个被随机选择的子集,其中的个体与其他实验对象的所受实验待遇不一样。

2. 在研究某种新药的效果时,常会遇到这种道德困境,如果新药的疗效很好,那么对照组的人就没有得到及时有效的治疗;如果新药有意想不到的负作用,那么实验组的人将遇到未知的危险。

3. 在研究照明度对生产灯泡的工人生产率的影响时,无论增加减少照明度,产量都会增加,后来称这种现象为Hawthorne效应。

参考答案

第一节 观测数据 (33)

单选题

1. D. 2. C、 3. B. 4. B、 5. D. 6. B. 7. A 8. B. 9. C. 10. D. 11. C、 12. A、 13. D. 多选题 1. A、B、C 2. B、C、D 3. B. D. 4.A. B. C. D. 5.A. B. C. D. 6. B. D. 7.ACE 8. ACD 10. ABCDE 判断题 1.对 2. 错 3. 错 4. 对 5. 错 6. 对 7. 对 8. 错 9. 错

10.对

第二节 实验数据 (10)

单选题

1.B 2.D 3.A 多选题

1.ABCDE 2. BCD 3.ABCD 4.ABD 判断题 1. 错 2. 对 3. 对

第三章 习题

第一节 分类变量的图表示 (14)

单选题

1.某种变量的各个取值没有大小、顺序的区别,不能做数学运算,这种变量是: A.观测变量 B. 分类变量 C. 顺序变量 D. 数值变量 2. 对于分类变量,下列那种图形适合显示各组数据的相对大小: A.盒形图 B. 直方图 C.条形图 D.饼图

3. 某俱乐部有男会员201人,女会员320人。现在该俱乐部想做广告吸引其他人入会,因此将现有会员数据制成图表,并希望从图中大致读出男女会员的数目,下列那个图形适合:

A.盒形图 B. 直方图 C.条形图 D.饼图 4. 饼图中与扇形面积成正比的量是:

A.分类变量每一类的观测数 B. 分类变量的类别数 C. 总的观测数 D.无法确定 5. 条形图中代表分类变量每一类观测数的是:

A.矩形的高度 B. 矩形的宽度 C. 矩形的高度或宽度 D. 矩形的面积 多选题

1. 对数据的分析中通常包括: A.用图来表示数据 B. 用表来表示数据 C. 将数据进行排序

D. 从数据中计算一些统计量,将数据简化 1.

分类变量常用的图形表示法有:

A.直方图 B.条形图 C.散点图 D. 饼图 E. 茎叶图 2.

饼图中与分类变量每一类的观测数或百分比成正比的量有:

A.扇形半径 B.扇形面积 C. 扇形圆心角 D. 扇形弧长 E.扇形弦长 3.

下列关于饼图说法正确的是:

A.当分类变量的类别较少时,适合用饼图表示 B. 不同的样本容量应该用不同大小的饼图表示 C. 饼图中,分类变量每一类的观测数经常无法显示出来

D. 有1000个观测值的样本与有20个观测值的样本可以用同样大小的饼图表示 4.

正确的是:

如图为某种新药与旧药的药效对比检验情况,关于这两个图下面说法

某种新药药效对比检验情况3025201510506262218治愈无效果新药旧药

(图3.1)

某种新药药效对比检验情况454035302520151050618无效果治愈2226新药

旧药

(图3.2)

A.图3.1中矩形的高度表示观测数 B. 图3.2中矩形的宽度表示观测数

C. 图3.1适合观测服用这两种药后各种治疗效果的人数 D. 图3.2适合观测分别服这两种药的总人数 5.

关于条形图下面说法正确的是:

A.条形图中的矩形有相同的宽度时,其高度代表观测数或百分比 B. 条形图中的矩形有相同的高度时,其宽度代表观测数或百分比 C. 宽度相等的条形图的矩形通常是连续排列 D. 宽度相等的条形图的矩形通常是分开排列 E. 高度相等的条形图的矩形通常是连续排列 判断题

1.用图来表示数据的主要目的是:使研究者从图形中方便快速的提取出数据的一些信息,并可以通过图将这种信息传递给他人。

2. 当分类变量的类别比较多时,适合用饼图来表示数据。

3. 构造条形图时,如果矩形又高又细,则容易使得视觉上各类别观测数的差异变小。

第二节 数值变量的图表示 (36)

单选题

1. 下列那种图形不是用来表示数值变量的: A.点线图 B. 盒形图 C.直方图 D.饼图 2. 能将数据简化,并不会丢失任何信息的图是: A.点线图 B. 盒形图 C.直方图 D.饼图 3. 盒形图是由一组数据的几个统计量绘制而成的? A、5 B、4 C、3 D、2

4. 盒形图中,盒子中包含了多少观测值?

A.整个样本 B.样本的1/2 C. 样本的1/4 D. 样本的3/4

5. 沈阳市政府想调查一下沈阳市城区人民的年收入情况,因此随机调查了沈阳市内五区共1225人的年收入情况,现在想分区将这些数据表示出来,大致比较一下每个区的人均年收入与年收入的分散情况,下列那个图形较为合适: A.点线图 B. 直方图 C. 茎叶图 D. 盒形图

6. 当样本量不大,并想快速收集整理信息时,此时适合用的图形是:

A.饼图 B. 直方图 C. 茎叶图 D. 盒形图 7. 直方图中代表观测数目的是矩形的: A.高度 B. 宽度 C. 面积 D. 无法确定 8. 下列说法不正确的是:

A.作直方图时,如何划分自变量的区间不是唯一确定的 B. 直方图没有丢失样本信息

C. 作直方图时自变量区间分得较少,有可能会掩盖了数据是双峰的信息 D. 作直方图时矩形的高低形状不同,能够造成视觉上的差异 9. 在直方图的每一个分类内,观测值被认为是服从: A、对称分布 B、正态分布 C、均匀分布 D、指数分布 多选题

1. 数值(连续)变量通常用的图形表示法有:

A.直方图 B.茎叶图 C.点线图 D.盒形图 E. 条形图 2. 关于点线图下列说法正确的是: A.适合样本量不大时 B. 适合样本量较大的情况

C. 能直观看出样本中那些地方观测值比较密集,那些地方观测值稀少 D. 简化了数据,但同时也丢失了一些信息 3. 作盒形图时用到的有关样本统计量是:

A、最大值 B、中位数 C、四分位数 D、最小值 E、众数 4. 关于盒形图下列说法正确的是: A.从图中能够看出一共有多少个数据 B. 样本容量较大时可以用盒形图表示 C. 从图中可以看出样本中的最大最小值 D. 简化了数据,但同时也丢失了一些信息 5. 下列那些图形,不会丢失原始的数据信息: A.盒形图 B. 点线图 C. 直方图 D. 茎叶图

6. 作直方图时,在将自变量的取值划分为若干个区间时,这些区间可以是: A.相同的长度 B. 不同的长度 C. 封闭的区间

D. 含有最小值或最大值的区间可以不是封闭的

7. 关于直方图,以下说法正确的是: A、直方图的矩形高度表示频数或百分比 B、直方图的矩形面积表示频数或百分比 C、直方图的矩形宽度是固定的 D、直方图的矩形通常是连续排列 8. 用来表示两个数值变量的图有:

A.散点图 B.点线图 C. 时间序列图 D. 盒形图 9. 下面适合用时间序列图表示的数据有:

A、全国历年大学毕业生人数 B、某学院历年职工工资总额 C、某银行每天存款余额 D、某厂历年年末在册职工人数 10.

散点图与时间序列图的区别有:

A.散点图的点可能较为分散

B. 时间序列图在横轴上时间的取值通常是均分的 C. 散点图中的一个点可能表示了几对相同的数据 D. 时间序列图中的一个点只对应原数据中的一对数据 判断题

1. 对于数值变量,当样本容量较大时,不适合用点线图表示。 2. 盒形图中,盒子中间有一条线,这条线代表的是样本的均值。 3. 一组样本只能作一个盒形图。

4. 当样本容量较大时,适合用茎叶图表示。 5. 当样本容量较大时,适合用直方图表示。 6. 一组样本只能作一个直方图。

7. 作直方图时首先要将自变量的取值划分为若干个区间。 8. 在作直方图时,将自变量的区间划分的越多越细越好。 9. 盒形图与直方图能将数据简化,但也丢失了样本信息。 10. 直方图的矩形高度和条形图的条形高度均表示各组的频数。

11. 作直方图时,若将矩形画得又高又细,则会在视觉上增加各区间中观测数的差异。

12. 散点图能够简化数据,但不能够保留原始数据的信息。 13. 时间序列图是特殊散点图,以时间作为横轴的变量。 14. 时间序列图能够反映出一个变量随着时间而变化的趋势。 15. 散点图能够保留原始数据的信息,但时间序列图不能。

16. 作时间序列图可能因为纵轴的起始点取值的不同,使得图形的增减趋势有差

异,造成视觉误差。

17. 优秀统计图的标准是,在最短的时间里,用最少的笔墨,使用最小的空间,给读者最多的信息。

参考答案

第一节 分类变量的图表示 (14)

单选题

1.B 2.D 3.C 4.A 5.C 多选题

1.ABD 2.BD 3.BCD 4.ACD 5.ACD 6.ABDE 判断题

1. 对2. 错3. 错

第二节 数值变量的图表示 (36)

单选题

1.D 2.A 3.A 4.B 5.D 6.C 7.C 8.B 9.C 多选题

1.ABCD 2.AC 3.ABCD 4.BCD 5.BD 6.ABCD 7.BD 8.AC 9.ABCD 10.ABCD 判断题

18. 对 错 对 错 对 错 对 错 对 错 对 错 对 对 错 对 对

第四章 习题

第一节 数据的平均 (31) 单选题

1. 得到一组样本以后,经常要计算表示样本数据平均趋势和离散趋势的统计量,

这些统计量的主要优点是: A.计算量较小 B. 使得数据高度简化 C. 没有丢失原始数据的信息 D. 无法确定

2. 在一组数据中,出现次数最多的数称为:

A、参数 B、频数 C、众数 D、组数 3. 数据1,3,3,3,4,4,5,5,5,7的众数是: A.3 B. 4 C. 5 D. 3和5

4. 甲乙两个俱乐部都分别有100名会员,其中甲俱乐部有女会员51人,男会员49人,而乙俱乐部有女会员99人,男会员1人,则甲乙俱乐部会员性别变量的众数为:

A.甲:女,乙:女 B. 甲:女,乙:男

C. 甲:男和女,乙:女 D. 甲:无法确定,乙:女

5. 如图4.1是对37位妇女的结婚年龄的调查而得到的直方图,由图可以得出这些妇女结婚年龄的众数为:

A.27.5 B.25 C. 30 D. 20

图4.1

6. 把一个变量的一组观察数据从小到大排序,排在中间位置的那个数的数值称为这个变量的:

A.众数 B. 中位数 C. 均值 D. 频数 7. 数据0,1,1,3,4,5,5,5,6的中位数是: A、3 B、3.5 C、4 D、5

8. 数据161,161,162,163,163,164,165,165,165,166的中位数是: A、163 B、163.5 C、164 D、162

9. 如图4.1是对37位妇女的结婚年龄的调查而得到的直方图,由图可以得出这些妇女结婚年龄的中位数为:

A.20 B. 25 C. 28.5 D. 30

10. 将直方图分为面积相等的两部分的竖直线代表的是样本的: A.组数 B. 众数 C. 均值 D. 中位数

11. 数据集:1,2,100和数据集:1,2,3的中位数分别为: A.51,2 B. 51,2.5 C. 2,2 D. 无法确定,2 12. 为了解我市初三女生的体能状况,从某校 初三的甲、乙两班中各抽取27名女生进行一

分钟跳绳次数测试,测试数据统计结果如表4.1, 如果每分钟跳绳次数?105次的成绩即为优秀,

那么甲、乙两班的优秀率的关系是: 表4.1 A. 甲<乙 B. 甲>乙 C. 甲=乙 D. 无法比较 13. 下四分位数在数据中所处的位置是:

A、50% B、40% C、80% D、25% 14. 观察值的总和除以观察值的个数得到的是: A.均值 B. 众数 C. 中位数 D. 组数

15. 若观察数据中有一个值改变,则一定也会相应改变的是: A.组数 B. 众数 C. 中位数 D. 均值

16. 当一组数据中有一个特别大的数值时,适宜用哪一种平均来代表这组数据的集中趋势:

A.众数 B. 中位数 C. 均值 D. 频数

17. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一

人数(人) 20 15 10 5 0 0.5 1.0 1.5 2.0 时间(小时)

天各自课外阅读所用时间的数据,结果用条形图表示,如图4.2所示。 根据条形图可得这50名学生在该天平均每人的课外阅读时间为:

A.0.6小时 B.0.9小时 C.1.0小时 D.1.5小时

图4.2

18. 某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足: A、均值=中位数=众数 B、众数>中位数>均值 C、中位数>均值>众数 D、均值>中位数>众数

多选题

1.下列属于集中趋势的度量值的是:

A、众数 B、中位数 C、均值 D、标准差 2. 下面关于众数说法正确的是:

A.众数只能表明这个值比其它的值出现的次数多,但不能说明它较别的数值多的程度

B. 众数可以代替均值使用

C. 众数可以从图表中容易获得

D. 众数一般不单独使用,因为它只能传递数据集的很小一部分信息 3. 下面关于中位数说法正确的是:

A.在直方图中,中位数不需要计算就可以获得 B. 中位数主要用于描述非对称分布,即偏斜分布的数据 C. 中位数的优点是对于极端值不敏感 D. 在茎叶图中,中位数容易获得 4. 下面关于均值说法正确的是:

A.均值不能从图表中直接获得,需要计算 B. 均值对于极端值比较敏感

C. 均值的优点是对于变量的每一个观测值都加以利用,保留原数据的信息较众数、中位数多

D. 均值只能用于表示数值变量数据集的中心

判断题

1. 得到一组样本以后,经常要计算表示样本数据平均趋势和离散趋势的统计量,

这些统计量的主要缺点是:丢失了样本的某些信息。 2. 众数只能用来描述分类变量,不能描述其他变量。

3. 对于数值变量,选择不同的直方图的区间长度,可以获得不同的众数,因此,众数依赖于直方图的画法。

4. 对于二众数分布,均值能比两个众数提供更多的信息。 5. 不管样本容量是奇数还是偶数,中位数的求法是一样的。 6. 中位数就是第五十个百分位数。

7. 决定一个数据集是用中位数还是均值,最好两种都算出来,如果它们的值很接近就使用均值。

8. 决定一个数据集是用中位数还是均值,最好两种都算出来,如果中位数与均值有很大不同,就使用中位数。

9. 根据数据的直方图可以算出均值的精确值。

第二节 数据的变差 (29) 单选题

1.下列函数中,离散程度最大的是:

A. B. C. D.

2. 样本数据中最大值与最小值的差称为: A.方差 B. 标准差 C. 误差 D. 极差 3. 标准差反映了数据到( )一种平均距离

A.众数 B .中位数 C. 均值 D. 频数 4. 以下四个数据集中,那个数据集的标准差最大? A.6,6,6,6,6,6,6 B. 5,5,6,6,6,7,7 C. 3,3,4,6,8,9,9 D. 3,3,3,6,9,9,9 5. 方差是标准差的:

A.平方 B. 平方根 C. 算术平方根 D. 以上皆不是 6. 对于大多数单峰对称分布,几乎所有的观测值会落在 A.均值加减一个标准差内 B. 均值加减两个标准差内 C. 均值加减一个方差内 D. 均值加减两个方差内 7. 下列反映变异的指标中,最易受极端值影响的是:

A.标准差 B.方差 C.极差 D.四分位数极差

8. 为了判断甲、乙两个小组学生英语口语测验成绩哪一组比较整齐,通常需要知道两组成绩的:

A. 平均数 B. 方差 C. 众数 D. 中位数

9. 在统计中,样本的方差可以近似地反映出总体的:

A. 平均状态 B. 最大值和最小值 C. 分布规律 D. 波动大小 10. 我市少年军校准备从甲、乙、丙三位同学中选拔一人参加全市射击比赛,他们在选拔赛中,射靶十次的平均环数是x甲?x乙?x丙?8.3,方差是s甲?1.5,

2s乙?2.8,s丙?3.2,那么根据以上提供的信息,你认为应该推荐那位同学参加全

22市射击比赛?

A.甲 B. 乙 C. 丙 D. 无法确定

11. 已知一个样本:1,3,5,x,2,它的平均数为3,则这个样本的方差是: A.3 B. 2.5 C. 2 D. 1.58

1s2?[(x1?20)2?(x2?20)2?912. 在方差计算公式中

和20分别表示:

?(x10?20)2],数字9

A. 数据的个数减一和方差 B.平均数和数据的个数 C. 数据的个数减一和平均数 D.数据组的方差和平均数

13. 若一组数据a1,a2,?,an的方差是5,则一组新数据2a1,2a2,?,2an的方差是:

A. 5 B. 10 C. 20 D. 50 14. 很多不同样本的均值的标准差称为:

A.标准差 B. 标准误差 C. 标准方差 D. 误差 15. 一组观测值的标准得分是指:

A.(观测值-均值)/方差 B. (均值-观测值)/方差 C. (均值-观测值)/标准误差 D. (观测值-均值)/标准差

16. 使用下面那个统计量,能够使得一个变量的任何值都可以和任何其它变量的值相比较?

A.标准得分 B. 标准误差 C. 均值 D. 方差

多选题

1.数据离散程度的度量值有:

A、极差 B、标准差 C、方差 D、众数 2. 盒形图中可以表示出观测值的:

A、方差 B、标准差 C、极差 D、四分位极差 3. 四分位极差是指:

A.数据排序后中间一半数据的极差

B. 最小的25%与最大的25%的数据去掉后,剩下数据的极差 C. 下四分位数-上四分为数 D. 上四分位数-下四分为数

4. 调查了37对新婚夫妇,有一对新人的年龄是:新郎21岁、新娘19岁。 还知道这37对新人中,新郎们的平均年龄是30岁,标准差11岁 ;新娘们的平均年龄25岁,标准差10岁。那么关于该对新人下面说法正确的是: A.该新娘与女性的均值的距离比该新郎与男性的均值更远 B. 该新郎与男性的均值的距离比该新娘与女性的均值更远 C. 该新娘的结婚年龄比他的新郎更反常规 D. 该新郎的结婚年龄比他的新娘更反常规

5. 甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟输入汉字的个数统计结果如表4.2所示,(其中每分钟输入汉字≥150个成绩即为优秀)

表4.2

班级 参赛人数 甲 乙 55 55 149 151 191 110 中位数 方差 平均字数 135 135 某同学分析上表后得出如下结论,其中正确的是 A.甲、乙两班学生成绩的平均水平相同 B. 乙班优秀的人数多于甲班优秀的人数 C. 甲班成绩的波动比乙班大

D. 如果甲班的A同学与乙班的B同学的输入字数都为160,则A同学的标准得分比B同学的小 判断题

1.标准差指的是数据到中位数的一种平均距离。

2. 标准差的计算方法是,先计算观测值与均值的差,然后将这些数字平方后求和,最后再取平均值。

3. 对于大多数单峰对称分布,标准差大约等于极差的四分之一。 4. 观测值的标准差比均值的标准误差小。 5. 根据一个样本的数据可以估计标准误差。

6. 样本越多,一个样本均值与另一个样本均值的变差就越小,这使得标准误差也较小。

7. 如果两个变量的均值相同,但标准差不同时,其中一个变量的值是可以和另一个变量的值相互比较的。

8. 一个数据的标准得分越偏离零点,则说明这个数据越异常,大多数正常数据的标准得分都落在区间-2.00~2.00之间,绝大多数在 -3.00~3.00 之间。

参考答案

第一节 数据的平均 (31) 单选题

1.B 2.C 3.D 4.A 5. A 6.B 7.C 8.B 9.C 10.D 11.C 12A. 13.D 14.A 15.D 16.B 17.B 18 D

多选题

1. A、B、C、 2.ACD 3.BCD 4.ABC

判断题 10. 对

11. 错 12. 对 13. 错 14. 错 15. 对 16. 对 17. 对 18. 错

第二节 数据的变差 (29) 单选题

1.A 2.D 3.C 4.D 5.A 6.B 7.C 8.B 9.D 10.A 11.B 15.D 16.A

多选题

1. ABC 2.CD 3.ABD 4.BD 5.ABCD 判断题

1. 错2. 错3. 对4. 错 5. 对6. 对7. 错8. 对

13.C 14.B 12.C

本文来源:https://www.bwwdw.com/article/r5cg.html

Top