统计排版后统计学习题集

更新时间:2024-04-26 20:51:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 导论

一、单选题

1.指出下面的数据哪一个属于定类数据 ( )

A 年龄:10岁,20岁,21岁?? B 工资:1500 ,1800元,3600元??

C 汽车产量;35万辆,80万辆,150万辆 D 购买商品时的支付方式:现金.信用卡,支票?? 2.指出下面的数据哪一个属于定序数据 ( )

A.年龄:18岁,20岁,21岁 B 工资:1 500元,1 800元,3 600元

C 汽车产量: 35万辆.80万辆,150万辆 D 员工对企业某项改革措施的态度:赞成.中立,反对 3,某研究部门准备在全市200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的总体是 ( )

A.2 000个家庭 B.200万个家庭 C.2 000个家庭的人均收入 D.200万个家庭的人均收入 4.某研究部门准备在全市200万个家庭抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的样本是 ( )

A.2 000个家庭 B.200万个家庭 C.2 000个家庭的人均收入 D,200万个家庭的人均收入 5某研究部门准备在全市200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的参数是 ( )

A.2000个家庭 B 200万个家庭 C.2000个家庭的人均收人 D,200万个家庭的人均收入

6 某研究部门准备在全市 200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入.这项研究的统计量是 ( )

A.2 000个家庭 B. 200万个家庭 C.2 000个家庭的人均收入 D.200万个家庭的人均收入 7.一家研究机构从IT从业者中随机抽取500人什为样本进行调查,其中60%回答他们的月收入为5 000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的“消费支付方式”是 ( )

A 分类变量 B 顺序变量 C.数值型变量 D 离散变量 8 一家研究机构IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在3 000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的“月收入”是 ( )

A 分类变量 B 顺序变量 C 数值型变量 D 离散变量 9.指出下面的数据哪一个属于顺序变量 ( )

A.收人 B. 汽车产量C.员工对企业某项改革措施的态度(赞成、中立、反对) D.企业类型 10.一项调查表明,在所抽取的1 000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜:”。这里的“消费者在网上购物的花费金额”是 ( )

A.分类变量 B.顺序变量 C 数值型变量 D. 离散变量

1l一项调查表明,在所抽取的1 000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在同上购物的主要原因是“价格便宜”。这里的“消费者在网上购物的原因”是 ( )

A. 分类变量 B.顺序变量 C.数值型变量 D.离散变量

12.一名统计学专业的学生为了完成其统汁作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于 ( )

A分类数据 R.顺序数据C截面数据 D.时间序列数据 13下列不属于描述统计问题的是 ( )

A.根据样本信息对总体进行的推断 B.了解数据分布的特征

C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 14.在下列叙述中.采用推断统计的方法是 ( ) A.用饼图描述某企业职工的学历构成

B.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重

1

C.一个城市在11月份的平均汽油价格 D.反映大学牛统计学成绩的条形图 15.根据样本计算的用于推断总体特征的概括性度量值称作 ( ) A.参数 B.总体 C.样本 D.统计量

16为了估计某城市中拥有汽车的家庭比例,抽取500个家庭的一个样本,得到拥有 汽车的家庭比例为35%,这里的35%是 ( )

A.参数值 B.统计量的值 C.样本容量 D.变量 17.最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。这结论属于( )

A.对样本的描述 B.对样本的推断 C.对总体的描述 D对总体的推断

18,为了估计全国高中学生的平均身高,从20个城市选取100所中学进行调查.在该项研究中,样本是 ( )

A.100所中学 B.20个城市 C.全国的高中学生 D.100所中学的高中学生

19为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者感兴趣的参数是( )

A.100所中学 B.20个城市c,全国的高中学生的平均身高 D.100所中学的高中学生的平均身高

20.为估引全国高中学生的平均身高,从20个城市选取100所中学进行调查.在该项研究中,研究者使用的统计量是 ( )

A.100所中学 B.20个城市 c. 全国的高中学生的平均身高 D.100所中学的高中学生的平均身高

21.只能归于某一有序类别的非数字型数据称为 ( )

A. 分类数据 B.顺序数据 c. 数值型数据 D. 数值型变量 22.按数通过调查或观测而收集到的数据称为 ( )

A.观测数据 B.试验数据 C.时间序列数据 D.截面数据 23在相同或近似相同的时间点上收集的数据称为 ( )

A.观测数据 B.试验数据 C.时间序列数据 D.截面数据 24,在不同时间上收集到的数据称为 ( )

A.观测数据 B.试验数据C.时间序列数据 D.截面数据

二、多选题

1.统计的基本方法包括( )。

A.大量观察法 B.综合分析法 C.统计分组法 D.归纳推断法 E.指标体系法 2.统计总体的基本特征表现在( )。

A.客观性 B.数量性 C大量性 D.同质性 E.差异性 3.要了解某地区全部成年人口的就业情况,那么( )。

A.全部成年人是研究的总体 B成年人口总数是统计指标 C.成年人口就业率是统计标志 D.“职业”是每个人的特征,“职业”是数量指标E.某人职业是“教师”,这里的“教师”是标志表现 4.国家统计系统的功能或统计的职能是( )。

A.信息职能 B.咨询职能 C监督职能D.决策职能 E.协调职能 5.下列统计指标中,属于质量指标的有( )。

A.工资总额 B.单位产品成本 C出勤人数 D.人口密度 E.合格品率 6.我国统计调查的方法有( )。

A.,统计报表 B.普查 C抽样调查 D.重点调查 E.典型调查 7.在工业设备普查中( )。

A.工业企业是调查对象B.工业企业的全部设备是调查对象C.每台设备是填报单位 D.每台设备是调查单位 E.每个工业企业是填报单位

2

8.对某市工业生产进行调查,得到以下资料,其中的统计指标是( )。

A.某企业为亏损企业 B.实际产值为1.1亿元C职工人数为10万人 D.某企业资金利税率为30% E.机器台数为750台

9.设某地区五家全民所有制企业的工业总产值分别为25万元、22万元、40万元、33万元和65万元,则( )。

A. “全民所有制”是企业的品质标志B. “工业总产值”是企业的数量标志 C “工业总产值”是个变量D “工业总产值”是企业的统计指标 E. 25、22、40、33、65这几个数字是变量值 10.某商场800名职工的每个人的工资资料中( )。

A.职工资总额是统计指标 B.800名职工是总体单位C有800个标志值 D.职工工资是统计标志 E.该商场工资总额等于800人乘以其平均工资

11.在全国人口普查当中( )。

A.每个人是总体单位 B.男性是品质标志 C年龄是数量标志 D.人口平均寿命是数量标志 E.全国人口数是数量总体

第二章 数据的收集

一、单选题

1.为估计某城市愿意乘坐公车上下班的人数的比例,在收集数据时,最有可能采用的数据搜集方法是 ( )

A.普查 B.公开发表的资料C.随机抽样 D.实验

2.某机构十分关心小学生每周看电视的时间。该机构随机抽样300名小学生家长对他

们的孩子每周看电视肿时间进行估计。结果表明.这些小学生每周看电视的乎均时间为15小时,标准差为5。该机构搜集数据的方式是 ( )

A.抽样调查 B.观察调查 C.实验调查 D.公开发表的资料 3.如果一个样本因人故意操纵而出现偏差,这种误差属于 ( ) A.抽样误差 B.非抽样误差 C.设计误差 D.试验误差

4.为了解居民对小区物业服务的意见和看法,管理人员随机抽取50户居民,并上门通过问卷进行调查。这种数据的收集方法称为 ( )

A.面访式问卷调查 B. 实验调查C.观察式调查 D. 自填式问卷调查 5.指出下面的陈述中哪一个是错误的 ( )

A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中

C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差 6某居民小区为了解住户对物业服务的看法.准备采取抽样调查方式搜集数据。物业

管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走,同时有些是新人住的居民户。这种调查产生的误差属于 ( )

A.随机误差 B.抽样框误差c.回答误差 D.无回答误差

7,某居民小区为了解住户对物业服务的看法.准备采取抽样调查方式搜集数据,物业管理部门利用居民户登记名单进行抽样。但现在的小区中,原有的一些居民户已经搬走而没有回答问题。这种凋查产生的误差属于 ( )

A.随机误差 B.抽样框误差C.回答误差 D.无回答误差 8.指出下面的陈述哪—个是错误的 ( )

3

A.抽样误差是可以避免的B.非抽样误差是可以避免的c.抽样误差是不可避免的 D.抽样误差是可以控制的

9.对于较隐秘的问题,要收集有关的研究数据,较为适合的数据收集方法是 ( ) A.电话调查 B.邮寄问卷调查 c.座谈会 D.个别深度访问

10.为调查一定时间内某路段的汽车流量,适合的数据收集方法是 ( ) A.问卷调查法 B.观察法c.试验法 D.座谈会

二、多选题

1.人口普查属于( )。

A.全面调查 B.非全面调查 C一次性调查D.经常性调查 E.专项调查 2.在工业设备普查中( )。

A.工业企业是调查对象B.工业企业的全部设备是调查对象

C.每台设备是填报单位 D.每台设备是调查单位E.每个工业企业是填报单位 3.对灯管的寿命进行检验要求采取( )。

A.全面调查 B.非全面调查 C重点调查 D.典型调查 E.抽样调查 4.统计调查的组织形式有( )。

A.统计报表 B.重点调查 C专题调查D.专项调查 E.抽样调查 5.非全面统计调查的有( )。

A.统计报表 B.抽样调查 C全国经济普查D.典型调查 E.重点调查 6.下列属于统计调查收集统计资料的方法有( )。

A.大量观察法 B.统计描述法 C直接观察法D.报告法 E.采访法 7.代表性误差可能产生于( )。

A.普查中 B.重点调查中 C抽样调查中 D.典型调查中 E.全面统计报表中 8.调查表从形式上看可分为( )。

A.日报表 B.月报表 C一览表D.单一表 E.年报表 9.调查表从内容上看可分为( )。

A.表头 B.表体 C一览表D.单一表 E.月报表 10.第五次人口普查中( )。

A.每一个人是一个调查单位B.每一户是一个调查对象

C.填报单位是每户家庭D.每一个人是一个填报单位E.全国所有人口是调查对象

第三章数据整理与展示

一、单选题

1.数据筛选的主要目的是 ( )

A.发现数据的错误 B.对数据进行排序c.找出所需要的某类数据 D.纠正数据中的错误 2.落在某一特定类别或组中的数据个数称为 ( )

A.频数 B.频率 c.频数分布表 D.累积频数

3.把各个类别及落在其中的相应频数全部列出,井用表格形式表现出来,称为( ) A.频数 B. 频数分布 c. 频率 D. 累积频数

4.一个样本或总体中各个部分的数据与全部数据之比称为 ( ) A.频数 B.频率C.比例 D.比率

5. 样本或总体中各不同类别数值之间的比值称为 ( ) A.频数 B.频率 C.比例 D.比率

6.将比例乘以100得到的数值称为 ( ) A.频率 B.百分数 C.比例 D.比率

4

7.下面哪一个图形最适合于描述结构性问题 ( )

A.条形图 B. 饼图 C. 雷达图 D. 箱线图

8.将各有序类别或组的频数逐级累加起来得到的频数称为 ( ) A.频率 B.累积频数C.比例 D.比率

9.下面的哪一个图形适合于比较研究两个或多个总体或结构性问题 ( ) A.环形图 B.饼图c. 雷达图 D.箱线图

10.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的 分组方法称为 ( )

A.单变量值分组 B. 组距分组C.等距分组 D. 连续分组 11.组中值是 ( )

A.一个组的上限与下限之差 B.一个组的上限与下限之间的中点值 c —个组的最小值 D.一个组的最大值

12.下面的田形中最适合于描述一组数据分布的图形是 < ) A.条形图 B. 箱线图c直方图 D. 饼图

13.对于大批量的数据,最适合于描述其分布的图形是 ( ) A.条形图 B. 茎叶图C.直方图 D.饼图

14.由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形,称为 ( )

A.条形图 B.茎叶图 C.直方图 D.箱线图

15.对于时间序列数据,用于描述其变化趋势的图形通常是 ( ) A.条形图 B.直方田 C.箱线图 D.线图

16为了研究多个的不同变量在不同样本间的相似性,适合采用的图形是 ( ) A.环形图 B.茎叶图c.雷达图 D.箱线图

17,10家公司的月销售额数据(万元)分别为:72,63,54,54,29 26.25,23,3,20。下列哪种图形不宜用于描述这些数据 ( )

A.茎叶图 B.雷达图 C.条形图 D.饼图 18.与直方图相比,茎叶图 ( )

A.未保留原始数据的信息 B.保留了原始数据的信息 C.能有效展示数据的分布 D.更适合描述分类数据 19.下面的哪个图形不适合描述分类数据 ( ) A.条形图 B.饼图C.环形图 D茎叶图 20.下面的哪个图形适合描述顺序数据 ( )

A.直方图 B.茎叶图c累积频数分布图 B.雷达图 21.累积频数分布图适合于描述 ( )

A.分类数据 B.顺序数据 c.数值型数据 D.品质数据

22.将某企业职工的月收入依次分为2 000元以下、2 000元一3 000元 、3 000元一 4000元、4 000元一5 000元、5 000元以上几个组。第一组的组中值近似为 ( )

A,2 000 B.1 000 C.1 500 D.2 500

23.将某企业职工的月收入依次分为2 000元以下、2 000元~3 000元,3 000元一 4000元、4 000元~5 000元、5 000元以上几个组。最后一组的组中值近似为 ( )

A.5 000 B.7 500 C.5 500 D.6 500 24.直方图与条形图的区别之一是 ( )

A.育方图的各矩形通常是连续排列的,而条形图是分开排列的 B.条形图的各矩形通常是连续排列的,而直方图则是分开排列的

5

c.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据

D.直方图主要用于描述各类别数据的多少,条形图主要用于描述数据的分布

二、多选题

1.统计整理的必要性在于( )。

A.原始资料分散、零碎、不系统B.原始资料可能存在质量问题

C.原始资料难以描述总体的数量特征D.次级资料不能满足统计分析的需要 E.具有承上起下的作用

2.正确的统计分组应做到( )。

A.组间有差异 B.各组应等距 C.组内属同质D.组限不应重叠 E.不应出现开口组 3.统计分组的作用有( )。 .

A.反映总体的规模 B.说明总体单位的特征 C.区分社会经济现象的不同类型 D.研究总体的内部结构 E.分析现象间的依存关系 4.属于按品质标志分组的有( )。

A.职工按工龄分组 B.学生按健康状况分组

C企业按经济类型分组 D.企业按职工人数分组E.人口按居住地分组 5.统计表从构成形式上看,一般包括( )。

A.总标题 B.横行标题 C纵栏标题 D.数字资料 E.调查单位 6.指出下表表示的数列的属于什么类型( )。 按劳动生产率分组(件/人) 职工人数(人) 120---130 12 130———140 18 140--150 37 150———180 13 合 计 80

A.品质数列 B.变量数列 C组距数列 D.等距数列 E.异距数列

三、计算题

1、为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C 绘制一张条形图,反映评价等级的分布。

2、为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

6

700 706 708 668 706 694 688 701 693

716 715 729 710 692 690 689 671 697

728 712 694 693 691 736 683 718 664

719 722 681 697 747 689 685 707 681

685 691 695 674 699 696 702 683 721

709 708 685 658 682 651 741 717 720

691 690 706 698 698 673 698 733 677

684 692 661 666 700 749 713 712 679

705 707 735 696 710 708 676 683 695

718 701 665 698 722 727 702 692 691 688

713 699 725 726 704 729 703 696 717 (1)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (2)绘制茎叶图,并与直方图作比较。

3、下面是A、B两个班学生的数学考试成绩数据:

A班:

44 57 66 66 73 74 76 77 85 85 B班:

59 67 74 77 86

60 69 74 77 86

61 70 75 78 90

61 70 75 78 92

62 71 75 79 92

63 72 75 80 92

63 73 75 80 93

65 73 76 82 96

35 39 40 44 44 48 51 52 52 54 55 56 56 57 57 57 58 59 60 61 61 62 63 64 66 68 68 70 70 71 71 73 74 74 79 81 82 83 83 84 85 90 91 91 94 95 96 100 100 100 (1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。

4、1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。 月份 1 2 3 4 5 6 7 8 9 10 11 12 北京 49 41 47 50 55 57 69 74 68 47 66 56 长春 70 68 50 39 56 54 70 79 66 59 59 57 南京 76 71 77 72 68 73 82 82 71 75 82 82 郑州 57 57 68 67 63 57 74 71 67 53 77 65 武汉 77 75 81 75 71 74 81 73 71 72 78 82 广州 72 80 80 84 83 87 86 84 81 80 72 75 成都 79 83 81 79 75 82 84 78 75 78 78 82 昆明 65 65 58 61 58 72 84 74 77 76 71 71 兰州 51 41 49 46 41 43 58 57 55 45 53 52 西安 67 67 74 70 58 42 62 55 65 65 73 72 7

第四章 数据分布特征的测度

一、单选题:

1.一组数据中出现频数最多的变量值称为 ( )

A.众数 B.中位数C.四分位数 D.平均数 2.下列关于众数的叙述中,不正确的是 ( )

A.一组数据可能存在多个众数 B.众数主要适用于分类数据 c.一组数据的众数是唯一的 D.众数不受极端值的影响 3一组数据排序后处于中间位置上的变量值称为 ( ) A.众数 B.中位数C.四分位数 D.平均数

4.一组数据排序后处于25%和75%位置上的值称为 < ) A.众数 B.中位数 c.四分位数 D.平均数 5.n个变量值乘积的n次方根称为 ( )

A,众数 B.中位数 c.四分位数 D.几何平均数 6.非众数组的频数占总频数的比率称为 ( )

A.异众比率 B.离散系数c.平均差 D.标准差 7.四分位差是 ( )

A 上四分位敷减下四分位数的结果 B.下四分位数减上四分位数的结果 C. 下四分位数加上四分位数 D.下四分位数与上四分位数的中间值 8.各变量值与其平均数离差绝对值的平均数称为 ( ) A.极差 B.平均差C.标准差 D.四分位差 9.各变量值与其平均数离差平方的平均数称为 ( ) A.极差 B.平均差 C.方差 D.标准差

l0.变量值与其平均数的离差除以标准差后的值称为 ( ) A.标准分数 B.离散系数C.方差 D.标准差 11.如果一个数据的标准分数是一2,表明该数据 ( ) A.比平均数高出2个标准差 B.比平均数低2个标准差 c.等于2倍的平均数 D.等于Z倍的标准差 l2.如果一个数据的标准分数是3,表明该数据 ( ) A.比平均数高出3个标准差 B.比平均数低3个标准差 c.等于3倍的平均数 D.等于3倍的标准差

13.经验法则表明,当—组数据对称分布时,在平均数加减1个标准差的范围之内大约有 A.68%的数据 B. 95%的数据 C. 99%的数据 D.]00%的数据

14经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有 A.68%的数据 B.95%的数据 C. 99%的数据 D.100%的数据

15.经验法则表明,当一组数据对称分布时,在平均数加减3个标准差的范围之内大约有 A.68%的数据 B.95%的数据 C.99%的数据 D.100%的数据 16.离散系数的主要用途是 ( )

A.反映一组数据的离散程度 B.反映一组数据的平均水平 c,比较多组数据的离散程度 D.比较多组数据的平均水平 1 7.两组数据相比较 ( )

A.标准差大的离散程度也就大 B.标准差大的离散程度就小 C.离散系数大的离散程度也就大 D.离散系数大的离散程度就小 18.偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数8

( ) ( ) ( ) ( )

A.等于0 B.等于1 c,大于0 D.大于l

19.如果峰态系数k>o,表明该组数据是 ( )

A.尖峰分布 B.扁平分布 c左偏分布 D右偏分布 20.如果峰态系数k

A.尖峰分布 B.扁平分布C.左偏分布 D.右偏分布

21.某大学经济管理学院有1 200名学生,法学院有800名学生,医学院有320名学 生,理学院有200名学生。在上面的描述中,众数是 ( ) A.1 200 B.经济管理学院C,200 D.理学院

22.某居民小区准备采取一项新的物业管理措施,为此,随机抽取100户居民进行 的调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户.该组数据的中位数是 A赞成 B.69 C中立 D.22

23.假定一个样本由s个数据组成:3,7,8,9,13。该样本的方差为 ( ) A.8 B.13 C.9.7 D.10.4

24.对于右偏分布,平均数、中位数和众数之间的关系是 ( ) A.平均数>中位数>众数 B.中位数>平均数>众数 c.众数>中位数>平均数 D.众数>平均数>中位数

25. 在某行业中随机抽取10个企业,第一季度的利润额(单位:万元)分别是:72, 63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的中位数为 ( )

A.28.46 B.30.20 C.27.95 19.28.12

26.在某行业中随机抽取10个企业,第一季度的利润额(单位:万元)分别是:72, 63.1,54.7,54.3,29,26.9,25,23.9,23,20.该组数据的平均数为 ( )

A.28.46 B.30.20 C.27.95 D.39.19

27在某行业中随机抽取10个企业.第一季度的利润额(单位:万元)分别是:72, 63.1,54,7,54,3,29,26.9.25,23,9,23,20。该组数据的标准差为 ( )

A.28.46 B.19.54 C. 2 27.95 D.381.94

28.随机抽取5名学生,他们一年中购买教科书的费用如下(单位:元):200,250, 375,125,280。该组数据的方差是 ( )

A.92.97 B.8 642.5 C.83.15 D.6 914.0

29某班学生的平均成绩是80分,标准差是lo分。如果已知该班学生的考试分数为 对称分布,可以判断成绩在60分到100分之间的学上大约占 ( ) A.95% B.89% C.68% D,99%

30.某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为 对称分布,可以判断成绩在70分到90分之间的学生大约占 ( ) A.95% B.89% C.68% D.99%

3l某班学上的平均成绩是8o分,标准差是5分。如果已知该班学牛的考试分数为非 对称分布,可以判断成绩在70分至90分之间的学生至少占 ( ) A,95% B.89% C.68% D.75%

32.在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分, 中位数是86分,则新员工得分的分布形状是 ( ) A.对称的 B.左偏的 C.右偏的 D.无法确定

33.对某个高速路段行驶过的1Z0辆汽车的车速进行测量后发现,平均车速是85公 里/小时,标准差是4公里/小时.下列哪个车速可以看作是异常值 ( )

A.78公里/小时 B. 82公里/小时 C.91公里/小时 D. 98公里/小时

34.一组样本数据为3,3,l,5,13,12,11,9,7。这组数据的中位数是 ( )

9

( )

A.3 B,13 C,7.1 D.7

35.测度数据离散程度的相对统计量是 ( ) A.极差 B.平均差c标准差 D.离散系数

36.一组数据的离散系数为0.4,平均数为20,则标准差为 ( ) A.80 B.0,02 c. 4 D.8

37.一组数据的离散系数为0.8,标准差为30,则平均数为 ( ) A.50 B.1.7 C.18 D.0.02

38.在测度数据集中趋势的统计量中,不受极端值影响的是 ( ) A.平均数 B.几何平均数 C.调和平均数 D.中位数

39.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的 ( )

A.标准差不同 B.方差不同c.数据个数不同 D.计量单位不同

二、多选题

1.相对指标中,属于同类现象对比的是( )。

A.比例相对指标 B.计划完成程度相对指标

C比较相对指标 D.结构相对指标 E.强度相对指标 2.下列指标中,属于时期指标的是( )。 A.年末职工人数 B.资金利润率

C.产品产量 D.人均国内生产总值 E.销售收入 3.下列指标中,属于时点指标的是( )。 · A.年末职工人数 B.年内新增职工人数

C货币供应量 D.固定资产投资额 E.固定资产余额 4.下列各种陈述( )是正确的。

A.权数越大,对应组的标志值在计算平均数中起的作用越大

B.当各标志值出现的次数相同时,加权算术平均数等于简单算术平均数 C.标志变异指标的数值越大,平均数的代表性就越好

D.当总体内的次数呈对称钟形分布时,算术平均数、众数和中位数三者相等 E.如果两个数列的全距相同,它们的离散程度也就相同 5.下列指标中,属于强度相对指标的是( )。

A.资产负债率 B.平均年龄C产品合格率 D.资金利润率 E.人均国内生产总值 6.调和平均数的计算公式有( )。

xf? A.H= B. x=

1f??n? C.

x?x?=

nx D.

?m E.

GHm?x=

=

?fi?xifi

7.在各种平均指标中,不受极端数值影响的平均指标是( )。

A.算术平均数 B.调和平均数 C几何平均数 D.中位数 E. 众数 8.计算加权算术平均数,在选择权数时应具备的条件是( )。

A.权数与标志值相乘能够构成标志总量B.权数必须表现为标志值的直接承担者

C权数必须是总体单位数D.权数与标志值相乘具有经济意义 E.权数必须是单位数比重

10

9.下列情况应该采取调和平均数的是( )。

A.已知各企业的计划任务数和计划完成程度,计算平均计划完成程度 B.已知各企业的实际完成数和计划完成程度,计算平均计划完成程度 C.已知各商品的销售单价和销售额,计算商品的平均销售单价 D.已知各商品的销售单价和销售数量,计算商品的平均销售单价

E.已知分组的粮食单位产量和各组粮食总量,计算总的平均粮食单位产量 10.下列总体标志变动度的指标中,是无名数的有( )。

A.方差 B.全距 C.平均差系数D.标准差 E.标准差系数

三、计算题

271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 32g 249 269 295 1.某百货公司6月份各天的销售额数据如上(单位:万元): (1)计算该百货公司日销售额的均值、中位数和四分位数。 (2)计算日销售额的标准差。 : 总成本(元) 产品名称 单位成本(元) 甲企业 乙企业

A 15 2 100 3 255

B 20 3 000 1 500

C 30 1 500 l 500

2.甲乙两个企业生产三种产品的单位成本和总成本资料如下比较哪个企业的总平均成本高?并分析其原因。

3.两个生产车间,甲车间有20名工人,人均日加工产品数为78件,标准差为8件;乙车间有30名工人,人均日加工产品数为72件,标准差为10件。将两个车间放在一起,计算日加工产品数的平均值及标准差。

4.某厂甲车间160名工人生产某产品的平均产量为110件,产量的标准差为12.89件;又知乙车间200名工人产量的分组资料如下: 257 276 297 252 238 310 240 236 265 278 按产量分组(件) 工人数(人) 60——80 80——100 100——120 120——140 140——160 合计 30 50 80 30 10 200 要求:(1)计算乙车间200名工人的平均产量和产量标准差;

(2)分别计算甲、乙车间工人产量的平均产量的变异系数(标准差系数),说明哪个工人的平

均产量具有较大的代表性。

5.一条成品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生

11

产线哪几天失去了控制?

时间 周一 周二 周三 周四 周五 周六 周日 产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700 6、某加工厂400个工人奖金额分配资料如下:

奖金额(元) 140——150 150——160 160——170 170——180 180——190 合计 人数(人) 40 100 160 60 40 400 计算该厂工人奖金额的算术平均数、中位数、众数、三均值及其F伪方差。

7、一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,

随机抽取15个工人,让他们分别用3种方法组装。下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):

方法A 164 167 168 165 170 165 164·. 168 164 162 163 166 167 166 165 方法B 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132 方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 如果让你选择一种方法,你会作出怎样的选择?试说明理由。

第五章抽样与参数估计

一、单选题

l从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都 有相同的机会(概率)被抽中,这样的抽样方式称为 ( )

A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样

2.从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为 ( )

A.重复抽样 B. 不重复拙样c.分层抽样 D. 整群抽样

3.一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到 抽取n个元素为止,这样的抽样方法称为 ( )

12

A.重复抽样 B.不重复抽样 c.分层抽样 D.整群抽样

4.在抽样之前先将总体的元素划分为若干类.然后从各类中抽取一定数量的元素组成一个样本,这样的抽样方式称为 ( )

A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样

5.先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一 定的间隔抽取—个元素,直至抽取n个元素形成一个样本。这样的抽样方式称为 ( ) A.简单随机抽样 B分层抽样 C.系统抽样 D.整群抽样

6.先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各 个群中所包含的所有元素进行观察,这样的抽样方式称为 ( )

A.简单随机抽样 B分层抽样C.系统抽样 D.整群抽样 7.抽样分布是指 ( )

A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布

8.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分 布,其分布的均值为 ( )

A.

? B. ?/n C.?/n D.?/n

29.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分 布,其分布的方差为 ( ) A.

?2/n B.?/n C.

?2/n D.

?/n

10.中心极限定理表明,如果容量为n的样本来自于任意分布的总体,则样本均值的 分布为 ( )

A.正态分布 B.只有当n<30时为正态分布 C.只有当n≥30时为止态分布 D.非正态分布

11.从服从正态分布的无限总体中抽取容量为4、16和36的样本,当样本容量增大 时,样本均值的标准差 ( )

A.保持不变 B.无法确定 c.增加 D.减小

12总体的均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均 值和抽样分布的标准误差分别为 ( )

A.50,8 B.50,l C.50,4 D. 8, 8

13.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。 如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本的分布服从

( )

A.正态分布,均值为12分钟,标准差为0.3分钟 B.正态分布,均值为12分钟,标准差为3分钟 c.左偏分布,均值为12分钟,标准差为3分钟 D.左偏分布,均值为12分钟,标准差为0,3分钟

14.假定总体比例为O.55,采用重复抽样的方法从该总体中抽取容量为200的样本, 则样本比例的抽样标准差为 ( )

A.0,05 B.0.035 C.0.045 D.0.057

15假设总体比例为0.4,采用重复抽样的方法从此总体中抽取一个容量为100的简 单随机样本,则样本比例的期望为 ( )

A.0.3 B. 0 .4 C. 0,5 D. 0.45

13

16.在参数估计中利用t分布构造置信区间的条件是 ( ) A.总体服从正态分布且方差已知B.总体为正态分布,方差未知

c.总体不一定是正志分布但须是大样本D.总体不一定是正态分布,但需要方差已知 17.根据一个具体的样本求出的总体均值95%的置信区间 ( ) A.以95%的概率包含总体均值 B. 有5%的可能性包含总体均值 c. 一定包含总体均值D. 要么包含总体均值,要么不包含总体均值 18.当置信水平一定时,置信区间的宽度 ( )

A.随着样本量的增大而减小 B.随着置样本量的增大而增大 c.与样本量的大小无关 D.与样本量的平方根成止比 19.一个95%的置信区间是指 < )

A。总体参数有95%的概率落在这一区间内B. 总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数 20.95%的置信水平是指 ( )

A.总体参数落在一个特定的样本所构造的区间内的概率为95%

B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95% C.总体参数落在一个特定的样本所构造的区间内的概率为5%

D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5% 21.当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是( ) A。正态分布 B.t分布C. 卡方分布 D.F分布

22.当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是( ) A. 正态分布 B. t分布C. 卡方分布 D. F分布

23正态总体方差已知时.在小样本条件下,总体均均值在l一a置信水平的置信区间 可以写为 ( )

A.x?z?? B. x?tn?2??2?2? C;x?z?? D. x?z?s

nnn???2?2 24.正态总体方差未知时,在小样本条件下,总体均值在1一a置信水平的置信区间 可以写为 ( ) A.

x?z??n B. x?t?2??2?2sn C.

x?z??n D. x?t?sn??2?2?2

25.在其他条件相同的情况下,95%的置信区间比90%的置信区间 ( ) A.要宽 B.要窄 C.相同 D.可能宽也可能窄 26.指出下面的说法哪—个是正确的 ( )

A.样本量越大,样本均值的抽样标准差就越小B.样本量越大,样本均值的抽样标准差就越大 c.样本量越小,样本均值的抽样标准差就越小D.样本均值的抽样标准差与样本量无 27.将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比率称为 A.置信区间 B.显著性水平 c. 置信水平 D.临界值

28.抽取一个容量为100的随机样本,其均值为81,标准差为12。总体均值的 95%的置信区间为 ( )

A.81±1.97 B. 81±2.35 C. 81±3.10 D.81±3.52

29.从某地区中随机抽出20个企业,得到20个企业总经理的年平均收入为25 964.7元,标准差为42 807.8元,构造企业总经理年平均收入的95%的置信区间为 ( )

14

A,25 964.7±20 094.3 B. 25 964.7±21 034.3 C.23 964.7±25 034.3 D.25 964.7±30 034.3 30.在某个电视节目的收视率调查中,随机抽取由165个家庭构成的样本,其中观看 该节目的家庭有101个。用90%的置信水平构造的估计观看该节目的家庭比率的置信区间 为 ( )

A. 11%±3% B.11%±X C. 11%±5% D.11%±6%

31.在n=500的随机样本中,成功的比率为O.20,总体比率的95%的置信区间 为 ( )

A.0.20 ± 0.078 B.0.20±0.028 C.0.20±0.035 D.0.20±0.045

32.税务管理官员认为,大多数企业都有偷税漏税行为.在对由800个企业构成的随机样本的检查中,发现有14个企业有偷税漏税行为。根据99%的置信水平估计偷税漏税企业比率的置信区间为 ( )

A.0.18±0.016 B. 0.18±0.025 C. 0.180±0.035 D.0.18±0.045

33.若边际误差E=5,标准差=40.要估计总体均值的95%的置信区间所需的样本量为( ) A.146 B.246 C. 346 D.446

34,某大型企业要提出一项改革措施,为估计职工中赞成该项改革的人数的比率,要 求边际误差不超过0,03,置信水平为90%,应抽取的样本量为 ( )

A.552 B. 652 C. 752 D.852

35.一项调查表明:在外企工作的员工月收入为5 600元,假定总体标准差=1 000元。如果这个数字是基于n=15的样本计算的,而且所有员工的月收入服从正态分布,在外企工作的所有员工的月平均收入的90%的置信区间为 ( ) A. (5 073.97,6 006,03) B. (5 173.97,6 026.03) C, (5 273.97,6 126.03) D. (5 373.97,6 226.03)

36.在一项对学生资助贷款的研究中,随机抽取480名学生作为样本,得到毕业前的 平均欠款余额为12 168元,标准差为2 200元。则贷款学生总体中平均欠款额的95%的置 信区间为 ( )

A (11 971,12 365) B. (ll 971,13 365) C. (11 971,14 365) D.(11 971,15 365)

37.销售公司要求销售人员与顾客经常保持联系。一项由61名销售人员组成的随机样

本表明:销售人员每周与顾客联系的平均次数为22.4次,样本标准差为5次。则总体均值的95%的置信区间为 ( )

A. (19.15,22.65) B. (21.15,23.65) C, (22,15,24.65) D. (21.15,25.65) 38.在95%的置信水平下.以0,03的边际误差构造总体比率的置信区间时,应抽取的样本量为 ( )

A, 900 B.1 000 C. 1 100 D.1 068

39.随机抽取400人的一个样本,发现有26%的上网者为女性。女性上网者比率的 95%的置信区间为 ( )

A. (0.217,0.303) B. (O.117,0.403) C. (0.317,0.403) D. (0.117,0.503) 40.一项调查表明,有33%的被调查者认为她们所在的公司十分适合女性工作。假定

总体比率为33%,取边际误差分别为10%、5%、2%、1%,在建立总体比率95%的置信区间时,随着边际误差的减少,样本量会 ( )

A.减少 B.增大 C.可能减少也可能增大 D.不变

二、多选题

1.非全面调查可以是( )。

A.定期调查 B.不定期调查 C.抽样调查D.重点调查 E.典型调查 2.与全面调查相比,抽样调查的优点有( )。

A.速度快 B.费用省C. 能够控制抽样估计的误差 D.适用范围广 E。无调查误差 3.抽样推断适用于( )。

15

机样本,结果为:1.9,1. 7,2.8,2.4,2.6,2.5,2.8, 3.2,1.6,2.5。 在a=0.05的显著性水平下,检验平均售票时间是否超过2分钟,得到的结沦是 ( )

A拒绝Ho B 不拒绝Ho

C可以拒绝也可以不拒绝Ho D 可能拒绝也可能不拒绝Ho,

28如果能够证明某一电视剧在播出的头13周其观众收视率超过了25%,则可以断定它获得了成功。假定由400个家庭组成的一个随机样本中,有112个家庭看过该电视剧,在a=0.01的显著性水平下,检验假设

H0 :

?≤25% H:?>25%, 得到的结沦是 ( )

0 A 拒绝Ho B 不拒绝Ho

C 可以拒绝也可以不拒绝Ho D 可能拒绝也可能不拒绝Ho

二、多选题

1.在假设检验中,总体参数为( )。

A. 是未知的 B.是已知的 C.是假设的 D.是确定的 E.是不确定的 2.第一类错误水平 A. C. E.

?和第二类错误水平

?的关系是( )。

?和

?同时增加,样本容量不变 B.减少,样本容量不变D.

?和

?同时减少,样本容量增大

?增加和

???同时减少,样本容量减少

??同时增加,样本容量减少

3.对于检验统计量t=

?1??2S1w1??nn?12,所必须满足的条件有( )。

A. 两个总体都为正态总体 B.两个总体方差已知 C. 两个总体的方差未知,但相等 D.f分布的自由度为

E.f分布的自由度为

n1+

n-22

n1+

n-1

2 4.下面判断正确的有( )。

A. 若显著性水平为0.43,则原假设是可信的

B.若观察到的显著性水平为0.04,则此结果为统计显著 C一个高度显著的结果不可能是由于偶然的缘故

D.若显著性水平为0.01,则原假设看上去是不可信的

E.若观察到的显著性水平为0.01,那么100次中仅有1次的机会原假设为真 5.确定检验统计量,需要考虑的因素有( )。

A.进行检验的是大样本还是小样本B.显著性水平是大还是小 C是双侧检验还是单侧检验D.总体方差是已知还是未知 E.有时还要考虑两个总体的方差是否相等 6.假设检验中涉及两类错误,第一类错误发生的概率为

21

?,第二类错误发

生的概率为

?,下面说法正确的有( )。

A. 第一类错误也称弃真错误,第二类错误也称取伪错误 B.第二类错误也称弃真错误,第一类错误也称取伪错误 C 在一定样本容量下,减少

?会引起

?增大

D. 奈曼·皮迩逊原则是在控制

?的条件下,尽可能降低不会引起

?

E.在一定的样本容量下,减小

??增大

7.下面关于检验概率9值的叙述不正确的有( )。 A

HH0 :

?=?0 , H?=?0 , H1 :

?<?0.情况下,P值表示当Ho为真时,样本可能结果不低

于实际观测结果的概率

B.

0 :

1 :

?<?0情况下,P值表示当Ho为真时,样本可能结果不高

于实际观测结果的概率

C

H0 :

?=?0 , H :

1 :

?>?0情况下,P值表示当Ho为真时,样本可能结果不低于

实际观测结果的概率

:

D.

H0?=?0 , HH01?>?0情况下,P值表示当Ho为真时,样本可能结果不高

于实际观测结果的概率 接受

E.P<

?,接受, P>

?H1,

8.现欲检验两个正态总体A,B的均值是否相等,即检验Ho:声A’卢。,从这两个总体中抽取一定数量的样本,考虑/4与B的样本均值之差,计算出两样本的之检验值为1.75,则下面说法不正确的有( )。 A.

H1 :

?A>?B ??A<?B ??A≠?B ??0.05,则该差统计显著

B.

HH1 :

?0.05,则该差统计显著

C.

1 :

?0.05,则该差统计显著

D.无论是左检验还是右检验,因为 E.若,则计算出的P值为0.08 9.下面叙述正确的是( )。

?=0.05>P,所以接受

H0

22

A.若p=0.011,则结论是统计显著,但不是高度显著B.一个检验的P值是 C若一个结果是统计显著的,则他有0.05的机会应归因于偶然性,0.95 的机会是实际存在的

D.在其他情况相等,p=0.98是比p=0.02对原假设更加有力的证据E.p> 10.在假设检验中,显著性水平 A.P(接受

H0为真的概率

?接受

H0

?表示( )。

H/H000为假) B.P(拒绝

H/H00为真)

C.P(拒绝片

H/H0为真) D取伪概率 E.弃真概率

11.下列关于假设检验的叙述正确的有( )。

A. 假设检验实质上是对原假设进行检验B.假设检验实质上是对备择假设进行检验 C.当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误

D.假设检验并不是根据样本结果简单地或者直接地判断原假设和备择假设哪一个更有可能正确 E.当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确。

12.选择一个合适的检验统计量是假设检验中一个重要的环节,其中“合适”的理解为( )。 A.选择的检验统计量应该与原假设有关B.选择的检验统计量与备择假设有关 C在原假设为真时,所选择的检验统计量的抽样分布是已知的 D.在备择假设为真时,所选择的检验统计量的抽样分布是已知的 E.所选择的检验统计量的抽样分布已知,但不含有未知参数

三、计算题

1、某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?

2、研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。一名孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。试帮助这位商人定义检验参数并建立适当的原假设和备择假设。

3、一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?

4、一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)?进行检验,假设陈述如下:

如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。 (1)与这一假设检验问题相关联的第一类错误是什么? (2)与这一假设检验问题相关联的第二类错误是什么?

(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重? 5、某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。研究人员测得了

23

100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。

(1) 选择检验统计量并说明其抽样分布是什么样的? (2) 检验的拒绝规则是什么? (3) 计算检验统计量的值,你的结论是什么?

6、一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平?=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?

7、经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比率设计,假定其总体服从正态分布,现随机抽取了20个框架测得比值分别为:

0.699 0.672 0.668 0.553

0.749 0.615 0.611 0.570

0.654 0.606 0.606 0.844

0.670 0.690 0.609 0.576

0.612 0.628 0.601 0.933

在显著性水平?=0.05时能否认为该厂生产的工艺品框架宽与长的平均比率为0.618?

8、一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取?=0.01,检验如下的假设:

H0:??0.75 H1:??0.75 对这个医生的论断你有什么看法?

9、一个视频录像设备(VCR)的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差。并在?=0.05的显著性水平下做出结论。 10、某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下资料:

操作A

操作B

n1=100 x1=14.8分钟 s1=0.8分钟

n2=50 x2=10.4分钟 s2=0.6分钟

对?=0.02,检验平均装配时间之差是否等于5分钟。

11、某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对?=0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。 个体 1 2 3 4 6 6 7 4 购买力得分 看后 看前 5 4 7 3 个体 5 6 7 8 购买力得分 看后 3 9 7 6 看前 5 8 5 6

12、在旅游业中,特定目的地的旅游文化由旅游手册提供,这种小册子由旅游管理当局向有需要的旅游者免费提供。有人曾进行过一项研究,内容是调查信息的追求者(即需要旅游手册者)与非追求者之

24

间在种种旅游消费方面的差别。两个独立随机样本分别由288名信息追求者和367名非信息追求者组成。对样本成员就他们最近一次离家两天或两天以上的愉快旅行或度假提出若干问题。问题之一是:“你这次度假是积极的(即主要包括一些富有挑战性的事件或教育活动),还是消极的(即主要是休息和放松)?”每个样本中消极休假的人数列于下表,试问:这些数据是否提供了充分证据,说明信息追求者消极度假的可能性比非信息追求者小?显著性水平?=0.10。

被调查人数 消极度假人数

信息追求者

288 197

非信息追求者

367 301

13、生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位为克)如下,请进行检验以确定这两部机器生产的袋茶重量的方差是否存在显著差异。取?=0.05。

机器1 机器2

2.95 3.16 3.20 3.12 3.22 3.38 3.30

3.45 3.20 3.22 3.30 3.34 3.28

3.50 3.22 2.98 3.34 3.35 3.30

3.75 3.38 3.45 3.28 3.19 3.20

3.48 3.90 3.70 3.29 3.35 3.16

3.26 3.36 3.34 3.25 3.05 3.33

3.33 3.25 3.18 3.30 3.36

3.20 3.28 3.35 3.27 3.28

14、为比较新旧两种肥料对产量的影响,一边决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:

旧肥料 109 98 103 97 101 98 88 105 97 94 108 102 98 99 102 104 100 104 106 101 105 113 106 110 109 111 117 111 新肥料 110 111 99 103 118 99 107 110 109 112 119 119 取显著性水平??0.05用Excel检验:

(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:

a) 两种肥料产量的方差未但相等,即?1??2; b) 两种肥料产量的方差未且不相等,即?1??2。 ⑵ 两种肥料产量的方差是否有显著差异?

2222第七章 相关与回归分析

一、单选题

1.具有相关关系的两个变量的特点是 ( )

A一个变量的取值不能由另一个变量唯一确定 B一个变量的取值由另一个变量唯一确定

C一个变量的取值增大时另一个变量的取值一定增大D一个变量的取值增大时另一个变量的取值肯定变小

2,如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为两个 变量之间的关系为 ( )

A.完全相关关系 B.正线性相关关系 c.非线性相关关系 D.不相关 3.下面的陈述哪一个是错误的 ( )

A.相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是—个随机变量 c相关系数的绝对值不会大干1 D.相关系数不会取负值

25

4.根据你的判断,下面的相关系数取值哪一个是错误的 ( )

A.0.86 B.0.78 C 1.25 D..0 5.下面关于相关系数的陈述中哪一个是错误的 ( )

A.数值越大说明两个变量之间的关系就越强

B.仅仪是两个变最之间线性关系的一个度量,不能用于描述非线性关系

c.只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间一定有因果关系 D.绝对值不会大于1

6.变量X与Y之间的负相关是指 ( )

A.x值增人时Y值也随之增大B.x值减少时Y值也随之减少 C. x值增大时Y值随之减少,或X值减少时Y值随之增大D. y的取值几乎不受X取值的影响 7.如果相关系数r=o,则表明两个变量之间 ( )

A. 相关程度很低 B. 不存在仟何关系C. 不存在线性相关关系 D. 存在非线性相关关系

8.在回归分析中,被预测或被解释的变量称为 ( )

A.自变量 B.因变量 C.随机变量 D.非随机变量

9.在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称为 ( ) A.自变量 B.因变量 C.随机变量 D.非随机变量

10.在回归分析中,描述因变量y如何依赖于自变量X和误差项的方程称为( ) A.回归方程 B.回归模型C.估计的回归方程 D.经验回归方程 11.在回归分析中,根据样本数据求出的回归方程的估计称为 ( ) A.回归方程 B.回归模型C.估计的回归方程 D.理论回归方程 12.在回归模型

y??0??1x??中?反映的是 ( )

A.由于x的变化引起的y的线性变化部分B.由于y的变化引起的x的线性变化部分 C.除x和y的线性关系之外的随机因素对y的影响D.由于x和y的线性关系对的影响 13.根据最小二乘法拟合直线回归方程是使 ( )

? A. ??y??i?? C.??y??i??yi????yi?????2?=最小 B. ??y??i??=最小 yi????yi?????2?=最/j D.??y??i?=最小

14.在一元线性回归方程中,回归皿的实际意义是 ( )

A.当x=0时,y的期望值B.当x变动一个单位时,y的平均变动数量

C.当x变动一个单位时,y增加的总数量D.当y变动一个单位时,x的变动平均变动数量 15.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误 A.

y=25—0.75x B.y=一1204-0.86x C. y=200—2.5x D.y=一34—0.74x

y=280—1.75x,回归系数=—1.75

????? 16.对不同年份的产品成本配合的直线方程为

表示 ( )

A. 时间每增加一个单位,产品成本平均增加1.75个单位 C.线性关系的显著性 D.估计标准误差的显著性 17.说明回归方程拟合优度的统计量是 ( )

A.相关系数 B.回归系数C.判定系数 D.估计标准误差

26

18.各实际观测值与回归值的离差平方和称为 ( )

A.总变差平方和 B.残差平方和C.回归平方和 D.判定系数 19.若两个变量之间完全相关,在以下结论中不正确的是 ( )

? A.

r=1 B.判定系数月R2=l C.估计标准误差

sy=0 D.回归系数

?1=0

?20.回归平方和占总平方和的比例称为 ( )

A.相关系数 B.回归系数C. 判定系数 D.估计标准误差 21.在回归分析中,利用估计的回归方程,对于x的一个特定值的一个估计值E(

x,求出y的平均值

0y),称为 ( )

0A.平均值的点估计 B.个别值的点估计C.平均值的置信区间估计 D.个别值的预测区间估计

22.在回归分析中,利用估计的回归方程,对于x的一个特定值

x0,求出y的一个个

别值的一个估计值,称为 ( )

A. 平均值的点估计 B.个别值的点估计 C.平均值的置信区间估计 D.个别值的预测区间估计

23.已知回归平方和SSR=4 854,残差平方和SSE=146。则判定系数

R2= ( )

A.97.08% B.2.92% C.3.01% D.33.25%

24.对于有线性相关关系的两变量建立的直线回归方程夕=岛+序工中,回归系数( )

A.可能为0 B.可能小于0 C只能是正数 D.只能是负数 25.由最小二乘法得到的回归直线,要求满足因变量的 ( )

A. 平均值与其估计值的离差平方和最小B,实际值与其平均值的离差平方和最小

C.实际值与其估计值的离差和为o 二、多选题

1.下列现象中属于相关关系的有( )。

A.压力与压强 B.现代化水平与劳动生产率 C.圆的半径与圆的面积 D.身高与体重 E.机械化程度与农业人口

2.相关关系与函数关系各有不同特点,主要体现在( )。

A.相关关系是一种不严格的互相依存关系B.函数关系可以用一个数学表达式精确表达

C函数关系中各现象均为确定性现象 D.相关关系是现象之间具有随机因素影响的依存关系 E.相关关系中现象之间仍可以通过大量观察法来寻求其变化规律

3.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属 于( )。

A正相关 B.单相关 C.负相关 D.复相关 E.完全相关 4.在直线相关和回归分析中( )。

A. 据同一资料,相关系数只能计算一个 B.据同一资料,相关系数可以计算两个 C.据同一资料,回归方程只能配合一个

D. 据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个 E.回归方程和相关系数均与自变量和因变量的确定无关 5.相关系数厂的数值( )。

A 可为正值 B.可为负值 C可大于1 D.可等于-1 E.可等于1 6.相关系数r=0.9,这表明现象之间存在着( )。

27

A.高度相关关系 B.低度相关关系 C低度负相关关系D.高度正相关关系 E.低度正相关关系 7.配合直线回归方程是为了( )。

A.确定两个变量之间的变动关系 B.用因变量推算自变量C用自变量推算因变量 D.两个变量相互推算 E.正确定两个变量间的相关程度

8.在直线回归分析中,确定直线回归方程的两个变量必须是( )。 A.一个自变量,一个因变量 B.均为随机变量 C对等关系 D.一个是随机变量,一个是可控制变量 E.不对等关系 9.直线相关分析的特点有( )。

A.两个变量是对等关系 B.只能算出一个相关系数 C相关系数有正负号,表示正相关或负相关

D.相关的两个变量必须都是随机的E.回归方程有两个

10.从变量之间相互关系的表现形式看,相关关系可分为( )。

A.正相关 B.负相关 C.直线相关 D.曲线相关 且不相关和完全相关 11.直线相关分析与直线回归分析的区别在于( )。

A.相关的两个变量都是随机的,而回归分析中自变量是给定的数值, 因变量是随机的 B;回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的 C相关系数有正负号,而回归系数只能取正值

D.相关的两个变量是对等关系,而回归分析中的两个变量不是对等关系

E.相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量只能配合一个

回归方程

12.确定直线回归方程必须满足的条件是( )。

A.现象之间存在着直接因果关系B.现象之间存在着较密切的直线相关关系

C相关系数必须等于1 D.两变量必须均属于随机变量 E.相关数列的项数必须有相应的数量 13.下列哪些关系是相关关系( )。

A.圆的半径长度和周长的关系 B.农作物收获和施肥量的关系 C.商品销售额和利润率的关系D.产品产量与单位成品成本的关系 E.家庭收入多少与消费支出增长的关系 14.直线回归方程

y??0??1x中?1的称为回归系数,回归系数的作用是( )。

A.可确定两变量之间因果的数量关系 B.可确定两变量的相关方向

C可确定两变量相关的密切程度D.可确定因变量的实际值与估计值的变异程度 E.可确定当自变量增加一个单位时,因变量的平均增加量 15.相关系数与回归系数( )。 ·’

A.回归系数大于零则相关系数大于零 B.回归系数小于零则相关系数小于零 C回归系数大于零则相关系数小于零 D.回归系数小于零则相关系数大于零 E.回归系数等于零相关系数等于零

三、计算题

1、表中是道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:

年份 1988 DJIA收益率(%) S&P500收益率(%) 年份 16.0 16.6 1993 DJIA收益率(%) 16.8 S&P500收益率(%) 10.1 28

1989 1990 1991 1992 31.7 -0.4 23.9 7.4 31.5 -3.2 30.0 7.6 1994 1995 1996 1997 4.9 36.4 28.6 24.9 1.3 37.6 23.0 33.4 计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。 2、表中是16支公益股票某年的每股账面价值和当年红利: 公司序号 1 2 3 4 5 6 7 8 账面价值(元) 22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 红利(元) 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.60 公司序号 9 10 11 12 13 14 15 16 账面价值(元) 12.14 23.31 16.23 0.56 0.84 18.05 12.45 11.33 红利(元) 0.80 1.94 3.00 0.28 0.84 1.80 1.21 1.07 根据上表资料:

(1)建立每股账面价值和当年红利的回归方程;(2)解释回归系数的经济意义; (3)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少?

3、美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 (1)画出这些数据的散点图;

(2)根据散点图。表明二变量之间存在什么关系?

(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;

(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 5、表中给出y对x2和x3回归的结果:

离差来源 平方和(SS) 自由度(df) 平方和的均值(MSS) 来自回归(ESS) 65965

29

来自残差(RSS) 总离差(TSS) 66042 14

(1) 该回归分析中样本容量是多少? (2) 计算RSS;

(3) ESS和RSS的自由度是多少? (4) 计算可决系数和修正的可决系数;

(5) 怎样检验x2和x3对y是否有显著影响?根据以上信息能否确定x2和x3各自对y的贡献为多

少?

6、 在计算一元线性回归方程时,已得到以下结果:

试根据此结果,填写下表的空格:

来 源 来自回归 来自残差 总离差平方和 平方和 99.11 2278.67 自由度 22 方差 2179.56

第八章 时间序列分析

一、单选题

1.不存在趋势的序列称为 ( )

A.平稳序列 B.周期性序列C。季节性序列 D.非平稳序列 2.包含趋势性、季节性或周期性的序列称为 ( )

A.平稳序列 B.周期性序列C.季节性序列 D.非平稳序列

3.时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为 ( ) A.趋势 B.季节性 C,周期性 D.随机性

4.时间序列在一年内重复出现的周期性波动称为 ( ) A.趋势 B.季节性C周期性 D.随机性

5.时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动称为 ( ) A.趋势 B.季节性 C.周期性 D.随机性

6.时间序列中除去趋势、周期性和季节性之后的偶然性波动称为 ( ) A.趋势 B.季节性 C.周期性 D.随机性 7.增长率是时间序列中 ( )

A. 报告其观察值与基期观察值之比B. 报告其观察值与基期观察值之比减1后的结果

C.报告其观察值与基期观察值之比力1]1后的结果 D.基期观察值与报告其观察值之比减1后的结果 8.环比增长率是 ( )

A. 报告期观察值与前一时期观察值之比减1 B. 报告期观察值与前一时期观察值之比加1

C.报告期观察值与某一固定时期观察值之比减1 D.报告期观察值与某一固定时期观察值之比加1

30

工人劳动生产率(人/元) 工业总产值(万元) 1月 4200 42.0 2月 4500 49.5 3月 6000 48.0 要求:(1)编制第一季度工人人数动态数列;

(2)计算第一季度的月平均工人劳动生产率;

(3)计算第一季度的工人劳动生产率。(10分)

第九章 综合指数

一、计算题

1、给出某市场上四种蔬菜的销售资料如下表: 销 售 量 ( 公 斤 ) 品 种 基 期 计 算 期 白 菜 黄 瓜 萝 卜 西红柿 合 计 550 224 308 168 1250 560 250 320 170 1300 销 售 价 格 (元 / 公斤) 基 期 1.60 2.00 1.00 2.40 ── 计 算 期 1.80 1.90 0.90 3.00 ── ⑴ 用拉氏公式编制四种蔬菜的销售量总指数和价格总指数; ⑵ 再用帕氏公式编制四种蔬菜的销售量总指数和价格总指数; ⑶ 分别采用马埃公式、理想公式编制销售量指数;

2、依据上题的资料,试分别采用埃奇沃斯公式、理想公式和鲍莱公式编制销售量指数;然后,与拉氏指数和帕氏指数的结果进行比较,看看它们之间有什么关系。

3、某企业共生产三种不同的产品,有关的产量、成本和销售价格资料如下表所示:

计 算 期 产品种计量单基期产单位成销售价类 位 量 产量 本 格 A 产 品 B 产 品 C 产 品 件 台 吨 270 32 190 340 35 150 50 800 330 65 1000 400 ⑴ 分别以单位产品成本和销售价格为同度量因素,编制该企业的帕氏产量指数;

⑵ 试比较说明:两种产量指数具有何种不同的经济分析意义?

4、 给出某市场上四种蔬菜的销售资料如下表: 销 售 额 ( 元 ) 个体价格指品 种 数(%) 基 期 计 算 期 白 菜 黄 瓜 萝 卜 西红柿 合 计 880.0 448.0 308.0 403.2 2039.2 1008 475 288 510 2281 112.50 95.00 90.00 125.00 ── ⑴ 用基期加权的算术平均指数公式编制四种蔬菜的价格总指数; ⑵ 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数; ⑶ 再用基期加权的几何平均指数公式编制四种蔬菜的价格总指数; ⑷ 比较三种公式编制出来的销售价格总指数的差异。

5、已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农

36

副产品收购价格总指数为105% 。试考虑,1998年与1997年对比:

⑴ 农民因交售农副产品共增加多少收入?

⑵ 农副产品收购量增加了百分之几?农民因此增加了多少收入? ⑶ 由于农副产品收购价格提高5%,农民又增加了多少收入? ⑷ 验证以上三方面的分析结论能否保持协调一致。

6、给出某城市三个市场上有关同一种商品的销售资料如下表: 销 售 价 格 (元 / 公斤) 销 售 量 ( 公 斤 ) 市 场 基 期 计 算 期 基 期 计 算 期 A市场 B市场 C市场 合 计 2.50 2.40 2.20 ── 3.00 2.80 2.40 ── 740 670 550 1960 560 710 820 2090 ⑴ 分别编制该商品总平均价格的可变构成指数、固定构成指数和结构变动影响指数; ⑵ 建立指数体系,从相对数的角度进行总平均价格变动的因素分析;

⑶ 进一步地,综合分析销售总量变动和平均价格变动对该种商品销售总额的影响。

7、某化工厂两种产品产量和原材料耗用的资料如下: 产品名称 产量 基期 原材料报告期 名称 11 10 石灰石 焦碳 石灰石焦碳 单耗 基期 0.85 0.55 2.00 0.14 单位原材料价格 报告期 25.0 86.0 6.8 86.0 报告期 基期 0.84 0.54 2.00 0.15 25.0 90.0 7.0 90.0 电石 10 石灰 9 试分析原材料费用总额变动受各因素变动的影响程度和影响绝对额。 37

本文来源:https://www.bwwdw.com/article/zfup.html

Top