统计学练习题和答案

更新时间:2024-05-09 02:28:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

学号: 班级: 姓名:

第一章 导 论

一、填空题

1.1.1 统计工作 是人们对客观事物数量方面进行调查研究的认识活动。

1.1.2 调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料都是统计资料。 1.1.3 统计学是一门收集、整理和分析统计数据的 方法论 科学,其目的是探索数据的内在数量规律性 ,以达到对客观事物的科学认识。

1.1.4 统计数据按其采用的 计量尺度 不同可以分为分类数据、顺序数据、数值型数据。 1.1.5 分类数据 是指只能归入某一类别的非数字型数据。

1.1.6 分类数据是按 品质属性 对事物进行分类的结果,反映各个类型的数量结果。 1.1.7 顺序数据 是指归于某一有序类别的非数字型数据。

1.1.8 数值型数据 是指按数字尺度测量的观察值,也就是直接反映事物数量特征的数据。 1.1.9 统计数据按其 收集方法 不同,可以分为观测数据和实验数据。 1.1.10 观测数据 是指通过调查或观测而收集到的数据。

1.1.11 实验数据 是指在实验中控制实验对象而收集到的数据。 1.1.12 统计数据按被描述的对象和时间的关系不同分为 截面数据、时间序列数据 和 混合数据 。

1.1.13 截面数据 是指对不同单位在同一个时间点上收集的数据。

1.1.14 时间序列数据 是指对同一个单位的一个或多个变量在不同时间上收集到的数据。 1.1.15 混合数据 是指在数据集中含有时间序列和截面数据成分的数据。 1.1.16 以文字记述国家显著事项的学说在统计发展史上称为 国势学 。

1.1.17 从统计方法的构成看,统计学可以分为 描述统计学 和 推断统计学 。 1.1.18 从统计方法研究和统计方法的应用角度来看,统计学可以分为 理论统计学、应用统计学。

1.1.19 根据一定目的确定的所要研究事物的全体称为 统计总体 。 1.1.20 总体单位所具有的属性和特征通常称为 标志 。

1.1.21 反映统计总体数量特征的概念和数值称为统计指标。

1.1.22 标志是反映 总体单位 的属性和特征,而指标则是反映 总体 的数量特征。 1.1.23 统计指标按其所反映的数量特点不同,可以分为 数量指标 和 质量指标。 1.1.24 凡是反映现象总规模、总水平和工作总量的统计指标称为数量指标 。 1.1.25 凡是反映现象相对水平和工作质量的统计指标称为 质量指标 。 1.1.26 变量按其所受影响因素不同,可分为 确定性变量 和 随机变量 。 1.1.27 变量按其数值形式不同,可以分为 离散型变量 和 连续型变量 。

1.1.28 根据总体中包含的单位数是否有限,总体可以分为 有限总体 和 无限总体 。 1.1.29 统计学研究的对象是客观现象的 数量方面 。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题

干后面的括号内)

1.2.1 人们对客观事物数量方面进行调查研究的认识活动是指 ( A ) A.统计工作 B.统计学 C.统计资料

1.2.2 统计学是一门收集、整理和分析统计数据的 ( A ) A.方法论科学 B.实质性科学 C.实证科学

1.2.3 统计数据分为分类数据、顺序数据和数值型数据的依据是 ( C ) A.价值单位 B.计量单位 C.计量尺度

1.2.4 凡是可以用数值表示的标志,称为 ( A ) A.数量标志 B.数量指标 C.品质标志

1

学号: 班级: 姓名:

1.2.5 反映统计总体数量特征的概念和数值,称为 ( C ) A.数量标志 B.标志 C.统计指标

1.2.6 凡是反映总体现象相对水平和工作质量的统计指标称为 ( B ) A.数量指标 B.质量指标 C.数量标志

1.2.7 变量可以分为离散型变量和连续型变量,其依据是 ( A ) A.数值形式 B.计量单位 C.计量尺度

1.2.8 政治算术学派主要代表人物威廉·配第的代表作是 ( A ) A.政治算术 B.欧洲各国国势学概论 C.社会物理学

1.2.9 如果要研究某市30万在校高等学校大学生的月消费支出情况,总体单位是 ( B ) A.30万个大学生 B.每一位在校大学生 C.每一所大学

1.2.10 如果要研究某市3000家外资企业的基本情况,其中甲企业职工人数800人,这是一个什么指标 ( C ) A.数量指标 B.质量指标 C.数量标志值

1.2.11 如果要研究某市2万户贫困家庭的生活状况,总体是 ( B ) A.每一户贫困家庭 B.2万户贫困家庭 C.所有贫困人口

1.2.12 如果对连续生产线上的产品进行质量检验,那么研究对象是 ( A ) A.无限总体 B.有限总体 C.抽样总体

1.2.13 如果要研究某市人口的性别比例关系,那么,每个人的性别是 ( A ) A.品质标志 B.质量指标 C.数量标志

1.2.14 当研究对象为某班50名学生时,张三同学的年龄20岁是一个 ( B ) A.变量 B.变量值 C.统计指标

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,

并把字母填在题干后面的括号内)

1.3.1 当人们谈及什么是统计时,通常可以理解为 ( ACD ) A.统计工作 B.统计整理 C.统计资料 D.统计学

1.3.2 调查得到的经过整理具有信息价值的统计资料包括 ( ABD ) A.统计数据 B.统计图标 C.统计软件 D.统计年鉴

1.3.3 以下关于统计学的描述,正确的有 ( ACD ) A.统计学是一门收集、整理和分析统计数据的方法论科学 B.统计学是一门收集、整理和分析统计数据的实质性科学 C.统计学的研究目的是探索数据的内在数量规律性 D.统计学提供了探索数据内在规律的一套方法

1.3.4 统计数据按其采用的计量尺度不同可以分为 ( ABC ) A.分类数据 B.顺序数据 C.数值型数据 D.截面数据

1.3.5 统计数据按其收集方法不同,可以分为 ( AB ) A.观测数据 B.实验数据 C.时序数据 D.混合数据

1.3.6 统计数据按被描述的对象和时间的关系不同分为 ( ABD ) A.截面数据 B.时间序列数据 C.观测数据 D.混合数据

1.3.7 从统计学的产生和发展过程来看,大致可以划分为三个时期,即 ( ABC ) A.古典统计学时期 B.近代统计学时期 C.现代统计学时期 D.应用统计学时期 1.3.8 从统计方法的构成看,统计学可以分为 ( AD ) A.描述统计学 B.理论统计学 C.应用统计学 D.推断统计学

1.3.9 作为一个统计总体,必须具有以下特征 ( ABD ) A.同质性 B.变异性 C.统一性 D.大量性

1.3.10 标志是指总体单位所具有的属性和特征,可以分为 ( AC ) A.数量标志 B.数量指标 C.品质标志 D.质量指标

1.3.11 如果要研究某市987家外资企业的基本情况,下列属于统计指标的有 ( ABD ) A.所有外资企业的职工平均工资 B.所有外资企业的平均利润

2

学号: 班级: 姓名:

C.甲企业的固定资产原值 D.所有外资企业平均职工人数

1.3.12 统计指标按其所反映的数量特点不同,可以分为 ( AD ) A.数量指标 B.数量标志 C.品质标志 D.质量指标

四、判断改错题(在你认为正确的题后括号内打“ √ ”。在你认为错误的地方和题后括号内打“ × ”,并在其正下方写出正确的答案来)

1.4.1 统计资料是统计工作的成果,包括调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料。 ( √ )

1.4.2 统计学是一门收集、整理和分析统计数据的实质性科学。 (×,方法论科学) 1.4.3 分类数据是指只能归入某一类别的非数字型数据。 ( √ ) 1.4.4 顺序数据是按数量属性对事物进行分类的结果。 (×,品质属性) 1.4.5 分类数据和顺序数据相似之处在于两者都是非数字型数据。 ( √ ) 1.4.6 统计数据按其描述的对象不同,可以分为观测数据和实验数据。 (×,收集方法) 1.4.7 时间序列数据是指对不同单位在同一个时间点上收集的数据。 (×,截面数据) 1.4.8 从统计方法的构成看,统计学可以分为描述统计学和推断统计学。 ( √ ) 1.4.9 总体的数量特征都是从每个总体单位的特征加以逐级汇总而体现出来的。 ( √ ) 1.4.10 同质性是指构成总体的个别事物在某个方面必须具有相同的性质。 ( √ ) 1.4.11 若总体中所包含的统计指标数是有限的,则称为有限总体。 (×,总体单位数) 1.4.12 标志表现是指各种属性和特征在总体单位身上的具体体现。 ( √ ) 1.4.13 统计指标按其所反映的数量特点不同,可以分为相对指标和平均指标。 (×,数量指标和质量指标) 1.4.14 反映现象总规模、总水平和工作总量的统计指标称为质量指标。 (×,数量指标) 1.4.15 反映现象相对水平和工作质量的统计指标称为数量指标。 (×,质量指标) 1.4.16 变量按其所受影响因素不同,可分为离散型变量和连续型变量。 (×,确定性变量和随机变量) 1.4.17 甲企业职工人数1248人,这是一个连续变量。 (×,离散变量)1.4.18 某地区2007年人均国内生产总值为13600元,这是一个离散变量。(×,连续变量)

五、简答题

1.5.1 如何理解统计学的性质?

答:为了更好地理解统计学的性质,我们应明确以下三个方面的问题。其一,统计学研究的对象是客观现象的数量方面;其二,统计学研究的是群体现象的数量特征与规律性;其三,统计学是一门方法论的科学。

1.5.2 统计数据有哪些基本分类? 答:统计数据有三种基本分类。一是按其采用的计量尺度不同,统计数据可以分为分类数据、顺序数据、数值型数据;二是按其收集方法不同,统计数据可以分为观测数据和实验数据;三是按被描述的对象和时间的关系不同,统计数据可以分为截面数据、时间序列数据和混合数据。

1.5.3 什么是描述统计学和推断统计学?

答:描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。

推断统计学(Inferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。

3

学号: 班级: 姓名:

1.5.4 什么是统计总体?它具有何特点?

答:统计总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。总体具有以下三个特点:

其一,同质性,是指构成总体的个别事物在某个方面(或某一点上)必须具有相同的性质,这是构成总体的必要条件。其二,变异性,是指构成总体的个别事物除了至少在某一个方面具有相同的性质以外,其他方面应该存在差异,这是进行统计研究的前提。其三,大量性,是指构成总体的个别事物要求足够的多,这是探究客观事物规律性的基础。

1.5.5 什么是样本?它具有何特点?

答:从全及总体中抽取出来,作为代表这一总体的部分单位组成的集合体称为样本。

样本有以下显著的特点:其一,构成样本的单位必须取自全及总体内部,不允许总体外部的单位参加抽样过程;其二,从一个全及总体中可以抽取许多个样本;其三,样本具有代表性;其四,样本具有客观性。从全部总体中抽取样本,必须排除主观因素的影响。

1.5.6 什么是统计指标与指标体系?

答:统计指标是反映统计总体数量特征的概念和数值。

统计指标体系是由一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。

4

学号: 班级: 姓名:

第二章 统计数据的收集、整理与显示

一、填空题

2.1.1 一切数据最初都来源于 调查与实验 。

2.1.2 自己进行调查与实验得到的数据称为 初级统计数据或者直接数据 。

2.1.3 抽样调查是按照 随机原则 从总体中抽取部分单位进行观察用以推算总体数量特征的一种统计调查方式。

2.1.4 调查对象 是根据调查目的确定的、在某种性质上相同的许多个体单位所组成的集合。 2.1.5 报告 单位是负责向调查研究机构提供所需统计资料的基层单位。 2.1.6 标志 是反映调查单位特征的变量。

2.1.7 调查表 是指把所要调查的项目按照一定的结构和顺序排列后形成的表格。

2.1.8 一览表 是指一份表格上可以同时登记两个及两个以上调查单位有关调查项目的调查表。

2.1.9 单一表 是指一份表格上只登记一个调查单位有关调查项目的调查表。

2.1.10 一般情况下,调查项目多宜采用 单一表 ,调查项目少则应采用 一览表 。 2.1.11 调查时间 是指调查资料所属的时间。

2.1.12 问卷中的开放性问题可以采用填空和 自由回答 两种方式。

2.1.13 数据数列分组的关键在于 分组变量的选择和各组界限的划分 。

2.1.14 某开口组的上限为30,相邻组组距是5,则其假定下限为 25 ,组中值为 27.5 。 2.1.15 某开口组的下限为280,相邻组组距是10,则其假定上限为 290 ,组中值为 285 。 2.1.16 在组距数列中,表示各组界限的变量值称为 组限 ,各组上限与下限之间中点位置值称为 组中值 。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

2.2.1 主要用来调查时点现象总体特征的一次性全面调查称为 ( C ) A.抽样调查 B.统计报表调查 C.普查

2.2.2 按照随机原则抽取样本,并对总体的特征做出推断的调查方式是 ( A ) A.抽样调查 B.普查 C.统计报表调查

2.2.3 采用事先设计好的问卷进行调查的方法称为 ( B ) A.小组座谈法 B.问卷调查法 C.电话调查法

2.2.4 调查人员到现场对调查单位直接观察得到结果的方法称为 ( A ) A.观察法 B.实验法 C.电话调查法

2.2.5 在分类的基础上,将总体的所有单位按类进行整理,形成总体单位在各组间的分布,称为 ( C )

A.频数 B.次数 C.频数分布

2.2.6 在问卷中没有提供答案,由被调查者自由地选择回答形式的问题称为 ( B ) A.封闭性问题 B.开放性问题 C. 复杂性问题

2.2.7 上四分位数QU位置的计算公式是 ( A )

A.

3(n?1)n?1n?1 B. C. 4422.2.8 行标题通常用来表示横向变量的名称,一般在统计表的 ( B )

A.中间 B.左边 C.右边

2.2.9 一组数15,18,19,20,22,24,26,27,28,29,32的上四分位数值和下四分位数值分别是 ( A )

A.28,19 B.29,20 C.28,20

5

学号: 班级: 姓名:

对于配偶情况,有配偶的占85%,未婚的占8%。

2.6.4 为了解某特定商品房型的价格变动情况,某市调查机构随机抽取了25个样本,得销售价格资料如下:

销售价格(单位:元)

5660 5899 5710 6090 5425

5595 6295 5950 5770 5367

6060 5749 5720 5682 6380

5500 5820 5575 6016 5945

5630 5843 5760 5650 6120

要求:试根据上表资料绘制茎叶图。 解:

销售价格茎叶图为: 树茎 53 54 55 56 57 58 59 60 61 62 63 67 25 007595 30506082 1020496070 204399 4550 166090 20 95 80 树叶 数据个数 1 1 3 4 5 3 2 3 1 1 1

2.6.5 D超市30天的销售额资料如下(单位:万元):

59 40 56 36

63 67 42 56

35 65 64 69

41 46 57 63

92 45 43 54

63 84 64 72

11

学号: 班级: 姓名:

53

64

31

70

51

78

要求:试根据上表资料进行数据分组,并绘制这组数据的频数直方图。 解: 将数据分为7组,组距为10。

频数分布表

按销售额分组(万元)

30-40 40-50 50-60 60-70 70-80 80-90 90-100 合计

频率 4 5 7 9 3 1 1 30

百分比(%)

13.3 16.7 23.3 30.0 10.0 3.3 3.3 100.0

直方图:

108642020-3030-4040-5050-6060-7070-8080-9090-100100-110

2.6.6 2006年世界十大富豪和中国内地十大富豪资产的资料如下: 世界(亿美元) 姓名 比尔·盖茨 沃伦·巴菲特 卡洛斯·贺鲁 英格瓦·坎普拉德 拉克什米·米塔尔 保罗·艾伦 伯纳德·阿诺特 阿尔瓦利德·塔拉尔 肯尼斯·汤姆森家族 李嘉诚 资产 500 420 300 280 235 220 215 200 196 188 中国内地(亿元人民币) 姓名 黄光裕 许荣茂 荣智健 朱孟依 张 茵 张 力 施正荣 刘永行 郭广昌 鲁冠球 资产 180.9 173.6 158 152.4 115 115.2 113 91.7 90.8 90.5 要求:试按照1美元=7元人民币的汇率,画出相应的对比柱形图和环形图。 解:

12

学号: 班级: 姓名:

对比柱形图

世界十大富豪和中国内地十大富豪资产柱形对比图600500400亿美元30020010001234567891011系列1系列2

(系列1为世界十大富豪,系列2为中国内地十大富豪) 环形图:

世界十大富豪和中国内地十大富豪资产环形图12.9312.9713.119620018825.8450024.842016.1421522016.4623516.4330022.5728021.7712345678910

2.6.7 试通过对次级资料的收集,绘制1990—2006年我国国内生产总值(GDP)的线图,(按当年价格计算,单位:亿元)。

解:

1990—2006年我国国内生产总值(GDP)的线图

1990—2006年我国国内生产总值(GDP)250000200000150000100000500000 总值19901991199219931994199519961997199819992000200120022003200420052006年份 2.6.8 某大型乳制品加工企业2006年在全国4个大区的销售额如下(单位:百万元):

月份 1 2 3 4 5 6 华北 110 115 107 105 101 99 华东 160 160 174 189 192 140 华中 81 82 76 77 80 77 华南 62 68 70 71 69 73

13

学号: 班级: 姓名:

7 8 9 10 11 12 96 100 108 113 125 129 154 170 177 188 151 179 76 69 66 75 89 95 78 77 89 92 95 98 要求:试根据上表资料绘制箱线图,并分析各大区销售额的分布特征。 解:

如图所示,华东地区的平均销售额最高,其次是华北地区,较低的是华中地区,排最后的是华南地区;从销售额分布的离散程度来说,华中地区(有两个离异点)和华南地区的销售额较为集中,,华北和华东地区的销售额则比较分散。

14

学号: 班级: 姓名:

第三章 数据分布特征的描述

一、填空题

3.1.1 集中趋势 是指一组数据向其中心值靠拢的倾向。 3.1.2 加权算术平均数受两个重要因素的影响,一个是 各组变量值 ;另一个是各组变量值出现的 频数或频率 。

3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法 。

3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权调和平均法 。

3.1.5 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 众数 是指一组数据中出现次数最多的变量值。

3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。 3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.9 在数据分布呈 完全对称的正态分布 时,算术平均数、众数和中位数三者相等。 3.1.10 异众比率是指 非众数组 的频数占总频数的比率。

3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。

3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以?2表示。 3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布 偏斜程度 的一种方法。

3.1.15 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( B )

A.数值平均数 B.位置平均数 C.离散系数

3.2.2 算术平均数反映的是数据分布的什么特征 ( A ) A.集中趋势 B.离散趋势 C.偏态趋势 3.2.3 根据算术平均数的性质,下列表达式正确的是 ( A )

A.?(x?x)f?0 B.

?x-xf=0 C.?(x-x)2f=0

3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( B )

A.算术平均法 B.几何平均法 C.调和平均法

3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( A ) A.各组数据在组内是均匀分布的 B.各组次数相等 C.各组数据之间没有差异

3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( A ) A.Mo?Me?x B.x?Me?Mo C.x?Mo?Me

3.2.7 离散程度测度指标中,受极端值影响最大的是 ( C ) A.平均差 B.标准差 C.全距

3.2.8 平均差与标准差的主要区别在于 ( B ) A.说明问题的角度不同 B.对离差的数学处理方法不同 C.计算对象不同

3.2.9 标准差系数消除了 ( B ) A.总体单位数多少的影响 B.平均数大小和计量单位的影响 C.离散程度的影响

15

学号: 班级: 姓名:

3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( B ) A.两个总体的标准差应该相等 B.两个总体的平均数应该相等 C.两个总体的离差平方和应该相等

3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是 ( B ) A.平均差 B.标准差 C.离散系数

3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的 ( A ) A.偏斜程度 B.离散程度 C.集中程度

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)

3.3. 1 描述数据分布集中趋势的指标有 ( ABCD ) A.算术平均数 B.调和平均数 C.众数 D.中位数

3.3.2 描述数据分布离散趋势的指标有 ( ABCD ) A.全距 B.平均差 C.标准差 D.离散系数

3.3.3 算术平均数所具有的数学性质有 ( AC ) A.各个变量值与其平均数离差之和等于零

B.各个变量值与其平均数离差的绝对值之和等于零 C.各个变量值与其平均数离差的平方和为最小值 D.各个变量值与其平均数离差的平方和为最大值

3.3.4 下列不适于计算算术平均数的数据类型有 ( AB ) A.分类数据 B.顺序数据 C.数值型数据 D.截面数据

3.3.5 加权算术平均数中,各个变量值的权数要起作用必须具备两个条件 ( AD ) A.各个变量值之间有差异 B.各个变量值的权数相等 C.各个变量值相等 D.各个变量值的权数有差异

3.3.6 下列对众数的解释说明中,正确的有 ( ABCD ) A.众数是指一组数据中出现次数最多的变量值 B.一组数据中可能有多个众数,也可能没有众数 C.众数不受极端值的影响 D.众数缺乏灵敏性

3.3.7 下列对中位数的解释说明中,正确的有 ( ACD ) A.中位数不受分布数列的极大或极小值影响 B.中位数是指一组数据中出现次数最多的变量值 C.中位数缺乏灵敏性

D.当次数分布偏态时,中位数的代表性会受到影响

3.3.8 以SKp表示根据皮尔逊测度法计算的偏态系数,下列陈述中正确的是 ( ABCD ) A.经验证明,在适度偏态的情况下,?3?SKp?3 B.当x?Mo,SKp?0时,数据分布呈对称分布 C.当x?Mo,SKp?0时,数据分布呈右(正)偏分布 D.当x?Mo,SKp?0时,数据分布呈左(负)偏分布

3.3.9 下列关于四分位差的解释说明中,正确的有 ( ABCD ) A.四分位差就是上四分位数与下四分位数之差的简单算术平均数 B.四分位差越小,表明中位数的代表性越好 C.四分位差越大,表明中位数的代表性越差 D.四分位差可以避免受极端值的影响

3.3.10 比较不同总体平均数的代表性时,应该使用离散系数,因为 ( AB ) A.离散系数可以消除平均数大小的影响

16

学号: 班级: 姓名:

B.离散系数可以消除计量单位的影响

C.离散系数可以消除总体单位数多少的影响

D.离散系数可以消除变量值之间差异程度的影响

四、判断改错题(在你认为正确的题后括号内打“ √ ”。在你认为错误的地方和题后括号内打“× ”,并在其正下方写出正确的答案来)

3.4.1 算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。

( ×,不适用于分类数据和顺序数据 )

3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。 ( √ ) 3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。 ( √ ) 3.4.4 各变量值与其算术平均数的离差平方和为最小值。 ( √ ) 3.4.5 众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。 ( ×,集中趋势 )

3.4.6 对于一组数据,可能存在一个或多个众数,也可能不存在众数。 ( √ ) 3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。 (×,四等分的三个变量值)

3.4.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。 ( ×,9个变量值 )

3.4.9 在左偏分布中,众数最小,中位数适中,算术平均数最大,即Mo?Me?x。 ( ×,右偏分布 )

3.4.10 数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。 ( √ ) 3.4.11 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。 ( √ ) 3.4.12 偏态和峰态是对分布集中程度的测度。 ( ×,分布形状 ) 3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为平缓,则为低峰度。 ( √ )

3.4.14 如果以?表示峰度系数,当??0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。 ( ×,??0 )

五、简答题

3.5.1 什么是集中趋势?测度集中趋势的主要指标有哪些? 答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。

3.5.2 什么是调和平均数?调和平均数与算术平均数有何关系? 答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数。

从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。

17

学号: 班级: 姓名:

3.5.3 什么是几何平均数?其应用场合是什么?

答:几何平均数也称几何均值,它是n个变量值乘积的n次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。

3.5.4 什么是离散趋势?测度离散趋势的主要指标有哪些?

答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。

描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。

3.5.5 什么是偏度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态? 答:偏度是描述数据分布对称性的特征值。

峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。

根据皮尔逊测度法测算的偏态系数SKp,经验证明,在适度偏态的情况下,?3?SKp?3。当x?Mo,SKp?0时,数据分布呈对称分布;当x?Mo,SKp?0时,数据分布呈右(正)偏分布;当x?Mo,SKp?0时,数据分布呈左(负)偏分布。

根据中心矩法计算的偏态系数?,当??0时,数据分布呈对称分布形态;??0,数据分布呈负(左)偏态;??0,数据分布呈正(右)偏态;?值越接近于0,数据分布越趋于对称,?的绝对值越大,数据分布越偏斜。

根据峰度系数?,当??0时,分布曲线为正态曲线;当??0时,分布曲线为高峰曲线,表明变量值的差异程度小,平均数代表性好;当??0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。

六、计算题

3.6.1 2007年某企业精加工车间20名工人加工A零件的产量资料如下:

按日产量分组(件) 28 29 30 31 32 合 计 工人人数(人) 2 4 7 5 2 20 要求:试计算20名工人日产量的算术平均数、众数和中位数。 解:

(1)20名工人日产量的算数平均数:

?xf28?2?29?4?30?7?31?5?32?2601x????30.05(件/人)。

?f2020(2)从该企业的产量资料表可以看出,20名工人日产量的众数为30件;

18

学号: 班级: 姓名:

(3)20名工人日产量的中位数: 工人总数的二分之一是10人,从小到大累计人数首次超过10的组所对应的日产量为30件,则中位数为30件。

3.6.2 2007年某管理局所属22个企业的工人工资及工人比重资料如下: 按月工资分组(元/人) 1000以下 1000~2000 2000~3000 3000以上 合 计 企业数 3 7 8 4 22 各组工人占工人总数的比重(%) 15 35 32 18 100 要求:试计算该管理局工人的月平均工资。 解:

根据已知资料,列表计算如下:

某管理局工人的月平均工资计算表

按月工资分组(元/人) 1000以下 1000~2000 2000~3000 3000以上 合 计 组中值x 500 1500 2500 3500 —— 各组工人占工人总数的比重(%)15 35 32 18 100 f/?f x?(f/?f) 7500 52500 80000 63000 203000 该管理局工人的月平均工资为: x??xii?1kfi?f?500?15?1500?35?2500?32?3500?18203000??2030(元/人)。

10020

3.6.3 某工业局所属生产同一产品企业19个,2007年按工人劳动生产率高低分组如下:

按劳动生产率分组(吨/人) 50~60 60~70 70~80 80~90 90~100 合 计 企业数 8 5 3 2 1 19 各组工人数(人) 2400 1600 1200 1200 1100 7500 要求:试计算该工业局工人平均劳动生产率。 解:

根据已知资料,列表计算如下:

该工业局工人平均劳动生产率计算表 按劳动生产率分组(吨/人) 50~60

组中值x 55 19

各组工人数(人)f 2400 xf 132000

学号: 班级: 姓名:

60~70 70~80 80~90 90~100 合 计 65 75 85 95 —— 1600 1200 1200 1100 7500 104000 90000 102000 104500 532500 该工业局工人平均劳动生产率为: ?xf55?2400?65?1600?75?1200?85?1200?95?1100532500x????71(吨/人)。

?f75007500

3.6.4 某企业生产A种产品需要经过三个连续作业的车间才能完成。2008年1月第一车间粗加工产品的合格率为98%,第二车间精加工产品的合格率为95%,第三车间最后装配的合格率为92%。

要求:试计算该产品的企业平均合格率。 解:

该产品的企业平均合格率为:

Gm?n?xi?1ni?398%?95%?92%?94.97% 。

3.6.5 根据抽样调查结果,2008年2月某市居民通讯支出额的众数为120元,算术平均数为150元。

要求:试根据算术平均数、中位数及众数之间的关系,计算中位数的近似值,并说明该市居民通讯支出额分布的态势。

解:

(1)该市居民通讯支出额的中位数近似值为:

M?2x120?2?150。 M?o??140(元)

e33(2)由120?140?150显然有Mo?Me?x,即该市居民通讯支出额呈尾巴拖在右边的正偏态分布,也即右偏分布。

3.6.6 某投资银行的年利率按复利计算,1996~2007年的年利率分组资料如下:

按年利率分组(%) 6 8 9 12 15 合 计 年数(年) 2 4 3 2 1 12 要求:试计算1996~2007年的平均年利率。 解:

1996~2007年的平均年利率为: xG??f?xi?1kifi?100%?12106%2?108%4?109%3?112%2?115%?100%?9.14%

3.6.7 根据500户抽样调查结果,2007年某市城市居民家庭按月人均可支配收入分组的资料如下:

20

学号: 班级: 姓名:

按月人均可支配收入分组(元/人) 各组家庭户数占总户数的比重(%) 1000以下 1000~2000 2000~3000 3000~4000 4000以上 合 计 15 28 32 18 7 100 要求:根据上述资料计算2007年该市居民家庭月人均可支配收入及其平均差和标准差。 解:

(1)2007年该市居民家庭月人均可支配收入为: x??xii?1kfi?f?500?15?1500?28?2500?32?3500?18?4500?7?2240(元/人)。

100(2)相关计算过程如下:

2007年该市居民家庭月人均可支配收入计算表 各组家庭户数占按月人均可支配收入分组(元/人) 组中值x 总户数的比重(%)x?x x?x f?2f(x?x)ff/?f15 28 32 18 7 ?f 1000以下 1000~2000 2000~3000 3000~4000 4000以上 合 计 500 1500 2500 3500 4500 —— 1740 740 260 1260 2260 6260 26100 20720 8320 22680 15820 93640 45414000 15332800 2163200 28576800 35753200 127240000 100 人均可支配收入的平均差为: AD??x?xf?f2?1740?15???2260?793640==936.40(元)

100100(3)标准差为:

S??(x?x)ii?1k?fi50017402?15???22602?7500127240000500??????1129.14(元) fi499100499100499

3.6.8 2006年某校学生会为了解在校大学生的消费支出情况,从全校本科学生中按性别随机各抽取100名,其月消费支出额分组资料如下:

21

学号: 班级: 姓名:

月消费支出额(元) 200以下 200~300 300~400 400~500 500~600 600~700 700以上 合 计 男 生(人) 6 9 16 24 23 14 8 100 女 生(人) 5 12 25 24 18 10 6 100 要求:根据表中资料

(1)分别计算男女学生的平均月消费支出;

(2)分别计算男女学生月消费支出的中位数和众数;

(3)分别计算男女学生月消费支出的下四分位数和上四分位数;

(4) 分别计算男女学生月消费支出的平均差、标准差、离散系数,并比较其平均月消费支出的代表性;

(5)分别计算男女学生月消费支出分布的偏态系数和峰度系数,判断其分布形态。 解:

(1)男学生的平均月消费支出为:

?xf150?6???750?847300x????473(元);

?f100100同理得到女学生的平均月消费支出为442元。 (2)男学生月消费支出的中位数为:

对男学生而言,?f/2=50,首次超过50的累计次数为55,其所对应的组为400~500元,故该组为中位数所在的组;该组L=400,fm=24,Sm?1=31,d=100,代入公式求得:

Me?L?(?f/2)?Sm?1fm?d?400?50?31 ; ?100?479(元)24同理可得到女学生月消费支出的中位数为433元; 男学生月消费支出的众数为:

Δ124?16Mo?L??d??400??100?489(元);

Δ1?Δ2(24?16)?(24?23)同理得到女学生月消费支出的众数为393元。

(3)男学生月消费支出的下四分位数为:

对男生而言,QL的位置=25,由小到大累计次数首次超过25的组是300~400,该组即为下四分位数所在的组,SQL?1=15,fQL=16,dQL=100,代入公式求得:

?f QL?LQL?4?SQL?1fQL?dQL?300?25?15?10?01636元)2.5( ;

同理得到女学生月消费支出的下四分位数为332元。

22

学号: 班级: 姓名:

男学生月消费支出的上四分位数为:

3?fQU?LQU?4?SQU?1fQU75?55?100?587(元) 23?dQU?500?同理得到女学生月消费支出的上四分位数为550元 (4)男学生月消费支出的平均差为:

AD??x?xf?fx?150?473?6???750?473?8100?129(元)

同理可求得女生月消费支出的平均差为121元; 男生月消费支出的标准差为:

(x?x)f?2i?1kiS=?fi?1k??150?473?2?6????750?473??8100?12?159.45(元)

i?1同理求得女生月消费支出的标准差为152.21元; 男生月消费支出的离散系数为:

S159.45??0.3371 x473同理可求得女生月消费支出的离散系数为0.3444,前者小于后者,所以男学生的平均消费支出代表性更强。

VS?(5)三阶中心矩m3?(X?X)??f3f ;四阶中心矩m4?(X?X)??f4f

偏度系数:??m3?3 ;峰度系数:??m4?4?3

根据公式计算得男生月消费支出的偏度为-0.1879,呈轻度左偏分布;峰度为-0.5550,呈轻度低峰分布;

对女生而言,月消费支出偏度为0.1727,呈轻度右偏分布;峰度为-0.5015,呈轻度低峰分布。

3.6.9 2007年第一季度某种药品在三个地区的销售额资料如下: 月 份 1 2 3 合 计 单价(元/合) 15 14 12 —— 销售额(万元) 甲地区 30 32 36 98 乙地区 45 35 42 122 丙地区 24 28 30 82 要求:根据上述资料, (1)分别计算甲、乙、丙三个地区第一季度该种药品的平均价格; (2)分别计算第一季度各月该种药品的平均价格; (3)计算该种药品第一季度总的平均价格。 解:

(1)甲地区第一季度该种药品的平均价格为:

23

学号: 班级: 姓名:

Hm??m?xi?1ki?1kikimi?980000?13.45(元/盒)

300000320000360000??151412同理得到乙地区和丙地区的平均价格分别为:13.56元/盒和13.44元/盒。

(2)1月份的平均价格为:

Hm??m?xi?1ki?1kiimi?300000?450000?240000990000; ??15(元)300000?450000?2400006600015同理可得2月份和3月份的平均价格分别为14元/盒和12元/盒。 (3)第一季度总的平均价格为: Hm??mi?1kimi?i?1xi?980000?1220000?820000?13.49(元/盒)

300000?450000?240000360000?420000?300000???1512

3.6.10 2007年5月,某高等职业技术学院200个班的女生比重及学生人数资料如下: (1)已知女生比重、班数及各组学生总人数: 女生比重(%) 10~20 20~30 30~40 40~50 50以上 合 计 班 数(个) 30 35 55 45 35 200 各组学生总人数(人) 1560 1680 2800 2080 1760 9880 (2)已知女生比重、班数及各组女生人数: 女生比重(%) 10~20 20~30 30~40 40~50 50以上 合 计 班 数(个) 30 35 55 45 35 200 各组女生人数(人) 234 420 980 936 968 3538 要求:根据上述两组资料分别计算全校女生的比重,并比较两种计算方法的特点。 解:

(1)这种情况下使用算术加权平均法,女生比重为:

?xf0.15?1560???0.55?17603538x????0.3581

?f98809880(2)这种情况下使用调和加权平均法,女生比重为:

24

学号: 班级: 姓名:

Hm??mi?1kkimi?i?1xi?3538234968???0.150.55?3538?0.3581 9880两种计算方法的结果完全一致。从数学定义角度看,算术平均数与调和平均数是不一样的;但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。

第四章 抽样分布

一、填空题

4.1.1 按随机变量取值的特点不同,通常把随机变量分为两类,即 离散型随机变量 和 连续型随机变量 。

4.1.2 设(X1,X2,L,Xn)是抽自正态总体N(m,s2)的一个容量为n的简单随机样本(重复

骣s2÷1nm,÷抽样),则X=?Xi服从N?。 ?÷?÷nni=1桫21n1n2X~Nm,s4.1.3 设(),X=?Xi是样本均值,S=?(Xi-X)是样本方

n-1i=1ni=1(n-1)S2X-mX-m22差,则统计量:Z= ~N(0,1);t=~t(n-1);c=~c(n-1)。2ssnSn224.1.4 设(X1,X2,L,Xn)是正态总体N(m,s)的一个简单随机样本,则E(X)=m,

D(X)= s2。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

4.2.1 设X的分布列为 X p -1 0.35 0 0.20 1 0.45 则F(3)的值是 ( B )

A.0 B.1 C.0.55

24.2.2 若X1,X2,?,Xn是来自正态总体N(m,s)的一个简单随机样本,则统计量

1c=2s2?(x-x)ii=1n2的自由度为 ( A )

A.n-1 B.n-2 C.n

22

4.2.3 若X1,X2,?,Xn是来自总体N(m,s)的样本,其中s未知,且

21nX-m,则统计量的自由度为 ( B ) S=X-XT=()?in-1i=1sn A.n B.n-1 C.n-2 2 25

学号: 班级: 姓名:

5.3.9 用样本成数推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布 ( ABC )

A.np35 B.n(1-p) 5 C.n330 D.p31%

5.3.10 在假设检验中,a与b的关系是 ( BD ) A.a与b绝对不可能同时减小 B.在其他条件不变的情况下,增大a,必然会减小b C.只能控制a,不能控制b D.增加样本容量可以同时减小a与b

5.3.11 关于零假设和备择假设,正确的是 ( BCD ) A.零假设和备择假设可以交换位置 B.零假设表明结果的差异由随机因素引起 C.备择假设是研究者要证明的假设 D.零假设是受到保护的假设

5.3.12 关于P值,正确的说法是 ( AC ) A.P值是最小的显著性水平 B.P值是最大的显著性水平

C.P值越小,拒绝零假设的证据越强 D.P值越大,拒绝零假设的证据越强

四、判断改错题(在你认为正确的题后括号内打“ √ ”。在你认为错误的地方和题后括号内打“ × ”,并在其正下方写出正确的答案来)

5.4.1 对两个总体方差相等性进行检验,在a=0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。

(×,指原假设为真时拒绝原假设的概率,即犯第一类错误的概率不大于0.01。原假设或成

立,或不成立,时未知不确定的,不能说有多大概率为真。)

5.4.2 检验改革开放后城镇居民和农村居民收入的方差是否相等,检验统计量时服从自由度为(n-1)的c2分布。

(×,采用F检验,即检验统计量F服从自由度为(n1-1,n2-1)的F分布。)

5.4.3 在假设检验问题中,显著性水平a是原假设H0正确时,经检验接受H0的概率。 (×,在假设检验问题中,显著性水平a是犯第一类错误的概率,即原假设H0成立,经检验拒绝H0的概率。)

5.4.4 设总体X具有期望和方差,X1,X2,X3是X的一个样本,则

1111且h1较h2有效。( √ ) (X1+X2+X3)与h2=X1+X2+X3都是X的无偏估计,

36325.4.5 接受原假设H0,不一定H0是正确的。 ( √ ) 5.4.6 总体X不服从正态分布时,检验均值一定不能用Z检验。 (×,若总体X不服从

2正态分布,但D(X)=s已知,且样本容量很大时(n330),也可用Z检验。) h1=五、简答题

5.5.1 未知参数q的点估计与区间估计主要有哪些不同之处?

答:⑴ 定义不同。点估计就是用一个统计量T(X1,?,Xn)作为未知参数q的估计;而区间估计是指用两个统计量q(X1,?,Xn),q(X1,?,Xn)构造一个随机区间(q,q),该区间以1-a的概率包含未知参数q。

⑵ 估计可靠性的刻画不同。点估计没有给出估计的可靠性,而区间估计在给出随机区间的同时,也给出这一区间包含未知参数的概率。

31

学号: 班级: 姓名:

5.5.2 若总体X的分布未知,而方差s已知,可否选用统计量Z=间估计?

答:当样本量n很大时(n330)是可以的,因由中心极限定理,知样本均值X渐近正态分

2

x-m对均值m进行区sn骣s2÷X-mm,÷布,即X~N?,从而Z=~N(0,1),故可用Z对进行区间估计。 ?÷?桫n÷sn

5.5.3 有人认为:假设检验中,给定检验水平a,对于检验假设H0,犯弃真错误的概率为

a,则犯采伪错误的概率为1-a,你说对吗?

答:如果犯弃真错误的概率为a,犯采伪错误的概率为b,一般情况下,b?1a,因为

“采伪”与“弃真”并不一定是对立事件。在假设检验中,我们无论作出接受还是拒绝原假设的判断,都是依据小概率事件在一次试验中几乎不可能发生的原理,既然是几乎,当然就有例外,如果例外,就犯错误。

5.5.4 正态分布的主要特征有哪些?

答:(1)图形呈钟型、中间高、两头低、左右对称;(2)最高处对应于x轴的值就是均数(位置参数);(3)标准差决定曲线的形状(形状参数);(4)曲线下面积为1;(5)是一个正态分布簇,经Z变换可转换为标准正态分布;(6)其他分布(如t分布、F分布、c2分布、二项分布、Poisson分布等)的基础。

5.5.5 简述评价估计量好坏的标准。

答:一般将同时满足以下三条标准的估计量称为优良估计量。

?=q,称q?为q的无偏估计量。 ⑴ 无偏性,即Eq?=q,Eq?=q,且Dq?

⑶ 一致性,即当任意给定e>0时,有

()()()()()?-q

5.5.6 怎样确定假设检验问题的零假设和备择假设?

答:通常零假设表示结果的差异是随机因素引起,而不是系统性或结构性因素引起;备择假设是研究者要证明的假设,要认为其正确必须有显著证据才能被人接受;零假设是受到保护的假设。

5.5.7 临界值检验法有那些步骤?

答:(1)确定零假设和备择假设,(2)确定检验统计量及其分布,(3)根据样本观测数据计算检验统计量的观测值,(4)根据检验统计量的分布和显著性水平确定检验的临界值,进而确定拒绝域,(5)判断检验统计量的观测值是否落于拒绝域,是,则拒绝零假设,否则,不能拒绝。

5.5.8 怎样理解假设检验问题的P值?它与显著性水平什么关系?

答:P值是零假设为真时,检验统计量得到至小象观测值那么极端情形的概率,通常称为观测的显著性水平,是零假设能被拒绝的最小显著性水平。

32

学号: 班级: 姓名:

六、计算题

5.6.1 在一项新的安全计划制定出来之前,某厂每天的平均岗位事故数为4.5。为了确定这项安全计划在减少每天岗位事故数方面是否有效,在制定新的安全计划后随机取了一个120天的样本,并记录下每天的事故数。得出的样本均值和标准差分别为:x=3.7,S=2.6。问:有无充分证据(在0.01显著性水平下)作结论说,该厂每天岗位事故数在制定新的安全计划后有所减少?

解:记m为该厂制定新的安全计划后每天岗位事故的均值,为了确定安全计划是否有效,需检验如下假设:

H0:m=4.5(即平均每天岗位事故数无变化) H1:m<4.5(即平均每天岗位事故数有变化)

已知 n=120 属于大样本,故X的抽样分布接近正态分布,有:

Z=X-m~N(0,1) sn3.7-4.5=-3.37 查表得Z0.01=-2.23

2.6120计算得:Z=Z

所下降。

5.6.2 羊毛制品,在处理前后分别抽样分析其含脂率如下: 处理前,xi:0.19,0.18,0.21,0.30,0.41,0.12,0.27

处理后,yi:0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12

假定处理前后的含脂率都服从正态分布,且标准差不变,试问在处理前后含脂率的平均值是否有显著变化?(a=0.05)

解:检验假设H0:m1=m2,H1:m1 m2 检验量T=x-y(n1-1)S12+(n2-1)S22x=0.24,y=0.13,S12=0.0078,S=0.0034,22n1n2(n1+n2-2)~t(n1+n2-2)

n1+n2n1=7n2=8

经计算得:

将这些数据代如T得,T=2.68

当a=0.05时,查t分布表得

ta2(13)=t0.025(13)=2.16

由于T=2.68>t0.025(13)=2.16

33

学号: 班级: 姓名:

所以,拒绝原假设H0,即认为处理前后含脂率的平均值有显著变化,但由于T>0,x>y,因此可认为处理后含脂率的平均值显著下降。

5.6.3 为了了解各个省份男女人口比例,某机构进行了一项调查。其中从云南省随机抽取了4000人,结果男性比例为0.52。请在0.05的显著性水平下检验云南省男性比例是否显著不等于0.5。如果样本量为2000人,结果仍为男性比例为0.52,在同样的显著性水平下,你的检验结论又是什么?你是怎样理解52:48这个男女比例的?

解:检验假设H0:p=p0=0.5,H1:p p0

已知 n=4000 属于大样本,故p的抽样分布接近正态分布,有:

Z=p-p0p0(1-p0)n~N(0,1)

计算得:Z=0.52-0.50.5?(10.5)4000=2.35

查表得Z0.025=1.96

Z>Z0.025 说明有显著证据表明该省男女比例不等于0.5。

当样本量为2000时,用同样的方法可计算出Z=1.79,因Z

显著性检验结果受检验水平a和样本量n的影响,而检验结果是否显著不等于是否重要,男女比例为52:48是否说明比例失调属于社会问题。

5.6.4 北京市劳动和社会保障局公布的2004年的北京市职工年平均工资为28348元。北京市某大学教师想检验自己学校具有讲师职称的老师的平均工资与北京市平均工资有无显著差别,他随机抽取了36名大学职称为讲师的老师的年工资作为样本,结果显示:36人的年平均工资为29040元,标准差为2300元。请检验该大学具有讲师职称的教师的年平均工资与北京市职工年平均工资水平是否有显著差别。(a=0.05)

解:H0:m=28348(即两者的年平均工资水平无显著差别)

H1:m128348(即两者的年平均工资水平有显著差别)

已知 n=36 属于大样本,故X的抽样分布接近正态分布,有:Z=X-m~N(0,1) sn计算得:Z=29040-28348=1.81

230036 34

学号: 班级: 姓名:

查表得Z0.025=1.96

Z

年平均工资水平有显著差别。

5.6.5 某机构对两个大城市居民的消费习惯差异感兴趣,为了了解各项指标的差异进行了抽样调查,其中一项指标是两个城市每天乘小汽车的里程数的差异。从城市A抽取50个居民构成一个简单随机样本,结果显示均值为每天12.5公里,标准差为每天4.3公里;与A独立地从B城市抽取100个居民构成另一个简单随机样本,均值是每天11.2公里,标准差是每天3.8公里。

22请检验两个城市居民在使用小汽车方面是否有显著差异(假定sA)。(a=05.=sB)

解:检验假设H0:mA=mB,H1:mA mB 检验量 Z=xA-xBss+nAnBxA=12.5,xB=11.2,2A2B~N(0,1)

经计算得:

22sA=SA=4.32,nA=50nB=100s=S=3.8,2B2B2

将这些数据代如Z得,Z=1.81

当a=0.05时,查Z分布表得

za/2=z0.025=1.96,因为Z

方面有显著差异。

5.6.6 某公司对本公司的产品在电视上打了一段时间的广告,管理者想知道广告是否有明显的效果。某市场研究公司对该问题进行了研究,公司调查了10个人在公告播出前后的购买潜力等级分值,分数越高说明购买潜力越高。

个体 1 2 3 4 5 6 7 8 9 10 广告后 6 6 7 4 3 9 7 6 5 6 广告前 5 4 7 3 5 8 5 6 4 6

请建立该研究问题的零假设和备择假设,并对检验问题在0.05的显著性水平下进行检验。

解:零假设:m,备择假设:m 后£m后>m前前t-检验: 成对双样本均值分析

平均 方差 观测值 泊松相关系数 假设平均差

df t Stat P(T<=t) 单尾 t 单尾临界

广告后 5.9 2.766666667

10 0.728601233

0 9 1.616447718 0.070226484 1.833113856

35

广告前 5.3 2.233333333

10

本文来源:https://www.bwwdw.com/article/erbg.html

Top