第三章 练习题参考答案

更新时间:2023-10-26 19:36:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第三章 数据分布特征的描述

一、填空题

3.1.1 集中趋势 是指一组数据向其中心值靠拢的倾向。

3.1.2 加权算术平均数受两个重要因素的影响,一个是 各组变量值 ;另一个是各组变量值出现的 频数或频率 。

3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法 。

3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权调和平均法 。

3.1.5 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 众数 是指一组数据中出现次数最多的变量值。

3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。 3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.9 在数据分布呈 完全对称的正态分布 时,算术平均数、众数和中位数三者相等。 3.1.10 异众比率是指 非众数组 的频数占总频数的比率。

3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。

3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以?2表示。 3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布 偏斜程度 的一种方法。

3.1.15 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数

据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( B )

A.数值平均数 B.位置平均数 C.离散系数

3.2.2 算术平均数反映的是数据分布的什么特征 ( A )

A.集中趋势 B.离散趋势 C.偏态趋势

3.2.3 根据算术平均数的性质,下列表达式正确的是 ( A )

A.?(x?x)f?0 B.

?x-xf=0 C.?(x-x)2f=0

3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( B )

A.算术平均法 B.几何平均法 C.调和平均法

3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定

( A )

A.各组数据在组内是均匀分布的 B.各组次数相等 C.各组数据之间没有差异

3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( A )

A.Mo?Me?x B.x?Me?Mo C.x?Mo?Me

3.2.7 离散程度测度指标中,受极端值影响最大的是 ( C )

A.平均差 B.标准差 C.全距 3.2.8 平均差与标准差的主要区别在于 ( B )

A.说明问题的角度不同 B.对离差的数学处理方法不同 C.计算对象不同 3.2.9 标准差系数消除了 ( B )

A.总体单位数多少的影响 B.平均数大小和计量单位的影响 C.离散程度的影响

3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( B )

A.两个总体的标准差应该相等 B.两个总体的平均数应该相等 C.两个总体的离差平方和应该相等

3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是 ( B )

A.平均差 B.标准差 C.离散系数

3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的 ( A )

A.偏斜程度 B.离散程度 C.集中程度

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)

3.3. 1 描述数据分布集中趋势的指标有 ( ABCD )

A.算术平均数 B.调和平均数 C.众数 D.中位数 3.3.2 描述数据分布离散趋势的指标有 ( ABCD )

A.全距 B.平均差 C.标准差 D.离散系数 3.3.3 算术平均数所具有的数学性质有 ( AC )

A.各个变量值与其平均数离差之和等于零

B.各个变量值与其平均数离差的绝对值之和等于零 C.各个变量值与其平均数离差的平方和为最小值 D.各个变量值与其平均数离差的平方和为最大值

3.3.4 下列不适于计算算术平均数的数据类型有 ( AB )

A.分类数据 B.顺序数据 C.数值型数据 D.截面数据

3.3.5 加权算术平均数中,各个变量值的权数要起作用必须具备两个条件 ( AD )

A.各个变量值之间有差异 B.各个变量值的权数相等 C.各个变量值相等 D.各个变量值的权数有差异

3.3.6 下列对众数的解释说明中,正确的有

( ABCD )

A.众数是指一组数据中出现次数最多的变量值 B.一组数据中可能有多个众数,也可能没有众数 C.众数不受极端值的影响 D.众数缺乏灵敏性

3.3.7 下列对中位数的解释说明中,正确的有 ( ACD )

A.中位数不受分布数列的极大或极小值影响 B.中位数是指一组数据中出现次数最多的变量值 C.中位数缺乏灵敏性

D.当次数分布偏态时,中位数的代表性会受到影响

3.3.8 以SKp表示根据皮尔逊测度法计算的偏态系数,下列陈述中正确的是 ( ABCD )

A.经验证明,在适度偏态的情况下,?3?SKp?3

B.当x?Mo,SKp?0时,数据分布呈对称分布 C.当x?Mo,SKp?0时,数据分布呈右(正)偏分布 D.当x?Mo,SKp?0时,数据分布呈左(负)偏分布

3.3.9 下列关于四分位差的解释说明中,正确的有 ( ABCD )

A.四分位差就是上四分位数与下四分位数之差的简单算术平均数 B.四分位差越小,表明中位数的代表性越好 C.四分位差越大,表明中位数的代表性越差 D.四分位差可以避免受极端值的影响

3.3.10 比较不同总体平均数的代表性时,应该使用离散系数,因为 ( AB )

A.离散系数可以消除平均数大小的影响 B.离散系数可以消除计量单位的影响

C.离散系数可以消除总体单位数多少的影响

D.离散系数可以消除变量值之间差异程度的影响

四、判断改错题(在你认为正确的题后括号内打“ √ ”。在你认为错误的地方和题后括号内打“× ”,并在其正下方写出正确的答案来)

3.4.1 算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。

( ×,不适用于分类数据和顺序数据 )

3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。 ( √ )

3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。 ( √ )

3.4.4 各变量值与其算术平均数的离差平方和为最小值。 ( √ )

3.4.5 众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。 ( ×,集中趋势 )

3.4.6 对于一组数据,可能存在一个或多个众数,也可能不存在众数。 ( √ )

3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。 (×,四等分的三个变量值)

3.4.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。 ( ×,9个变量值 )

3.4.9 在左偏分布中,众数最小,中位数适中,算术平均数最大,即Mo?Me?x。 ( ×,右偏分布 )

3.4.10 数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。 ( √ )

3.4.11 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。 ( √ )

3.4.12 偏态和峰态是对分布集中程度的测度。 ( ×,分布形状 ) 3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为平缓,则为低峰度。 ( √ )

3.4.14 如果以?表示峰度系数,当??0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。 ( ×,??0 )

五、简答题

3.5.1 什么是集中趋势?测度集中趋势的主要指标有哪些? 答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。

3.5.2 什么是调和平均数?调和平均数与算术平均数有何关系? 答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数。

从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。

3.5.3 什么是几何平均数?其应用场合是什么?

答:几何平均数也称几何均值,它是n个变量值乘积的n次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。

3.5.4 什么是离散趋势?测度离散趋势的主要指标有哪些?

答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。 描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。

3.5.5 什么是偏度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态? 答:偏度是描述数据分布对称性的特征值。

峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。

根据皮尔逊测度法测算的偏态系数SKp,经验证明,在适度偏态的情况下,

?3?SKp?3。当x?Mo,SKp?0时,数据分布呈对称分布;当x?Mo,SKp?0时,数据分布呈右(正)偏分布;当x?Mo,SKp?0时,数据分布呈左(负)偏分布。

根据中心矩法计算的偏态系数?,当??0时,数据分布呈对称分布形态;??0,数据分布呈负(左)偏态;??0,数据分布呈正(右)偏态;?值越接近于0,数据分布越趋于对称,?的绝对值越大,数据分布越偏斜。

根据峰度系数?,当??0时,分布曲线为正态曲线;当??0时,分布曲线为高峰曲线,表明变量值的差异程度小,平均数代表性好;当??0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。

六、计算题

3.6.1 2007年某企业精加工车间20名工人加工A零件的产量资料如下:

按日产量分组(件) 28 29 30 31 32 合 计 工人人数(人) 2 4 7 5 2 20 要求:试计算20名工人日产量的算术平均数、众数和中位数。 解:

(1)20名工人日产量的算数平均数:

?xf28?2?29?4?30?7?31?5?32?2601x????30.05(件/人)。

?f2020(2)从该企业的产量资料表可以看出,20名工人日产量的众数为30件; (3)20名工人日产量的中位数:

工人总数的二分之一是10人,从小到大累计人数首次超过10的组所对应的日产量为30件,则中位数为30件。

3.6.2 2007年某管理局所属22个企业的工人工资及工人比重资料如下: 按月工资分组(元/人) 1000以下 1000~2000 2000~3000 3000以上 合 计 企业数 3 7 8 4 22 各组工人占工人总数的比重(%) 15 35 32 18 100 要求:试计算该管理局工人的月平均工资。

本文来源:https://www.bwwdw.com/article/7ak2.html

Top