统计学课后答案

更新时间:2024-07-09 08:25:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章:数据与统计学

思考与练习:

思考题:

1.什么是统计学?怎样理解统计学与统计数据的关系?

答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。

2.试举出日常生活或工作中统计数据及其规律性的例子。

3.简要说明统计数据的来源

答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。

4.获取直接统计数据的渠道主要有哪些?

5.简要说明抽样误差和非抽样误差 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;

(2)研究变量:装满的油漆罐的质量;

(3)样本:最近的一个集装箱内的50罐油漆;

(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:

(1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。

第二章、统计数据的描述

思考与练习

思考题

1.描述次数分配表的编制过程 答:分二个步骤:

(1) 按照统计研究的目的,将数据按分组标志进行分组。

按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。

按数量标志进行分组,可分为单项式分组与组距式分组

单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则

(2) 将数据分配到各个组,统计各组的次数,编制次数分配表。

2.解释洛伦兹曲线及其用途

答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。

3.说明基尼系数的含义和用途

4.一组数据的分布特征可以从哪几个方面进行测度?

答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

5.怎样理解均值在统计中的地位?

答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分, 具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。

6.对于比率数据的平均,为什么采用几何平均?

答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采用几何平均。

7.简述众数、中位数和均值的特点和应用场合。

答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提

取的信息最充分,但受极端数据的影响。

8.标准差和方差反映数据的什么特征?

9.举出均值和标准差应用的例子。

10.为什么要计算离散系数? 答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。

11.描述茎叶图和箱线图的画法,并说明它们的用途。

练习题

1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

B D A B C D B B A C

E A D A B A E A D B

C C B C C C C C B C

C B C D E B C D C E

A C C E D C A E C D

D D A A B D D A A B

C E E B C E C B E C

B C D D C C B D D C

A E C D B E A D C B

E E B C C B E C B C

(1) 指出上面的数据属于什么类型;

(2) 用Excel制作一张频数分布表;

(3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级 家庭数(频数) A B C D E 合计

14 21 32 18 15 100

频率% 14 21 32 18 15 100

(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。即得到如下的条形图:

EDCBA02040服务质量等级评价的频数分布 频率%服务质量等级评价的频数分布 家庭数(频数)

2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):

152 105 117 97

124 119 108 88

129 114 105 123

116 115 110 115

100 87 107 119

103 103 137 138

92 118 120 112

95 142 136 146

127 135 117 113

104 125 108 126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组,

全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;

为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列; 将各组企业数除以企业总数40,得到各组频率,填入表中第三列;

在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下:

40个企业按产品销售收入分组表 按销售收入分组 企业数 频率 向上累积 (万元) (个) (%) 企业数 频率 100以下 100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 向下累积 企业数 频率 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计 40 100.0 — — — — (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表

按销售收入分组(万元) 企业数(个) 频率(%) 先进企业 良好企业 一般企业 落后企业 合计

11 11 9 9 40

27.5 27.5 22.5 22.5 100.0

3.某百货公司连续40天的商品销售额如下(单位:万元):

41 46 35 42

25 36 28 36

29 45 46 37

47 37 34 37

38 37 30 49

34 36 37 39

30 45 44 42

38 43 26 32

43 33 38 36

40 44 44 35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;

为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列; 将各组天数除以总天数40,得到各组频率,填入表中第三列; 得到频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元) 频数(天) 25~30 30~35 35~40 40~45 45~50 合计

4 6 15 9 6 40

频率(%) 10.0 15.0 37.5 22.5 15.0 100.0

直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.3)

40302010025303540

4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700 706 708 668 706 694 688 701 693 713

716 715 729 710 692 690 689 671 697 699

728 712 694 693 691 736 683 718 664 725

719 722 681 697 747 689 685 707 681 726

685 691 695 674 699 696 702 683 721 704

709 708 685 658 682 651 741 717 720 729

691 690 706 698 698 673 698 733 677 703

684 692 661 666 700 749 713 712 679 696

705 707 735 696 710 708 676 683 695 717

718 701 665 698 722 727 702 692 691 688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较。 解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。(见Excel练习题2.4)

(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下: (见Excel练习题2.4)

100只灯泡使用寿命非频数分布

按使用寿命分组(小时) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计

灯泡个数(只) 频率(%) 2 5 6 14 26 18 13 10 3 3 100

2 5 6 14 26 18 13 10 3 3 100

45某百货公司日商品销售额分组表 频数(天)某百货公司日商品销售额分组表 频率(%)30354045~~~~~50

制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图: (见Excel练习题2.4)

302520151050676600~696800~717000~737200~74065100只灯泡使用寿命非频数分布灯泡个数100只灯泡使用寿命非频数分布频率(%)

(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶, 得到茎叶图如下:

65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 将直方图与茎叶图对比,可见两图十分相似。

5.下面是北方某城市1~2月份各天气温的记录数据:

-3 -14 -6 -8 -14 -3

2 -18 -8 -6 -22 2

-4 -15 -12 -15 -13 -4

-7 -9 -16 -11 -9 -4

-11 -6 -19 -12 -6 -16

-1 -1 -15 -19 0 -1

7 0 -22 -25 -1 7

8 5 -25 -24 5 5

9 -4 -24 -18 -4 -6

-6 -9 -19 -17 -9 -5

-7 -3 -21 -24 -3

(1) 指出上面的数据属于什么类型; (2) 对上面的数据进行适当的分组;

(3) 绘制直方图,说明该城市气温分布的特点。 解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。

0~(2)分组如下:

由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34; 为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表; 北方某城市1~2月份各天气温

分组 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计

天数(天) 8 8 10 14 14 4 7 65

(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.5)

6.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:

年龄 % 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图; (2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)

(2)年龄分布的特点:自学考试人员年龄的分布为右偏。

7.下面是A、B两个班学生的数学考试成绩数据: A班:

44 66 73 76 85 B班:

35 55 61 71 85

39 56 62 73 90

40 56 63 74 91

44 57 64 74 91

44 57 66 79 94

48 57 68 81 95

51 58 68 82 96

52 59 70 83 100

52 60 70 83 100

54 61 71 84 100

57 66 74 77 85

59 67 74 77 86

60 69 74 77 86

61 70 75 78 90

61 70 75 78 92

62 71 75 79 92

63 72 75 80 92

63 73 75 80 93

65 73 76 82 96

(1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。 解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下: A班 数据个数 0 1 2 11 23 7 6 0 树 叶 4 97 97665332110 98877766555554443332100 6655200 632220 树茎 3 4 5 6 7 8 9 10 B班 树叶 59 0448 122456677789 011234688 00113449 123345 011456 000 数据个数 2 4 12 9 8 6 6 3 (2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。

8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。

月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安 1 2 3 4 5 6 7 8 9 10 11 12 49 41 47 50 55 57 69 74 68 47 66 56 70 68 50 39 56 54 70 79 66 59 59 57 76 71 77 72 68 73 82 82 71 75 82 82 57 57 68 67 63 57 74 71 67 53 77 65 77 75 81 75 71 74 81 73 71 72 78 82 72 80 80 84 83 87 86 84 81 80 72 75 79 83 81 79 75 82 84 78 75 78 78 82 65 65 58 61 58 72 84 74 77 76 71 71 51 41 49 46 41 43 58 57 55 45 53 52 67 67 74 70 58 42 62 55 65 65 73 72 资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。 解:箱线图如下:(特征请读者自己分析) 各城市相对湿度箱线图958575655545Min-Max3525%-75%北京长春南京郑州武汉广州成都昆明兰州西安Median value

9.某百货公司6月份各天的销售额数据如下(单位:万元):

257 276 297 252 238 310 240 236 265 278

271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295

(1)计算该百货公司日销售额的均值、中位数和四分位数; (2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9)

8223 x=n=30=274.1(万元)

或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:

?x

A30”,回车,得到均值也为274.1。

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:

272?2732Me==272.5(万元)

由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中

间位置(第8位)靠上四分之一的位置上,

由重新排序后的Excel表中第8位是261,第15位是272,从而:

273?2724QL=261+=261.25(万元)

同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的

位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:

273?2724QU=291-=290.75(万元)。

(2)未分组数据的标准差计算公式为:

?(x?x)ii?1302 s=n?1 利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,

并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9) 我们可以利用Excel表直接计算标准差:

点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:

s?21.17(万元)。(见Excel练习题2.9)

10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:

产品 名称 A B C 单位成本 (元) 15 20 30 总成本(元) 甲企业 2100 3000 1500 乙企业 3255 1500 1500 比较哪个企业的总平均成本高?并分析其原因。

解:设产品单位成本为 x,产量为f,则总成本为xf,

?xff由于:平均成本x=?总成本=总产量,而已知数据中缺产量f 的数据,

该产品成本xf又因个别产品产量f =该产品单位成本=x 从而 x=

?xfxf?x,于是得:

甲企业平均成本=

?xfxf?x?xfxf?x2100?3000?1500210030001500??2030=19.41(元)=15, 3255?1500?1500325515001500??152030=18.29(元)=,

乙企业平均成本=

对比可见,甲企业的总平均成本较高。

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计

企业数(个) 19 30 42 18 11 120

计算120家企业利润额的均值和标准差。

解:设各组平均利润为 x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计

于是,120家企业平均利润为:

组中值

企业数(个)

总利润

x 250 350 450 550 650 —

f 19 30 42 18 11 120

xf 4750 10500 18900 9900 7150 51200

?xff x=?51200=120= 426.67(万元);

分组数据的标准差计算公式为:

s= 2

手动计算须列表计算各组数据离差平方和(x-426.67)f,并求和,再代入计算公式: 列表计算如下

组中值

企业数(个)

?(x?x)f?f?12ix 250 350 450 550 650 合计

2

f 19 30 42 18 11 120

(x-426.67)f 593033.4891 176348.667 22860.1338 273785.2002 548639.1779 1614666.668

2

表格中(x-426.67)f的计算方法:

方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)* (a3-426.67)*b3,回车,得到该行的计算结果;

点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下

2

左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)f计算完毕;

于是得标准差:(见Excel练习题2.11)

s =点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。 方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11) 于是得标准差: s =116.4845(万元)。

12.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间? 解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组: 因为女生的离散系数为

?(x?x)f?f?12i1614666.668120?1=116.48(万元)=。

s5V=x=50=0.1

男生体重的离散系数为

s5V=x=60=0.08

对比可知女生的体重差异较大。

60公斤5公斤 (2) 男生:x=2.2公斤=27.27(磅),s =2.2公斤=2.27(磅); 50公斤5公斤 女生:x=2.2公斤=22.73(磅),s =2.2公斤=2.27(磅);

(3)68%; (4)95%。

13.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组 幼儿组

166 169 172 177 180 170 172 174 168 173 68 69 68 70 71 73 72 73 74 75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么? (2)比较分析哪一组的身高差异大? 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。

(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:

成年组身高的离散系数:

vs?4.2?0.024172.1;

又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:

幼儿组身高的离散系数:

vs?2.497?0.03571.3;

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散

程度相对较大。

14.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):

方法A 164

167 168 165 170 165 164 168

方法B 129 130 129 130 131 130 129 127

方法C 125 126 126 127 126 128 127 126

164 162 163 166 167 166 165 128 128 127 128 128 125 132 127 127 125 126 116 126 125

(1) 你准备采用什么方法来评价组装方法的优劣?

(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:(1)下表给计算出这三种组装方法的一些主要描述统计量: 方法A 平均 中位数 众数 极差 最小值 最大值 165.6 165 164 8 162 170 方法B 平均 中位数 众数 极差 最小值 最大值 128.73 129 128 7 125 132 方法C 平均 中位数 众数 极差 最小值 最大值 125.53 126 126 12 116 128 标准偏差 2.13 标准偏差 1.75 标准偏差 2.77 评价优劣应根据离散系数,据上得: 2.13

方法A的离散系数VA=165.6=0.0129, 1.75方法B的离散系数VB=128.73=0.0136, 2.77方法C的离散系数VC=125.53=0.0221;

对比可见,方法A的离散系数最低,说明方法A最优。

(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。

15.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1)你认为该用什么样的统计测度值来反映投资的风险?

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?

-30 0 30 60 -30 0 30 60

收 益 率 收 益 率 (a)商业类股票 (b) 高科技类股票

本文来源:https://www.bwwdw.com/article/06f.html

Top