统计学第一章作业

更新时间:2023-11-29 17:03:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 描述性统计

1.某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。

117 108 110 112 137 15122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 均值标准差N123.08.0275012 1.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。 数据特征:大多数人的日加工零件数在120到125之间。

2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析 原材料供应商 甲 甲 乙 乙 丙 丙 丁 丁 员工编号 1 0.379 0.400 0.267 0.098 0.266 0.299 0.122 0.248 2 0.331 0.305 0.325 0.617 0.451 0.546 0.342 0.258 3 0.259 0.277 0.299 0.236 0.304 0.392 0.176 0.269 4 0.233 0.231 0.372 0.219 0.423 0.434 0.242 0.172 5 0.223 0.434 0.157 0.305 0.274 0.312 0.427 0.303 6 0.289 0.475 0.257 0.212 0.299 0.318 0.265 0.390 7 0.396 0.329 0.399 0.334 0.173 0.218 0.136 0.034 频数(人)963105110115120125130135140日加工零件数某生产车间50名工人日加工零件数0.60.50.40.30.20.10.0甲乙丙丁原材料供应商的箱线图

0.60.50.40.30.20.10.0员工1员工2员工3员工4员工5员工6员工7 由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。

3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:

人数 考试成绩 甲班 乙班 优 3 6 良 6 15 中 18 9 及格 9 8 不及格 4 2

7名工人的的箱线图 (1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图

和图饼图。

(2)比较两个班考试成绩分布的特点。

(3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。

(1)

(2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。

(3) 从上图可知,甲乙两班考试成绩的分布不相似。

4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下:

15 16 17 18 19 19 19 20 20 21 22 22 网民年龄 23 23 23 24 24 25 27 29 30 31 34 38

(1) 计算众数、中位数。(exlce数据分析:众数19,中位数22.5)

(2) 根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。

(3) 计算平均数和标准差(平均数是23.29,标准差是5.75)。

(4) 计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。 (5) 对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)

5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:min)如下:

排队时间 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8

(1) 计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。

(2) 比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离散系数是0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。

(3) 如果让你选择一种排队方式,你会选择哪一种?试说明理由(选择

第二种,因为平均等待时间短,而且离散程度小)。

6. 在某地区抽取的120家企业按利润额进行分组,结果如下

按利润额分组 200—300 300—400 400—500 500—600 600以上 合计 企业数 19 30 42 18 11 120

(1)计算120家企业利润额的均值和标准差;

(2)计算分布的偏态系数和峰态系数;

(3) 画直方图,阶段企业利润的分布特性。 (1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公式,得

标准差为116。

(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式得,峰度系数为2.29

(3) 40均值标准差N379.9117.312430

由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较小的企业占较大比重

企业数20100100200300400500600700利润企业利润的直方图

7. 2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位:辆)如下: 国产车销售排行前10名 销售量 进口车销售排行前10名 销售量 福美来 556 丰田 149 夏利 541 现代 102 捷达 370 日产 68 松花江 298 奔驰 30 富康 277 宝马 30 哈飞路宝 200 大众汽车 23 高尔夫 190 克莱斯勒 17 东方之子 181 本田 16 长安奥拓 145 雷克萨斯 10 爱丽舍 117 奥迪 6

(1) 画出国产汽车和进口汽车销售量的对比条形图和环形图。 (2) 分别画出国产汽车和进口汽车销售量的帕累托图。 (1)

(2)首先计算出各车的累计频率。然后制图。

频数

累计频率 频数

累计频率

福美来 夏利 捷达 松花江 富康 哈飞路宝 高尔夫 东方之子 长安奥拓 爱丽舍 556 541 370 298 277 200 190 181 145 117 2875 19.34% 19.34% 2875 18.82% 38.16% 2875 12.87% 51.03% 2875 10.37% 61.39% 2875 2875 2875 2875 2875 2875 9.63% 71.03% 6.96% 77.98% 6.61% 84.59% 6.30% 90.89% 5.04% 95.93% 丰田 现代 日产 奔驰 宝马 大众汽车 克莱斯勒 本田 雷克萨斯 149 102 68 30 30 23 17 16 10 6 451 451 451 451 451 451 451 451 451 451

33.04% 33.04% 22.62% 55.65% 15.08% 70.73% 6.65% 77.38% 6.65% 84.04% 5.10% 89.14% 3.77% 92.90% 3.55% 96.45% 2.22% 98.67% 1.33% 100.00%

4.07% 100.00% 奥迪

8. 对10名成年人和10名幼儿的身高(单位:cm)进行抽样调查,结果如下:

成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?

为什么?

(2)比较分析哪一组的身高差异大?

(1)离散系数,因为它消除了不同组数据水平高低的影响。 (2))利用离散系数的公式,得成年组身高的离散系数:0.024 幼儿组身高的离散系数:0.035。由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

本文来源:https://www.bwwdw.com/article/s9it.html

Top