统计学实验指导
更新时间:2023-10-28 05:10:01 阅读量: 综合文库 文档下载
- 统计学推荐度:
- 相关推荐
第二章统计学实验指导
实验一:统计整理与分组
实验目的:
运用excel进行常见数据类型的统计整理,能熟练运用菜单和各类函数进行数据筛选、排序,运用数据透视表绘制统计频数分布表。
实验要求:
独立完成课堂各类习题和练习,按要求完成实验内容。 实验形式:
教师演示、指导 实验内容:
1、品质数据分组:利用数据透视表直接绘制,但是需要注意排序数据
2、数值数据分组:对数据排序后,能分析选择数值数据的分组形式。
能利用数据透视表编制单项式分组统计次数数列; 熟练应用统计函数编制组距式分组统计次数分布数列。
一、统计数据的预处理
1、数据筛选:参见指导P37—39 (1)自动筛选:
将鼠标定位于数据文件的变量标题行;
点击菜单“数据”——筛选——自动筛选后,则在标题行出现下拉箭头; 在需要筛选的变量下点击下拉箭头,自行选择筛选功能(前10个,自定义),后确定。
自动筛选结果会自动从原数据区域中被选择出来显示,不符合条件的被屏蔽。 自动筛选一次只能执行一次筛选条件。 取消筛选:将数据“数据”——筛选——自动筛选再点击一次,去掉自动筛选前的“√”。 (2)高级筛选:
选择空白区域创立筛选条件区域:筛选变量、筛选条件值
菜单“数据”——筛选——高级筛选后,进入高级筛选对话框;
1
筛选方式:通常是筛选结果另行放置,防止与原数据混淆。 列表区域:整个数据库区域,一般系统会自动选择。
条件区域:高级筛选可同时执行多个条件的综合筛选结果,选出符合条件的数据区域。 如果同时多个条件筛选,条件区域中将多个条件变量取值同行放置,表示“与”。 若至少满足多个条件之一,条件区域中将多个条件变量取值换行放置,表示“或”。 如:筛选文化程度为大学本科的管理员,则条件区域如此设置: 编号 性别 年龄 受教育程度 大学本科 当前工受雇起受雇岗位 资(元) 薪(元) 年份 管理员 工作经户口历(月) 地别 筛选文化程度为大学本科或岗位为管理员的员工则如此设置:
编号
性别 年龄
受教育程度 大学本科
当前工资岗位 (元) 管理员
受雇起薪(元)
受雇年份
工作经历(月)
户口地别
应用1:利用自动筛选选择男性员工;
利用高级筛选选择当前工资在3万元以上的工人;
利用高级筛选选择年龄在40岁以下或大学本科及以上的职工。
2、数据排序:参见指导P41
将鼠标定位于待分析数据区域的任意位置;
点击菜单“数据”——排序后,进入排序对话框;
排序对话框中:
主要关键字:排序变量。
次要关键字:各总体单位排序变量取值相同时,若指定次要关键字,则按此排序,否则按出现的先后顺序排。
我的数据区域:选择参与排序的数据区域。有标题行,则数据区域第一行不参与排序,一般数据区域首行为变量名时如此选择。否则,无标题行,数据从第一行第一列开始排序。
选项:指定升降序排列形式:次序、方向、方法,用于字符型数据的排序设置。 应用2:对加工零件数按照一定大小进行排序; 对售后服务质量按照一定优劣进行排序。 二、统计分组
统计整理及分析结果的编写通常在word文档中录入和编辑,只要能用excel生成相对规范的统计表和统计图,然后可以复制到word中进行美化排版即可。
2
1、品质数据的简单分组
选择菜单“数据”——数据透视表和数据透视图,进入数据透视表操作向导对话框。 第一步:按照向导默认即可,只生成数据透视表。
第二步:选择源数据,返回excel文件选择包含变量名在内的整个数据库区域。 第三步:设计透视表的内容和格式。
透视表的显示位置:通常与原始数据放置在一起,透视表会占用一部分空间,所以最好与源数据相隔一定距离。选择源数据文件工作表的空白区域,随意定位一个空白单元格即可。
布局:设计数据透视表的显示模式。
拖放分组变量在行标题栏,系统根据它的属性自动设置组数和类别。
拖放同一分组变量到数据区域,系统会自动生成一次对应各组的数据,默认为计数,即汇总各组的频数。
再次拖放仍然执行相同操作,只要双击按钮,实验者可以根据需要进行修改,比如计算频率(双击后,进入修改界面,可以修改名称和汇总方式,点击“选项”拉开数据显示方式选择“占同列数据的百分比”即可)。
3
其余操作按照默认即可。
点击完成,分组表和普通统计表视觉上不大一致,选定已生产透视表的“数据”,右击后,选择“顺序——移至列”即可。 注意事项:
(1)数据透视表是根据源数据生成,一旦源数据变化,则分组结果随时改变。排版过程中,最好是选择性粘贴(值)然后再排版则表中数值不再变动。
(2)如果统计数据为讲究顺序的品质数据,则最好对对数据进行编码排列,然后对编码后的数据再分组,系统就不会排乱顺序。或者先让系统自行排序,然后将分组结果选择性粘贴,操作者自行修改组别排列。
Excel函数和公式均以“=”开头。函数格式:=函数名(参数),以等号开始,以回车结束;如果参数有多个,参数之间必须用“,”隔开。
输入函数最好在英文状态下输入,防止错误,而且还可以提示操作者函数的输入语法。 1)讲究顺序的数据,在编码时利用逻辑判断函数:
=if(logic-test,[value-if-true],[value-if-false])
比如:某职工的文化程度存放在单元格a1中,令高中及以下=1,大学本科=2,研究生=3,编码后的数据存放在b1单元格,则在b1中输入“=if(a1=’高中及以下’,1,if(a1=’大学本科’,2,3))”,然后回车,则自动赋值。
如果编码是数字赋值,注意透视表中的数据显示方式默认是求和汇总,需修改为计数。 2)选择性粘贴的操作。
当采用数据透视表生成统计分组结果以后,这里面的一切输出结果都是嵌套了数据宏工具,原始数据发生变化,结果会随时变化,并且操作者不能单独对其中的某些数据进行编辑修改。为此,当需要对整理结果进行某些编辑时,通常只将结果复制出来,而不需要复制其内含的公式和格式等内容。
鼠标点击“复制”按钮,然后定位要复制的目标位置后,在“粘贴”按钮右侧有一个下拉小箭头,点开以后选择“值”或者在菜单“编辑”里面点击“选择性粘贴”,在打开的对话框中选择“数值”。执行此项操作,表示只对原数据粘贴其结果,其他都不保留。
应用3:对工人分别根据户口类别和文化程度进行分组整理;
对售后服务质量进行分组整理。
2、数值数据的单项式分组
按分组标志采用数据透视表,基本操作同前,只是要注意修改布局对话框中的默认数据显示方式为计数。
应用4:编制中学生年龄分组表
4
3、数值数据的组距式分组:参见实验指导P42-44
组距式分组由于组数和组距、组限的设计主观性比较强,其格式需要研究人员自行编制,主要通过excel函数来完成。具体操作顺序按照统计分组理论顺序进行。 (1)组数设计:组数Sturges经验公式1+log(总体单位数)/log(2)、
总体单位数count(数据区域)
(2)计算极差:最大值max(数据区域)、最小值min(数据区域)
(3)等距组距设计:极差/组距,此计算结果通常不是整5或10的倍数,可人为认定。 (4)分组结构设计:选择存放分组数据的一个空白区域,设定第一组的结构,然后利用公式填充,注意绝对引用与相对引用的关系,合理利用数学逻辑可以快速提高分组效率。 (5)汇总频数:频数函数frequency(数据区域,临界值)。输入此公式前,必须提前设定临界值,临界值用于判定总体单位的组别归属,遵循不重不漏和上限不在内原则,通常设置为比原始数据精度更精确一些,同时比组上限稍小一些的数值。
选定存放各组频数的所有组单元格后挪开鼠标,不要点击。因为首行是反显的,直接利用键盘输入frequency函数即可。
该函数是一次生成所有组的频数,函数确认方法:Ctrl+Shift+Enter,三个键同时摁下,表示函数输入完毕,返回运算结果。
应用5:编制工人加工零件数等距分组表;
根据职工当前工资数据,编制科学的统计分组表。
5
实验三:描述统计 实验目的:
利用Excel统计函数和一些基本的数学运算函数、公式进行描述统计指标的计算。 利用Excel安装“数据分析”工具库,并输出各描述指标值,分析数据的分布特征。 实验要求:
熟练掌握各种描述统计指标的对应函数,计算诸如众数、中位数、四分位数、算术平均数、调和平均数、几何平均数、极差、方差、标准差等的相关操作。
运用“数据分析”工具库计算的统计指标,分析数据的基本分布特征。 实验形式:
教师演示、指导 实验内容:
在计算各类描述指标过程中,我们会用到常用的数学或统计函数,以及根据运算逻辑关系自行定义输入公式。函数格式:=函数名(参数1,[参数2],…)
输入各类函数的参数时,一般可以鼠标拖动选择,或者手动输入数据区域。手动输入时,用数据范围的矩形对角线所对应的单元格定义即可,中间用“:”链接,表示“到”。如:对单元格a1到b3所围成的矩形区域中的数据求和,直接输入:=sum(a1:b3),回车确认即可返回合计值。
一、集中趋势指标的计算:P84-87
计算集中趋势的函数名称有众数mode、中位数median、四分位数quartile、算术平均数average、调和平均数harmean、几何平均数geomean等几个,但在具体计算过程中,需要根据数据是否经过整理分组选择合适的算法。
如果数据未经过任何整理,可以直接通过函数计算结果。如果是分组数据,则需要按照理论分析一步步的运用公式进行计算。 1、众数
(1)未整理数据: mode(number1,[number2],…),将待计算的数据区域作为参数,就可以得到指定数据的众数。
(2)分组整理数据:先判断众数组,然后根据分组类型,直接确定或采用近似公式计算。 2、中位数
(1)未整理数据:median(number1,[number2],…),将待计算的数据区域作为参数,就可以得到指定数据的中位数。
(2)分组整理数据:先利用累积频数判断中位数所在组,然后根据分组类型,直接判断或采用近似公式计算。
计算向上累积频数,由于每组的累积频数结果都是从第一组开始累积,因此,利用求和函数sum时,把起始单元格必须设置成绝对引用格式,即用“$”将行、列给固定。 3、四分位数
(1)未整理数据:quartile(array,quart),将待计算的数据区域作为一个数组,指定分位数的位次quart。若quart=0,则输出最小值;quart=1,输出下四分位数;quart=2,输出中位数;quart=3,输出上四分位数;quart=4,输出最大值。
(2)分组整理数据:先利用累积频数判断四位数所在组,然后根据分组类型,直接判断或采用近似公式计算,过程等同于中位数。 4、均值
(1)算术平均数
1)未整理数据:average(number1,[number2],…),将待计算的数据区域作为参数,
11
就可以得到指定数据的算术平均数。
2)分组整理数据:使用加权算术平均。
利用乘积求和函数sumproduct(array1,[array2], …)计算总体标志值总量。将各组变量值设置为array1,各组对应的频数设置为array2,可以计算两个数组的对应数据的乘积和,对应于加权算术平均数的分子部分。
然后利用除法公式计算平均数。
注意:单项式分组中,x为各组变量值;组距式分组中, x为各组组中值,需要事先添加计算出组中值。 (2)调和平均数
1)未整理数据:harmean(number1,[number2],…),将待计算的数据区域作为参数,就可以得到指定数据的调和平均数。
2)分组整理数据:使用加权调和平均。
利用乘积求和函数sumproduct(array1,[array2], …),将各组变量值(同样对于组距式分组必须先计算组中值)的倒数设置为array1,各组对应的频数设置为array2,可
?xfm?x。 以计算两个数组的对应数据的乘积和,对应于加权调和平均数的分母部分
然后利用除法公式计算平均数。
(3)几何平均数
1)未整理数据: geomean(number1,[number2],…),将待计算的数据区域作为参数,就可以得到指定数据的几何平均数。
2)分组整理数据:使用加权几何平均。利用幂函数 power(number,power),以每组的变量值为底,频数为幂指数,分组别计算出各组的
fix变量值总量(同样对于组距式分组必须先计算组中值),对应于每组的i。
然后利用乘积函数product(number1,[number2],…),将前一步的幂函数运算结果选
入作为参数,计算总体总量。
然后再利用power()函数,以总频数的倒数为幂指数,计算得到几何平均数。 (二)离散程度指标的计算
计算离散程度的函数名称有总体方差varp、总体标准差stdevp、样本方差var、样本标准差stdev。
如果数据未经过任何整理,可以直接通过函数计算结果。如果是分组数据,则需要按照理论分析一步步的运用公式进行计算。 1、极差
1)未分组数据:利用max(number1,[number2],…)、min(number1,[number2],…),以数据区域作为参数,分别求出数据的最大值和最小值,然后做差计算得到。
2)分组数据:理论上用最大值组的上限-最小值组的下限,但实际上计算没有意义 2、四分位距,利用定义上下四分位数做差即可。 3、方差或标准差
(1)未分组数据:判断数据是总体数据还是样本数据。 1)总体数据。
总体方差:varp(number1,[number2],…),将总体数据区域作为参数。 总体标准差:stdevp(number1,[number2],…),将总体数据区域作为参数,得到总体标准差。或者将总体方差计算得到,然后用平方根函数sqrt(number),对总体方差开平方得到总体标准差。
12
2)样本数据。
样本方差:var(number1,[number2],…),将样本数据区域作为参数,得到样本方差。 样本标准差:stdev(number1,[number2],…),将样本数据区域作为参数,得到样本标准差。或者将样本方差计算得到,然后用平方根函数sqrt(number),对样本方差开平方得到样本标准差。
(2)分组数据:判断数据是总体数据还是样本数据,结合方差的计算公式,类似于加权算术平均数的计算过程。方差得到,然后利用平方根函数求得标准差。 4、标准差系数。直接用公式计算:标准差除以算术平均数 (三)统计描述指标的统一展示:P81-83、P87
查看工具菜单下是否有“数据分析”子菜单。一般,office软件选择典型安装时,都没有安装。若没有,在此菜单下点击“加载宏”,然后加载“分析工具库”,加载成功之后就可以找到数据分析子菜单了,然后Excel就配有了专门用于统计分析的宏。
首先将所有原始数据排放在同一列(行),然后调用“工具——数据分析——描述统计”,根据需要选用输出项目,常用的描述指标均有,其输出结果与我们前面采用函数计算的结果一致。
注:此数据分析的宏只适用于数值型数据。
13
正在阅读:
统计学实验指导10-28
福建省2015年下半年基金从业资格:衍生工具考试试题06-20
一岗双责整改措施02-28
浅谈分布式防火墙技术的应用与发展趋势08-06
关于温柔爱情的句子05-07
义务教育精选语录11-20
七年级上册人教版语文教案【最新3篇】03-28
一个难忘的地方作文400字06-16
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 统计学
- 指导
- 实验
- 2016-2021年中国工厂照明灯市场深度调研及投资策略分析报告(目录) - 图文
- 兴易八字命理教学电子书(命理葵花宝典)
- 实验五 膳食调查与评价 - 图文
- 沪深股市05-10年的日收益率相关性分析
- 苏教版四下语文30篇课外阅读和答案
- 第三章一元一次方程教案
- 优秀历史保护建筑外墙保护修缮技术 - 图文
- 电力工程基础第四章习题
- 企业战略管理案例分析
- 关于在重庆渝发建设的实习总结
- 中日钓鱼岛撞船事件的争议
- 2.3相反数与绝对值
- 高教发展动态(第11期)-修改稿
- 电力机车机械复习题及答案
- 辽宁省金矿采选企业名录2018版175家
- 危险货物运输停车场设置安全距离参考标准
- 人口厅发〔2008〕23号
- 生态学试题附答案
- 进出口粮油检验检疫
- 大学物理模拟试题(2)