统计学实验指导

更新时间：2023-10-28 05:10:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

统计学推荐度：
相关推荐

第二章统计学实验指导

实验一：统计整理与分组

实验目的：

运用excel进行常见数据类型的统计整理，能熟练运用菜单和各类函数进行数据筛选、排序，运用数据透视表绘制统计频数分布表。

实验要求：

独立完成课堂各类习题和练习，按要求完成实验内容。实验形式：

教师演示、指导实验内容：

1、品质数据分组：利用数据透视表直接绘制，但是需要注意排序数据

2、数值数据分组：对数据排序后，能分析选择数值数据的分组形式。

能利用数据透视表编制单项式分组统计次数数列；熟练应用统计函数编制组距式分组统计次数分布数列。

一、统计数据的预处理

1、数据筛选：参见指导P37—39 （1）自动筛选：

将鼠标定位于数据文件的变量标题行；

点击菜单“数据”——筛选——自动筛选后，则在标题行出现下拉箭头；在需要筛选的变量下点击下拉箭头，自行选择筛选功能（前10个，自定义），后确定。

自动筛选结果会自动从原数据区域中被选择出来显示，不符合条件的被屏蔽。自动筛选一次只能执行一次筛选条件。取消筛选：将数据“数据”——筛选——自动筛选再点击一次，去掉自动筛选前的“√”。（2）高级筛选：

选择空白区域创立筛选条件区域：筛选变量、筛选条件值

菜单“数据”——筛选——高级筛选后，进入高级筛选对话框；

筛选方式：通常是筛选结果另行放置，防止与原数据混淆。列表区域：整个数据库区域，一般系统会自动选择。

条件区域：高级筛选可同时执行多个条件的综合筛选结果，选出符合条件的数据区域。如果同时多个条件筛选，条件区域中将多个条件变量取值同行放置，表示“与”。若至少满足多个条件之一，条件区域中将多个条件变量取值换行放置，表示“或”。如：筛选文化程度为大学本科的管理员，则条件区域如此设置：编号性别年龄受教育程度大学本科当前工受雇起受雇岗位资（元）薪（元）年份管理员工作经户口历（月）地别筛选文化程度为大学本科或岗位为管理员的员工则如此设置：

编号

性别年龄

受教育程度大学本科

当前工资岗位（元）管理员

受雇起薪（元）

受雇年份

工作经历（月）

户口地别

应用1：利用自动筛选选择男性员工；

利用高级筛选选择当前工资在3万元以上的工人；

利用高级筛选选择年龄在40岁以下或大学本科及以上的职工。

2、数据排序：参见指导P41

将鼠标定位于待分析数据区域的任意位置；

点击菜单“数据”——排序后，进入排序对话框；

排序对话框中：

主要关键字：排序变量。

次要关键字：各总体单位排序变量取值相同时，若指定次要关键字，则按此排序，否则按出现的先后顺序排。

我的数据区域：选择参与排序的数据区域。有标题行，则数据区域第一行不参与排序，一般数据区域首行为变量名时如此选择。否则，无标题行，数据从第一行第一列开始排序。

选项：指定升降序排列形式：次序、方向、方法，用于字符型数据的排序设置。应用2：对加工零件数按照一定大小进行排序；对售后服务质量按照一定优劣进行排序。二、统计分组

统计整理及分析结果的编写通常在word文档中录入和编辑，只要能用excel生成相对规范的统计表和统计图，然后可以复制到word中进行美化排版即可。

1、品质数据的简单分组

选择菜单“数据”——数据透视表和数据透视图，进入数据透视表操作向导对话框。第一步：按照向导默认即可，只生成数据透视表。

第二步：选择源数据，返回excel文件选择包含变量名在内的整个数据库区域。第三步：设计透视表的内容和格式。

透视表的显示位置：通常与原始数据放置在一起，透视表会占用一部分空间，所以最好与源数据相隔一定距离。选择源数据文件工作表的空白区域，随意定位一个空白单元格即可。

布局：设计数据透视表的显示模式。

拖放分组变量在行标题栏，系统根据它的属性自动设置组数和类别。

拖放同一分组变量到数据区域，系统会自动生成一次对应各组的数据，默认为计数，即汇总各组的频数。

再次拖放仍然执行相同操作，只要双击按钮，实验者可以根据需要进行修改，比如计算频率（双击后，进入修改界面，可以修改名称和汇总方式，点击“选项”拉开数据显示方式选择“占同列数据的百分比”即可）。

其余操作按照默认即可。

点击完成，分组表和普通统计表视觉上不大一致，选定已生产透视表的“数据”，右击后，选择“顺序——移至列”即可。注意事项：

（1）数据透视表是根据源数据生成，一旦源数据变化，则分组结果随时改变。排版过程中，最好是选择性粘贴（值）然后再排版则表中数值不再变动。

（2）如果统计数据为讲究顺序的品质数据，则最好对对数据进行编码排列，然后对编码后的数据再分组，系统就不会排乱顺序。或者先让系统自行排序，然后将分组结果选择性粘贴，操作者自行修改组别排列。

Excel函数和公式均以“=”开头。函数格式：=函数名（参数），以等号开始，以回车结束；如果参数有多个，参数之间必须用“,”隔开。

输入函数最好在英文状态下输入，防止错误，而且还可以提示操作者函数的输入语法。 1）讲究顺序的数据，在编码时利用逻辑判断函数：

=if（logic-test，[value-if-true],[value-if-false]）

比如：某职工的文化程度存放在单元格a1中，令高中及以下=1，大学本科=2，研究生=3，编码后的数据存放在b1单元格，则在b1中输入“=if(a1=’高中及以下’,1,if(a1=’大学本科’,2,3))”，然后回车，则自动赋值。

如果编码是数字赋值，注意透视表中的数据显示方式默认是求和汇总，需修改为计数。 2）选择性粘贴的操作。

当采用数据透视表生成统计分组结果以后，这里面的一切输出结果都是嵌套了数据宏工具，原始数据发生变化，结果会随时变化，并且操作者不能单独对其中的某些数据进行编辑修改。为此，当需要对整理结果进行某些编辑时，通常只将结果复制出来，而不需要复制其内含的公式和格式等内容。

鼠标点击“复制”按钮，然后定位要复制的目标位置后，在“粘贴”按钮右侧有一个下拉小箭头，点开以后选择“值”或者在菜单“编辑”里面点击“选择性粘贴”，在打开的对话框中选择“数值”。执行此项操作，表示只对原数据粘贴其结果，其他都不保留。

应用3：对工人分别根据户口类别和文化程度进行分组整理；

对售后服务质量进行分组整理。

2、数值数据的单项式分组

按分组标志采用数据透视表，基本操作同前，只是要注意修改布局对话框中的默认数据显示方式为计数。

应用4：编制中学生年龄分组表

3、数值数据的组距式分组：参见实验指导P42-44

组距式分组由于组数和组距、组限的设计主观性比较强，其格式需要研究人员自行编制，主要通过excel函数来完成。具体操作顺序按照统计分组理论顺序进行。（1）组数设计：组数Sturges经验公式1+log（总体单位数）/log（2）、

总体单位数count（数据区域）

（2）计算极差：最大值max（数据区域）、最小值min（数据区域）

（3）等距组距设计：极差/组距，此计算结果通常不是整5或10的倍数，可人为认定。（4）分组结构设计：选择存放分组数据的一个空白区域，设定第一组的结构，然后利用公式填充，注意绝对引用与相对引用的关系，合理利用数学逻辑可以快速提高分组效率。（5）汇总频数：频数函数frequency（数据区域，临界值）。输入此公式前，必须提前设定临界值，临界值用于判定总体单位的组别归属，遵循不重不漏和上限不在内原则，通常设置为比原始数据精度更精确一些，同时比组上限稍小一些的数值。

选定存放各组频数的所有组单元格后挪开鼠标，不要点击。因为首行是反显的，直接利用键盘输入frequency函数即可。

该函数是一次生成所有组的频数，函数确认方法：Ctrl+Shift+Enter，三个键同时摁下，表示函数输入完毕，返回运算结果。

应用5：编制工人加工零件数等距分组表；

根据职工当前工资数据，编制科学的统计分组表。

实验三：描述统计实验目的：

利用Excel统计函数和一些基本的数学运算函数、公式进行描述统计指标的计算。利用Excel安装“数据分析”工具库，并输出各描述指标值，分析数据的分布特征。实验要求：

熟练掌握各种描述统计指标的对应函数，计算诸如众数、中位数、四分位数、算术平均数、调和平均数、几何平均数、极差、方差、标准差等的相关操作。

运用“数据分析”工具库计算的统计指标，分析数据的基本分布特征。实验形式：

教师演示、指导实验内容：

在计算各类描述指标过程中，我们会用到常用的数学或统计函数，以及根据运算逻辑关系自行定义输入公式。函数格式：=函数名（参数1，[参数2]，…）

输入各类函数的参数时，一般可以鼠标拖动选择，或者手动输入数据区域。手动输入时，用数据范围的矩形对角线所对应的单元格定义即可，中间用“：”链接，表示“到”。如：对单元格a1到b3所围成的矩形区域中的数据求和，直接输入：=sum（a1:b3），回车确认即可返回合计值。

一、集中趋势指标的计算：P84-87

计算集中趋势的函数名称有众数mode、中位数median、四分位数quartile、算术平均数average、调和平均数harmean、几何平均数geomean等几个，但在具体计算过程中，需要根据数据是否经过整理分组选择合适的算法。

如果数据未经过任何整理，可以直接通过函数计算结果。如果是分组数据，则需要按照理论分析一步步的运用公式进行计算。 1、众数

（1）未整理数据： mode（number1,[number2],…），将待计算的数据区域作为参数，就可以得到指定数据的众数。

（2）分组整理数据：先判断众数组，然后根据分组类型，直接确定或采用近似公式计算。 2、中位数

（1）未整理数据：median（number1,[number2],…），将待计算的数据区域作为参数，就可以得到指定数据的中位数。

（2）分组整理数据：先利用累积频数判断中位数所在组，然后根据分组类型，直接判断或采用近似公式计算。

计算向上累积频数，由于每组的累积频数结果都是从第一组开始累积，因此，利用求和函数sum时，把起始单元格必须设置成绝对引用格式，即用“$”将行、列给固定。 3、四分位数

（1）未整理数据：quartile（array,quart），将待计算的数据区域作为一个数组，指定分位数的位次quart。若quart=0，则输出最小值；quart=1，输出下四分位数；quart=2，输出中位数；quart=3，输出上四分位数；quart=4，输出最大值。

（2）分组整理数据：先利用累积频数判断四位数所在组，然后根据分组类型，直接判断或采用近似公式计算，过程等同于中位数。 4、均值

（1）算术平均数

1）未整理数据：average（number1,[number2],…），将待计算的数据区域作为参数，

就可以得到指定数据的算术平均数。

2）分组整理数据：使用加权算术平均。

利用乘积求和函数sumproduct（array1,[array2], …）计算总体标志值总量。将各组变量值设置为array1，各组对应的频数设置为array2，可以计算两个数组的对应数据的乘积和，对应于加权算术平均数的分子部分。

然后利用除法公式计算平均数。

注意：单项式分组中，x为各组变量值；组距式分组中， x为各组组中值，需要事先添加计算出组中值。（2）调和平均数

1）未整理数据：harmean（number1,[number2],…），将待计算的数据区域作为参数，就可以得到指定数据的调和平均数。

2）分组整理数据：使用加权调和平均。

利用乘积求和函数sumproduct（array1,[array2], …），将各组变量值（同样对于组距式分组必须先计算组中值）的倒数设置为array1，各组对应的频数设置为array2，可

?xfm?x。以计算两个数组的对应数据的乘积和，对应于加权调和平均数的分母部分

然后利用除法公式计算平均数。

（3）几何平均数

1）未整理数据： geomean（number1,[number2],…），将待计算的数据区域作为参数，就可以得到指定数据的几何平均数。

2）分组整理数据：使用加权几何平均。利用幂函数 power（number,power），以每组的变量值为底，频数为幂指数，分组别计算出各组的

fix变量值总量（同样对于组距式分组必须先计算组中值），对应于每组的i。

然后利用乘积函数product（number1,[number2],…），将前一步的幂函数运算结果选

入作为参数，计算总体总量。

然后再利用power（）函数，以总频数的倒数为幂指数，计算得到几何平均数。（二）离散程度指标的计算

计算离散程度的函数名称有总体方差varp、总体标准差stdevp、样本方差var、样本标准差stdev。

如果数据未经过任何整理，可以直接通过函数计算结果。如果是分组数据，则需要按照理论分析一步步的运用公式进行计算。 1、极差

1）未分组数据：利用max（number1,[number2],…）、min（number1,[number2],…），以数据区域作为参数，分别求出数据的最大值和最小值，然后做差计算得到。

2）分组数据：理论上用最大值组的上限-最小值组的下限，但实际上计算没有意义 2、四分位距，利用定义上下四分位数做差即可。 3、方差或标准差

（1）未分组数据：判断数据是总体数据还是样本数据。 1）总体数据。

总体方差：varp（number1,[number2],…），将总体数据区域作为参数。总体标准差：stdevp（number1,[number2],…），将总体数据区域作为参数，得到总体标准差。或者将总体方差计算得到，然后用平方根函数sqrt（number），对总体方差开平方得到总体标准差。

2）样本数据。

样本方差：var（number1,[number2],…），将样本数据区域作为参数，得到样本方差。样本标准差：stdev（number1,[number2],…），将样本数据区域作为参数，得到样本标准差。或者将样本方差计算得到，然后用平方根函数sqrt（number），对样本方差开平方得到样本标准差。

（2）分组数据：判断数据是总体数据还是样本数据，结合方差的计算公式，类似于加权算术平均数的计算过程。方差得到，然后利用平方根函数求得标准差。 4、标准差系数。直接用公式计算：标准差除以算术平均数（三）统计描述指标的统一展示：P81-83、P87

查看工具菜单下是否有“数据分析”子菜单。一般，office软件选择典型安装时，都没有安装。若没有，在此菜单下点击“加载宏”，然后加载“分析工具库”，加载成功之后就可以找到数据分析子菜单了，然后Excel就配有了专门用于统计分析的宏。

首先将所有原始数据排放在同一列（行），然后调用“工具——数据分析——描述统计”，根据需要选用输出项目，常用的描述指标均有，其输出结果与我们前面采用函数计算的结果一致。

注：此数据分析的宏只适用于数值型数据。

本文来源：https://www.bwwdw.com/article/27q2.html

相关文章：

正在阅读：

统计学实验指导10-28

福建省2015年下半年基金从业资格：衍生工具考试试题06-20

一岗双责整改措施02-28

“十三五”重点项目-汽车后桥生产建设项目申请报告03-18

2012云南公务员面试热点：综合分析题备考02-29

浅谈分布式防火墙技术的应用与发展趋势08-06

关于温柔爱情的句子05-07

义务教育精选语录11-20

七年级上册人教版语文教案【最新3篇】03-28

一个难忘的地方作文400字06-16

上一篇：开机错误信息提示详解下一篇：秘书学导论教学大纲