统计实验项目
更新时间:2023-11-11 06:43:01 阅读量: 教育文库 文档下载
- 统计从业资格证报名推荐度:
- 相关推荐
《统计学原理》实验指导
实验一 统计指标
? 熟悉EXCEL中的有关“统计”函数和“常用”函数,掌握其功能。 实验资料
50名学生的英语考试成绩如下:
59 61 61 62 63 64 84 74 74 74 85 86 65 66 70 71 72 67 68 69 69 72 72 73 75 75 91 91 95 75 75 76 77 78 79 80 81 82 83 84 86 87 88 90 97 99 50 51 54 58
实验步骤
1、 打开一个EXCEL工作表并在A列中输入变量数列数据,并排序。在B单元列列中输入各组的
分组上限,一般取“10”的倍数减1,下限则默认为“10”的倍数。并且在第一个数值上方的单元格中键入有关的标志名称,以便在输出图表的分析结果中定义数据的名称。
图1 图2
2、 从工具菜单中选择数据分析命令,弹出统计分析对话框,双击“描述统计”,显示对话框。在输
入区域填入引用数据的范围(拖动光标选择即可),并给出输出区域(可选择在原工作表或输出到新的工作表,但要防止工作表覆盖了原表的内容)。同时勾选标志这一选项框。 3、 为得到分布特征值,勾选“汇总统计”。 4、 单击“确定”,得到分布特征值。
图3
1
实验二 统计整理
一、指定接受区域直方图
在应用此工具前,用户应先决定分布区间。否则,Excel将用一个大约等于数据集中某数值的平方根作区间,在数据集的最大值与最小值之间用等宽间隔。如果用户自己定义区间,可用2、5或10的倍数,这样易于分析。
对于工资数据,最小值是100,最大值是298。一个紧凑的直方图可从区间100开始,区间宽度用10,最后一区间为300结束,需要21个区间。这里所用的方法在两端加了一个空区间,在低端是区间“100或小于100”,高端是区间“大于300”。 参考图3.3,利用下面这些步骤可得到频率分布和直方图: 1.为了方便,将原始数据拷贝到新工作表“指定频数直方图”中。
2.在B1单元中输入“组距”作为一标记,在B2单元中输入100,B3单元中输入110,选取B2:B3,向下拖动所选区域右下角的+到B22单元。
3.按下列步骤使用“直方图”分析工具:
(1)选择工具菜单之数据分析选项, 在分析工具框中“直方图”。如图所示。
图1 数据分析工具之直方图对话框
1) 输入
输入区域:A1:A51
接受区域:B1:B22 (这些区间断点或界限必须按升序排列) 选择标志 2) 输出选项 输出区域: C1 选定图表输出
(2).单击确定,Excel将计算出结果显示在输出区域中。
2
图2 数据分析工具之直方图对话框
Excel将把频率分布和直方图放在工作表中,如图3.3所示,输出表的C和D列中包括开始指定的界限。这些界限实际上是每一区间的上限,也就是说,界限实际上是边界。
图3 频数分布与直方图
为了使图表更像传统的直方图和更易于理解,可双击图表并对它做如下修改:
1.图例:因为只有一个系列的数据显示在图表中,所以不需要图例。单击图例(位于图表右侧的“频率”)并按Delete键。
2.图表区:绘图区是以X和Y轴为边界的矩形区域。通过在柱形上面单击可选取绘图区,单击鼠标右键并选择绘图区格式,将边框改为无并将区域改为无,单击确定。
3.条宽:在传统的直方图中,柱形是彼此相连接而不是分开的。选择某个柱形,单击鼠标右键,选择数据系列格式,并单击选择标签,将间距宽度从150%改为0%,单击确定。
4.X轴标志:选取x轴,单击鼠标右键,选择坐标轴格式,单击对齐标签,将方向从自动改为水平文本,在这种设置下,即使图表已重置尺寸,x轴标记也会变为水平的,单击确定。最后的直方图4.6
3
直方图765频率43210100120140160180200组距220240260280300图4 修改后的直方图
二、不指定接受区域直方图
在进行探索性分析时,为了方便,通常不指定接受区域作直方图,步骤如下: (1)选择工具菜单之数据分析选项, 在分析工具框中“直方图”。如图4所示。
1) 输入
输入区域:A1:A51 接受区域:(该处为空) 选择标志 2) 输出选项 输出区域: B1 选定图表输出 (2).单击确定,得结果。
(3)按前面方法对直方图进行进一步修饰即得图3.5
图5 修改后的直方图
三、 计数数据的透视表与条图
4
步骤如下:
(1)选择数据菜单之数据透视表和图表报告选项, 如图所示。
(2).选择数据源区域
(3)选定数据透视表位置,完成
5
(4)将“性别”作为行字段拖至G列,并将“性别”作为数据拖至数据项处,得下表结果
同理可得“文化程度”的透视表
此时如点击图形按钮,立即得到如下的透视图
6
(5)将“性别”作为行字段拖至行字段处,并将“文化程度”作为列字段拖至列字段处,将“性别”
或“文化程度”作为列字段拖至数据字段处得下表结果
7
实验三 统计图表
1、直方图
(1) 把实验一中的数据(A列、B列)复制到一个新的工作表中,从工具菜单中下拉选择数据分
析/直方图,点击确定按钮,打开直方图分析选项框。在“输入区域”中输入原始数据的引用范围,本题为$A$1:$A$51(或直接用光标圈选A列的数据),此外,勾选“标志”选项。
图2-1
(2) 在“接收区域”输入含分组标志值单元范围的引用,通常分组上限以升序排列。 (3) 给出输出区域,勾选“图表输出”或“累积百分比”,得到图表。并可对其进行修改(光标
移至图块处,单击右键进行所需要的改动)。
图2-2 图2-3
2、绘制图表
(1) 建立新工作表,输入数据。单击“插入”中的“图表”或直接点图表快捷图标,选择“标准
类型”中的“折线图”。定义“系列”要注意选择“分类X轴标志”,“系列”只有“国内生产总值”。
图2-4
接着选择坐标轴名称(包括单位)等,根据自己的喜好对图表进行修改,以最明了的方式显示出GDP的变化趋势。同样的方法,做条形图。示图如下。
8
图2-5 图2-6
(2) 绘制圆形图和环形图。
建立一个新工作表,输入数据,如下图。选择“图表”中的“饼图”。第一步是对于“数据区域”和“系列”的定义,一定要依据题意定义的准确;然后定义“标题”、“图例”和“数据标志”,如图。
图2-7 图2-8 单击“完成”,然后依据自己的喜好修改图表,力求直观、美观、明了。同理,做环形图。
图2-9 图2-10
3、制作散点图。
9
实验四 抽样估计
(一)Excel抽取样本常用函数 1.索引函数INDEX
索引函数 INDEX( ) 有两种形式:数组和引用。
?数组索引函数的语法为:INDEX(array,row_num,column_num)
?引用索引函数语法:INDEX(reference,row_num,column_num,area_num) 2.随机数函数RAND( )
?随机数函数RAND( )用于生成一个大于等于 0 小于 1 的均匀分布随机数,每次计算时都将返回一个新的数值。其语法结构为:RAND( )。 3.取整函数CEILING
?取整函数CEILING将参数 Number 沿绝对值增大的方向,舍入为最接近的整数或基数 significance 的最小倍数。其语法结构为:CEILING(number,significance)。其中:Number为待舍入的数值。Significance为基数。
实验内容:从50名学生考试成绩中抽取7名学生成绩。 实验步骤: ① 利用实验一“考试成绩”资料,建立工作表。
图4--1 ② 选择C2:C8单元格,在工具栏中单击“函数”快捷按钮,打开“粘贴函数”对话框,在“函数分类”
列表中选择 “数学与三角函数”,在“函数名”列表中选择“随机函数“RAND”,打开随机函数对话框如下图所示。
图4--2
③ 随机函数对话框中不需要填加任何数据,按住Ctrl+Shift键,单击“确定”按钮,在单元格C中将
显示一组随机数。
?下面将0和1之间的数转换为整数。
④将单元格C中的公式改为“ =50*RAND( )”,按住Ctrl+Shift键,单击回车键。区域C2:C8中的各数值均扩大50倍。同时工作表重新计算一次,各值均发生改变。
⑤选定D2:D8单元格区域,打开“插入”菜单,选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”中选择“数学与三角函数”,在“函数名”列表中选择“取整函数CEILING”,打开取整函数对话框如下图所示 。
10
图4--3
⑥在Number中输入单元格地址C2:C8,在Significance中输入1,按住Ctrl+Shift键,单击“确定”按钮。
⑦重复按F9键,在D2:D8各单元格中将出现介于1和50之间的随机整数,即将要抽取的样本点。 ⑧选定单元格区域E2:E8,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“查找与引用”选项,在“函数名”列表中选择“索引函数INDEX”,打开选定参数对话框如下图所示。
图4--4
⑨在选定参数窗口中,选择引用(reference),单击“确定”按钮,进入索引函数INDEX窗口如下图所 示
图4--5
⑩在Reference中输入A2:A51,为抽取样本提供区域。在Row-num中输入D2:D8,说明在 Reference区域中要选哪些值。按住Ctrl+Shift组合键,单击“确定”按钮,即得到随机抽取的样本容量为7的样本。每按一次F9键,工作表都将重新抽取一次样本。 注意:使用这种方法抽取的样本有可能是重复的。 (二)区间估计
实验材料:
某饭店在7星期内对49位顾客的消费额(元)的抽查调查资料:
15 24 38 26 30 42 18 30 25 26 34 44 20 35 24 26 34 48 18 28 46 19 30 36 42 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26。求在概率90%的保证下,顾客平均消费额的估计区间。
11
第一步:把资料1中的数据输入到A2:A50单元格。
第二步:在C2中输入公式“=COUNT(A2:A50)”,C3中输入“=AVERAGE(A2:A50)”,在C4中输入“STDEV(A2:A50)”,在C5中输入“=C4/SQRT(C2)”,在C6中输入0.90,在C7中输入“=C2-1”,在C8中输入“=TINV(1-C6,C7)”,在C9中输入“=C8*C5”,在C10中输入“=C3-C9”,在C11中输入“=C3+C9”。在输入每一个公式回车后,便可得到上面的结果,从上面的结果我们可以知道,顾客平均消费额的置信下限为29.73536,置信上限为34.26464。
图4-1 参数估计数据及结果
关于总体方差的估计、总体比例的估计等可按类似方法进行。
12
实验五 相关与回归实验
一、简单线性相关分析
1.Excel进行相关分析:
(1)输数据: 将数据输入A1:C9单元格。 (2)绘制散点图:
图1 简单相关系数及散点图
2. 计算相关系数
(1) 选择工具菜单之数据分析选项, 在分析工具框中“相关系数”。
相关系数对话框将显示为图2所示,它带输入输出的提示。
图2 相关系数对话框
1) 输入
输入区域:B1:C9 分组方式:逐列 选择标志位于第一行 2) 输出选项 输出区域: A13
(2).单击确定,Excel将计算出结果显示在输出区域中。 4. 相关系数假设检验
(1) 在单元格F14中输入公式 =B15/SQRT((1-B15^2)/(8-2)) 计算得相关系数的t值为49.46
13
(2) 在单元格F15中输入公式 =TDIST(ABS(F14),B-2,2) 计算得 p=0.0001
(3) 结论: 由于r=-0.9689, 且p<0.05, 所以, 在0.05水平上拒绝原假设, 认为产品产量与单位成本间有负的线性相关关系
二、 简单回归分析
上面的简单相关分析只是说明两变量之间的线性关系密切的程度,如果要建立它们之间线性依存的关系式,就需用回归分析。可按下列步骤使用“回归”分析工具: 1. 输数据: 将数据输入A1:C9单元格。 2. 回归分析:
(1) 选择工具菜单之数据分析选项, 在分析工具框中“回归”。回归对话框将显示为图3所示,
图3 回归分析对话框
1) 输入
Y值输入区域:C1:C9 X值输入区域:B1:B9 标志: 选择
常数为零: 只有当用户想强制使回归线通过原点(0,0)时才选此框
置信度: Excel自动包括了回归系数的95%置信区间。要使用其他置信区间, 选择该框并在
Confidence Levet框中输入置信水平
2) 输出选项 输出区域: D1 3) 残差
残差(R):选择此框可得到预测值和残差(Residual)。
14
残差图(D): 选择此框可得到残差和每一x值的图表。
标准残差(T):选择此框可得到标准化的残差,每一残差被估计标准误差除)。这一输出可使曲
线较容易分层。
线性拟合图(I):选择此框可得到一含有y输入数据和拟合的y值的散点图。 4) 正态概率图: 绘制因变量的正态概率图
(2).单击确定,Excel将计算出结果显示在输出区域中。
图4 回归分析结果
3. 回归解释
拟合回归线的截距和斜率放在图4的总结输出中标记有“Coeffients’’的左下部。截距系数77.30769是线性回归方程中的常数项,x系数-0.80769是斜率。回归方程是:
y=77.30769-0.80769 * x
图5 残差及拟合线
在图5所示的残差输出中,预测 y,有时又称拟合值,是用这个回归方程计算的单位成本的估计值。残差是实际值和拟合值之间的差值。
回答“拟合关系怎么样”问题的最通用的四个方法是标准误差,R2,t统计值和方差分析。标准误差0.83205显示在图4的单元E7中。作为残数的标准偏差,它衡量单位成本在回归线周围的分散情况,标准误差通常称为估计标准误差。
R(R Square),如图4的单元E5所示,衡量用回归线解释的因变量变化的比例。这一比例必
15
2
=average(E24:E27)。
第七步:计算调整系数:在B31中输入公式:=4/sum(B29:E29)
第八步:计算季节比率:在B30中输入公式:=B29*$B$31,并用鼠标拖曳将公式复制到单元格区域B30:E30,就可以得到季节比率的值,具体结果见图3-6:
图6 用EXCEL计算季节变动结果
21
实验六 抽样估计
(一)Excel抽取样本常用函数 1.索引函数INDEX
索引函数 INDEX( ) 有两种形式:数组和引用。
?数组索引函数的语法为:INDEX(array,row_num,column_num)
?引用索引函数语法:INDEX(reference,row_num,column_num,area_num) 2.随机数函数RAND( )
?随机数函数RAND( )用于生成一个大于等于 0 小于 1 的均匀分布随机数,每次计算时都将返回一个新的数值。其语法结构为:RAND( )。 3.取整函数CEILING
?取整函数CEILING将参数 Number 沿绝对值增大的方向,舍入为最接近的整数或基数 significance 的最小倍数。其语法结构为:CEILING(number,significance)。其中:Number为待舍入的数值。Significance为基数。
实验内容:从50名学生考试成绩中抽取7名学生成绩。 实验步骤: ④ 利用实验一“考试成绩”资料,建立工作表。
图1 ⑤ 选择C2:C8单元格,在工具栏中单击“函数”快捷按钮,打开“粘贴函数”对话框,在“函数分类”
列表中选择 “数学与三角函数”,在“函数名”列表中选择“随机函数“RAND”,打开随机函数对话框如下图所示。
图2
⑥ 随机函数对话框中不需要填加任何数据,按住Ctrl+Shift键,单击“确定”按钮,在单元格C中将
显示一组随机数。
?下面将0和1之间的数转换为整数。
④将单元格C中的公式改为“ =50*RAND( )”,按住Ctrl+Shift键,单击回车键。区域C2:C8中的各数值均扩大50倍。同时工作表重新计算一次,各值均发生改变。
⑤选定D2:D8单元格区域,打开“插入”菜单,选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”中选择“数学与三角函数”,在“函数名”列表中选择“取整函数CEILING”,打开取整函数对话框如下图所示 。
22
图3
⑥在Number中输入单元格地址C2:C8,在Significance中输入1,按住Ctrl+Shift键,单击“确定”按钮。
⑦重复按F9键,在D2:D8各单元格中将出现介于1和50之间的随机整数,即将要抽取的样本点。 ⑧选定单元格区域E2:E8,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“查找与引用”选项,在“函数名”列表中选择“索引函数INDEX”,打开选定参数对话框如下图所示。
图4
⑨在选定参数窗口中,选择引用(reference),单击“确定”按钮,进入索引函数INDEX窗口如下图所 示
图5
⑩在Reference中输入A2:A51,为抽取样本提供区域。在Row-num中输入D2:D8,说明在 Reference区域中要选哪些值。按住Ctrl+Shift组合键,单击“确定”按钮,即得到随机抽取的样本容量为7的样本。每按一次F9键,工作表都将重新抽取一次样本。 注意:使用这种方法抽取的样本有可能是重复的。
(二)利用利用随机数发生器生成样本并理解区间估计的含义
随机数发生器可以采用不同的分布抽取样本,这里采用正态分布,并假定总体的均值为100,标准差为15。操作如下:
①打开一个新工作表,取名为“模拟区间”。
②单击“工具”菜单的“数据分析”选项,打开“数据分析”对话框。从“分析工具”栏中选择“随机数发生器”,单击“确定”按钮,打开“随机数发生器”对话框如图所示。
23
图6
③在“变量个数”中输入15,在“随机变量个数”中输入1000,这将生成1000个样本量为15的随机样本。
④在“分布”对话框中选择“正态”选项。在“参数”对话框中的“平均值”中输入100,“标准偏差”中输入15。
⑤在“输出选项”中选择“输出区域”,输入地址A2,这样就建立了1000个样本量为15的随机样本。 ⑥在P1:V1各单元格中分别输入“均值”、“标准差”、“标准误差”、“t 值”、“估计下限”、“估计上限”、“逻辑函数”,在单元格Y1中输入“置信度”。在单元格Y2中输入置信度95%,它表示有95%样本所构造的置信区间包含总体均值。
⑥在单元格P2中输入公式为“=AVERAGE(A2:O2)”,计算样本的均值,使用填充柄依次计算到P1001。 在单元格Q2中输入公式“=STDEV(A2:O2)”,计算样本的标准差,显示的值是18.51349,使用填充柄依次计算到P1001。
⑦ 在单元格R2中输入公式“=Q2/SQRT(15)”,计算标准误差,即样本标准差除以15的平方根,显示值为4.78016154。使用填充柄依次计算到P1001。
⑧ 选定单元格S2,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择 “统计”,在“函数名”列表中选择函数TINV(查找并了解该函数的功能!因为这儿样本容量n=15,所以查T分布表)。单击 “确定”按钮,打开TINV函数对话框如下页图所示。
图7
⑨在Probability中输入1-$Y$2,Y2要绝对引用,在Deg_freedom中输入15-1。单击“确定”按钮后,在单元格S2中显示的值是2.144789。把该值一直复制到S1001。
⑩在单元格T2中输入公式“=P2-S2*R2”,以计算估计下限,其值为84.2337319。在单元格U2中输入公式“=P2+S2*R2”,以计算估计下限,其值为104.7386039。
24
实验七 统计指数
一、实验材料:某企业甲、乙、丙三种产品的生产情况资料(见电子表格5): 二、演示过程: (一)总指数
第一步:计算各个p0q0:在G2中输入“=C2*D2”,并用鼠标拖曳将公式复制到G2:G4区域。 第二步:计算各个p0*q1:有H2中输入“=C2*F2”,并用鼠标拖曳将公式复制到H2:H4区域。 第三步:计算Σp0q0和Σp0q1:选定G2:G4区域,单击工具栏上的“Σ”按钮,在G5出现该列的求和值。选定H2:H4区域,单击工具栏上的“Σ”按钮,在H5出现该列的求和值。
第四步:计算生产量综合指数Iq=Σp0q1/Σp0q0:在C6中输入“=H5/G5”便可得到生产量综合指数
注意:在输入公式的时候,不要忘记等号,否则就不会出现数值。
图1 用EXCEL计算总指数资料及结果
(二)平均指数
第一步:计算个体指数 k=q1/q0:在F2中输入“=D2/C2”。并用鼠标拖曳将公式复制到F2:F4区域。
第二步:计算k*p0q0并求和。在G2中输入“=F2*E2”并用鼠标拖曳将公式复制到G2:G4区域。选定G2:G4区域,单击工具栏上的:“Σ”按钮,在G5列出现该列的求和值。
第三步:计算生产量平均指数:在C7中输入“=G5/E5”即得到所求的值。
25
正在阅读:
统计实验项目11-11
中国自卸式垃圾车行业发展监测分析与市场前景预测报告目录03-05
员工参加集团公司“百日学习”发言材料范文04-03
励志之星演讲稿06-21
高分子化学与物理基础(魏无忌)答案08-13
2018-2024年中国土壤修复行业市场深度调研报告(目录) - 图文04-22
大学生部门面试问题02-20
专八听力新闻自测 3 - 图文06-04
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 统计
- 实验
- 项目
- 江苏省徐州市睢宁县宁海外国语学校九年级物理上册113功练习题苏科版
- 温度传感器实训
- 第十课 历史规律与人生目标
- 国内知识产权质押融资三种模式
- 图解分类 岩石学
- 大学生食堂消费状况
- 山西省安全防范工程设计施工备案证明申请表
- 转变观念,努力开创维稳工作新局面
- 江西省宜春市奉新一中2016-2017学年高二(上)第一次月考数学试卷(理科)(解析版)
- 《计算机应用基础》试卷
- 数学实验模拟试题
- 广东省高级人民法院关于审理房屋纠纷案件若干问题的意见
- 中国证券业协会培训C09020 股票估值 答案 100分
- 中国银监会关于印发并购贷款管理指引
- 求谏学案 人教课标版优质教案
- 河北工业大学理论力学期终试题
- 大工 15 春《水工建筑物》在线作业 2 答案
- 现场施工制度汇编byh
- 青岛版二年级下册数学教案(1) - 图文
- 《集成电路原理与应用》课程教学大纲