一 SPSS入门与用软件进行频数分析及画直方图

更新时间:2024-04-13 22:01:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一 SPSS基本操作入门

运用SPSS进行数据分析的基本步骤: 1、 进入SPSS界面,界面介绍:

SPSS 统计软件的主菜单及子菜单

主菜单 New 新文件 Undo 撤销 Status Bar 状态条 Define Dates Compute 通过计算Reports 数据报告 Gallery 图库 Variables 变量 File 文件 Edit 编辑 View 视图 Data 数据 Transform Analyze 转换 分析 Graphs 统计图 Utilities 自定义 定义日期 建立新变量 菜单项(下拉菜单) Open 打开 Redo 重复 Toolbars Insert 工具条 Variable Random Number Descriptive Statistics 描述性统计 Interactive File Info 交互式的 文件信息 插入变量 Seed 产生随机数 Open Database 打开数据库 Cut 剪切 Fonts 字体 Insert Case 插入样品 Count 计数 Compare Means 比较均值 Bar 条形图 Define Sets 定义变量集 1

Data Capture 获取数据 Copy 复制 Grid Lines 格线 Value Labels 值标签 Go Case to Recode 再编码 General Linear Model 一般线性模型 Line 线图 Use Sets 使用变量集 定位样品 Sort Cases Categorize Variables Read Text Paste Data 读取文本数据 Save 保存 Paste Variable 粘贴变量名 Save As 另存为 Clear 清除 粘贴 Correlate 相关 Area 面积图 Run Script 运行脚本 样品排序 将变量类别化 Transpose Rank 行列转置 Cases 求样品的秩 Regression 回归 Pie 饼图 Menu Editor 菜单编辑器 Merge Files Automatic Recode Loglinear 对数线性 High-Low 高低图 合并文件 自动编码 Display Data Info 显示数据信息 Find 寻找 Aggregate Create 汇总 Time Series 创建时间序列 Apply Data Dictionary 应用数据字典 Print 打印 Select Cases 选择样品 Print Preview 打印预览 Weight Cases 给样品加权 Exit 退出 Survival 生存分析 Multiple Response 多选项分析

2

Classify 聚类与判别 Pareto 帕雷托图 Option 选项 Split File Replace Data Reduction 简化数据 Control 控制图 分割文件 Missing Values 替换缺失值 Scale 测量分析 Box Plot 箱图 Nonparametric Error Bar Tests 非参数检验 误差图 Scatter 散点图 Histogram 直方图 2、定义变量

单击Variable View,进入变量编辑窗口,依次对所数据的名称、类型、宽度、小数点位数、标签等分别进行定义,做好数据输入准备工作。 3、输入数据(略) 4、保存数据(略) 5、预分析

目的:探测数据究竟是否适合使用某种统计分析方法 (1)简单描述

描述数据的基本情况,包括集中趋势和离中趋势。调用描述统计分析过程。 (2)图形描述

统计指标只能给出数据的精确指标,但无法直观的体现分布情况,通常通过绘制统计图形来显示数据是否基本上呈正态分布。

6、统计分析 结合题目要求以及预分析结果选择合适的统计分析方法。 7、保存和导出结果

一般选择保存结果文件或者是导出结果

保存结果文件:File——Save ,输出结果表现为*.SPO类型 导出结果: 右键——Export

二 频数分析与直方图

摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学

的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2 检验。 1 主要功能

调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的

3

方法之一,此外还可对数据的分布趋势进行初步分析。 2 用SPSS进行统计实例操作

[例1] (P74)新大学毕业生工资,试作频数分析和画出直方图。

激活数据管理窗口,定义工资的变量名为X,然后输入成绩的原始数据,并保存。 2.2 统计分析

点击Analyze菜单,选Descriptive statistics中的Frequencies...命令项,弹出Frequencies对话框。现欲对工资进行频数表分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框。同时可点击Format...钮弹出Frequencies:Format对话框,在Order by栏中有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。在Page Formal栏中可定义结果输出的格式。本例选Ascending values项后点击Continue钮返回Frequencies对话框。

点击Statistics...钮,弹出Frequencies:Statistics对话框,可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击Continue钮返回Frequencies对话框。

点击Charts...钮,弹出Frequencies:Charts对话框,用户可选两种图形,一是直条图(Bar chart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量x绘制直方图,故选择Histogram项,并要求绘制正态曲线(With normal curve),点击Continue钮返回Frequencies对话框,再点击OK钮即可。 2.3 结果解释

在输出结果窗口中将看到如下统计数据:

各基本统计指标,其中均数为1151.55, 标准误为20.589, 中位数为1160.00, 众数为1160, 标准差为144.123, 方差为20771.419,全距为730, 最

4

2.1 数据准备

小值为850, 最大值为1580, 25%位数为1060.00, 50%位数为1160.00, 75%位数为1225.00,共49个观察值,缺失值51。

Mean 1151.55 Std err 20.589 Median 1160.00 Mode 1160 Std dev 144.123 Variance 20771.419 Range 730 Minimum 850 Maximum 1580 Percentile Value Percentile Value Percentile Value 25.00 1060.00 50.00 1160.00 75.00 1225.00 Valid cases 49 Missing cases 51 接着输出系统对变量x的原始数据作频数分布表,Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Valid percent为各组频数占总例数的有效百分比、Cum Percent为各组频数占总例数的累积百分比。(表略)

最后系统输出带有正态曲线的直方图,由图中可见,数据基本呈现正态分布

形状。

工资12108642Std. Dev = 144.12 Mean = 1151.6N = 49.00850.0950.01050.01150.01250.01350.01450.01550.0900.01000.01100.01200.01300.01400.01500.01600.00工资 图4 频数分布的直方图

5

从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在8~15组的要求不符。为此,在调用Frequencies过程命令之前,可先对原始数据进行算术处理:已知最小值为850,最大值为1580,全距为730,故可要求分成8组,起点为849,组距为100。选Transform菜单Recode项的Into Different Variable...命令项,在弹出的Recode Into Different Variable对话框中选x点击使之进入Numeric Variable?Output Variable框,在Output Variable栏的Name处输入x1,点击Change表示新生成的变量名为x1。点击Old and New Values弹出Recode Into Different Variable:Old and New Values对话框,在Old value栏内选Range项,输入第一个分组的数值范围:849~949,在New value栏内输入新值:899,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击Continue钮返回Recode Into Different Variable对话框,再点击OK钮即完成。系统在原数据库中生成一新变量为x1,这时调用Frequencies过程命令将输出等距分组且组数为8[data][weight?]) 的频数分布表。(若已有频数分布表,可用加权的方式输入数据:3. 用EXCEL进行统计分析

实例为P43页表3.8学生成绩,把学生成绩输入到EXCEL中的A列(A2:A37),并对成绩数据进行排序。 3.1分组

3.1.1按照排序结果计算全距,确定数据项数、组数、组距和组限。 本例全距A37-A2=98-49=49,数据项数36,可分5组,组距=全距/组数=59/5?10。组限依次为:60以下,60~70,70~80,80~90,90~100。

3.1.2在B1和B2输入“按成绩分组(分)”,在B3至B8依次输入“60以下,60~70,70~80,80~90,90~100,合计”。由于FREQENCY 函数要求按上限分组,其统计结果是包括上限不包括下限,并且输入n个组限会给出n+1个组。所以在B10至B13输入组限“59.5,69.5,79.5,89.5”。在C1、D1输入“次数”,在E1、F1输入“向上累计”,在G1、H1输入“向下累计”。在C2、E2、G2输入“人数(人)”,在D2、F2、H2输入“比重(%)”。选定C3至C7作为放置分组结果区域。然后,从“插入”菜单中选择“函数”,在弹出的“插入函数”对话框中点击“选择类别”栏中的下拉箭头,选择“统计”,再在“选择函数”栏中选择“FREQURNCY”函数,单击确定进入“FREQURNCY”函数参数设置对话框。

6

3.1.3在Data_array文本栏中输入待分组的原始数据区域,本例为“A2:A37”; 地Bins_array 栏中输入组限,本例为“B10:B13”。最后按Shift+Ctrl+Enter组合键,即得各组频数结果。

3.1.4计算次数比重和累计次数、累计比重。直接利用公式再加填充柄即可。

3.2画直方图

单击“插入”出现“图表导向?”对话框,单击下一步出现“数据区域”对话框,在“数据区域”中输入次数数据区域,本例为C3:C7,单击下一步,便出现图形。然后右击直方体内,出现“数据系列格式”对话框,点击“选项”把“分类间距”调整为0就可以得到不留空隙的直方图。 3.3进行描述性分析

3.2.1计算平均数、标准差、方差、调和平均数、众数、中位数、最大值、最小值等统计量的方法。先输入数据,其次点击存放结果的单元格。接着点击“插入/函数/统计/要计算的统计量名称(英文)”,然后选择数据区域后点击确定即可。

1.计算平均数的统计方法:插入/函数/统计/AVERAGE; 2.标准差:插入/函数/统计/STDEVPA; 3.方差:插入/函数/统计/VARPA;

4.调和平均数:插入/函数/统计/HARMEAN; 5.众数:插入/函数/统计/MODE; 6.中位数:插入/函数/统计/MEDIAN; 7.最大值:插入/函数/统计/MAX; 8.最小值:插入/函数/统计/MIN。 3.2.2计算全距和标准差系数

利用公式进行:找到存放公式所需统计量的数据所在单元格,进行单元格与单元格运算。

全距=存放最大值数据的单元格-存放最小值数据的单元格;(全距=最大值-最小值)

标准差系数=存放标准差数据的单元格/存放平均数数据的单元格。 (标准差系数=标准差/平均数)

7

本文来源:https://www.bwwdw.com/article/ffkp.html

Top