SPSS北大社会学系讲义分解

更新时间:2023-03-08 05:10:44 阅读量: 高等教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

SPSS数据分析技术课程提纲

教材:自编讲义

阮桂海主编, 2000,《SPSS实用教程》电子工业出版社 课程内容

第一讲 SPSS基本知识及数据录入 一.概述

二.SPSS的基本模块 三.SPSS的基本窗口 四.SPSS文件类型 五.问卷及编码 六.什么是数据

七.数据录入——问卷资料转变为原始数据文件 (一)WORD中录入

(二)在 EXCEL中录入数据 (三)在SPSS中录入 (四)Epidat录入

(六)数据文件的编辑与管理

第二讲 SPSS命令文件的编写 一 ·SPSS的命令文件 (一)Data list

(二)Variable label的命令格式 (三)value label的命令格式

(四)程序中的缺少值(Missing Value命令)

第三讲 用Frequencies做数据汇总 一. 数据汇总使用的数据类型 二·频次统计及统计量的计算 (一)Statistics——统计量 (二)画图

第四讲 描述性统计(Descriptives与Explore的应用) 一.Descriptives (一)应用实例 (二)统计量分析 二.Explore分析

第五讲 数据变换

一.Recode 命令对数据重新编码 二.用Compute命令创建新变量 三.COUNT命令

四.用If命令做条件变换和逻辑校

第六讲 交叉汇总与关联分析(Crosstabs的应用) 一. 交叉汇总表的一般形式及其特点 二. 交互表的检验——两个变量之间是否相关 三. 两个变量之间相关的强度 (一)定类——定类

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

(二)定序——定序 (三)定类——定距 (四)定距——定距

四.运用CRPSSTABS做交互表及对变量之间的关系进行测量

第七讲 引进其他变量后的交互分析 一. 因果分析——explanation model 二. 阐明分析——Interpretation analysis 三. 条件分析—— conditional analysis

第八讲 描述子总体均值的差异(Means过程的应用) 一.Means过程运行 二.One Sample T-Test

第九讲 均值比较分析(T——Test过程) 一.独立样本T检验 二.成对样本T-TEST 三.注意事项

第十讲 方差分析ANOVA 一. 实例 二. 解释

第十一讲 相关分析(Correlate过程分析) 一.Bivariate Correlate

二.Partial correlation偏相关(也叫净相关) 三.距离分析(Distance)

第十二讲 简单线性相关(一元线性回归分析) 一.回归分析对变量的要求(假设条件) 二.一元线性回归模型及其含义 三.在对话框中做一元线性回归模型

第十三讲 SPSS统计图形 一.Bar条形图

二.Line线图——年龄与收入 三.Area面积图 四. Pie饼图 五. High-LOW 高低图 六.Pareto 帕雷托图 七.Control 控制图 八.Boxplot 箱图

九.Error Bar 误差条图 十.Scatter 散点图 十一.Histogram 直方图 十二·P-P:P-P 概率图 十三·Q-Q:Q-Q 概率图 十四·Sequence 序列图

十五·Time Series 时间序列图

第十四讲 非参数检验

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

SPSS数据分析技术

第一讲 SPSS基本知识及数据录入 一.概述

SPSS(statistical package for the social science)是美国SPSS公司开发的社会科学统计软件,SPSS最初的几个版本都是在DOS系统下运行,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。90年代以来,由于MS Windows的普及,SPSS公司于1992、1993、1994年相继推出了在Windows操作系统下的5.0, 6.0 6.1版本,随着Windows95与WindowsNT3.5以上版本的32位操作系统的出现,1997年以来又相继推出了8.0,9.0,10.0及11.5版本。11.5版本的界面与10.0版本相比没有什么变化,只是增加了一些统计功能和方法。与其他版本相比,11.5版本的用户界面更为友好,使用更加方便,统计功能更为强大。它的基本特点有四个:

[1]大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便;

[2]命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项;

[3]可以与其他数据转换接口,其他软件生成的数据,可以转化为SPSS数据 [4]与其他Windows兼容,输出结果可以复制到WORD,以便进一步编辑。

二.SPSS的启动及基本模块

BSPSS 11.0版一共由十个模块组成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests

Missing Value Analysis Maps

三. SPSS的基本窗口 (一)打开SPSS

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

(二)基本窗口-Data Editor

File 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。 Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替

换等操作。

View 浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以

及数值标签等功能的操作。

Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、

变量值的选择等

Transform 数据变换菜单,创建新变量、重新编码、计算同值的次数等。 Analyze 统计过程菜单,完成各种统计分析。 Graphs 统计图表,完成统计图表的建立与编辑

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

Utilities 实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗

口设计等。

Windows 窗口控制,可进行窗口的排列、选择和显示操作 Help 帮助文件, 帮助文件的调用、选择和显示等操作。

(三)SPSS的其他窗口

在SPSS的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。 另一个是结果输出窗口,标题名称是“!Output1”,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。

当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称是“!Syntax1”,或选Window菜单的!Syntax1项也可激活命令编辑窗口。用户可利用该窗口进行SPSS命令的输入、编辑和运行,这对熟悉DOS版本的SPSS用户是十分方便的。

上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有两种方法可帮助用户看到全部内容:

1、使用窗口的滚动条 每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。如此,用户便可看清所有内容。

2、改变窗口的大小 一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。

SPSS的退出

完成SPSS的统计分析后,退出该系统的方法是:选File菜单的Exit项,回答系统提出的有关是否需要存储原始数据、计算结果和SPSS命令之后,即退到Windows的程序管理器中。

SPSS的求助系统

SPSS提供了丰富且详尽的在线帮助。主要有下列几种方式:

1、主窗口的Help菜单:在软件运行的任何时候,点击Help菜单选相关的子菜单,可得到所需的各种帮助。

2、主窗口的Utilities菜单:在Utilities菜单中,有Command index...子菜单,它提供有关SPSS各项统计分析技术能解决什么问题的信息。 3、各种对话框中的Help钮:在具体操作过程中,当弹出某一对话框时,一般总有Help钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。

4、结果输出窗口中的Grossary钮:当用户在浏览计算结果时,可点击结果输出窗的Grossary钮,它显示各种专用统计术语的解释信息以便用户理解。

5、命令编辑窗口中的Syntax钮:激活命令编辑窗,可见一Syntax钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

四.SPSS文件类型

1.原始数据文件及其类型 *. Dat(原来还有ASCII码) 生成方法

DOS中的EDIT WORD中的·TXT EXCEL中的·XLS DBASE中的·DBF

以上形式的数据文件在SPSS中可以直接调用 打开一个已有的数据文件的方式如下:

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

2.数据文件

*·SAV *·SAS(原来)

数据文件可以根据原始数据的转换获得 3.图形文件 *·CHT 4.命令文件 *·SPS

5.结果文件 *·SPO(OUTPUT, 原来是·LST)

五.问卷及编码

1. 多选择题的处理(0,1编码) 2. 多位题(要补位)

3. 缺失值,以9结尾,如年龄,编码为99,如答案正好是9,以0替补

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

4. 不适用,以8结尾,8,98,998,如答案正好是8,以0替补。如有四个可选项的多选题而不适用,则为8888。 六.什么是数据

数据是一个矩阵,行是一个case在多维空间下的位置,列是不同空间的维度用来分析用行收集到的资料。

数据分析:用微观的方法分析宏观的资料,分析平均人、平均的体系;这个分析都是在平均的基础上,这种推断是不能还原到个案的,分析的过程是不断抛弃个人影响的过程。

数据的计算机表示法:变量------问卷中的每一个问题, 在dBASE中称为字段(Field) 变量名---变量名以字母为首,后面跟A---Z, 0-----9字符(字符≤8个字符), 变量名不能带扩展名,如 A1·1。 变量值----变量的答案 七.数据录入——问卷资料转变为原始数据文件 (一) WORD中录入,存成·TXT 1.方法:打开WORD文档,录入数据

固定格式:这种数据要根据已经确定的栏目位置对号入座地录入数据,在对问卷进行编码时,指定了各个项目的数值与栏位(书P10),给数据指定栏目位置时,前后数据一般不留空格,这样可以提高数据录入的速度,缺点是前后的数据不太容易区分。如: 栏位(列号)

1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0 0 0 0 1 2 2 6 1 5 0 0 0 0 0 0 2 2 3 1 4 0 0

自由格式P22:按照问卷编码方案将某个个案数据直接录入,中间可以没有任何空格和其他符号,也可以在输入时在不同的变量之间以空挡、逗号、分号等把变量分开,不同个案之间的数据要对齐,数据录入完成以后,存成*·TXT文件 2.把 ·TXT文件转变为*·SAV文件

SPSS——File--------Read Text Data-----------点选*·TXT-------对话框(六步),即Text Import Wizard-------Fixed wide------No------下一步--------The first case begins on which line----------划线即可-------下一步完成

SPSS——File--------Read Text Data-----------点选*·TXT-------对话框(六步),即Text Import Wizard-------Delimite-------下一步--------SPACE-------下一步--------完成

如果特殊数据、负数、小数点多时,则不用这种方法,可以用EXCEL录入。

(二) 在 EXCEL中录入数据 打开EXCEL表

不用补0,可以录入汉字,速度较慢,一般在小样本时用比较好。 第一行录入变量,第二行开始录入数据

文件保存类型:*·XLS(·工作簿BOOK) 转变为为*·SAV文件:

SPSS--------File--------Open---------Data----------点选文件类型*·XLS-------点选BOOK-------OK------存成SPSS的*·SAV文件即可

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

用EXCEL录入的优点:

[1]可以进行各种计算,如数学与三角函数 [2]可以进行位置计算,还可以直接COPY [3]可以用EXCEL做辅助分析,进行数据变换 [4]可以作表,非常方便

(三)在SPSS中录入

直接在SPSS WIN中录入数据

方法:SPSS——FILE——NEW DATA——点选Data View(数据浏览界面)——录入数据——存成*·SAV,适合于较小的样本

在Data View(数据浏览界面)中录入的数据还没有在各个数据之间区分意义,可以在Variable View(变量浏览界面)中对录入数据的意义进行界定,这个工作也可以在问卷数据录入前做,也可以在数据录入后做。

点击Variable View(变量浏览界面),对变量进行定义。定义变量有10种功能选项,

[1]Name: 变量栏名,在这个栏目中输入变量名,如 V1、V2、 age sex 或其他名称。

定义变量名注意:

A.变量名以字母为首,后面跟A---Z, 0-----9字符(字符≤8个字符), ? ! / ‘’等不能作为变量名, 变量名也不能带扩展名,如 A1·1。

B.有些关键词不能作为变量的名字,如 AND OR NOT EQ LT LE GT GE NE NE TO BY——crosstabs WITH ALL THRU P---Percentage SPSS中不区别大小写字符

可以用中文做变量名,但最好不用,因为涉及一个兼容性问题。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

[2]Type:变量类型, 有8种类型可供选择

Numeric:数值型变量,系统默认值为数值型,系统默认长度为8,小数位数为2

Comma:带逗号的数值型变量,即整数部分每3位数加一逗号,其余定义方式同数值

型。输入:1,287,300,显示:1,287,300

Dot:带圆点的数值型变量,3位加点数值型,无论数值大小,均以整数形式显示,每3

位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为 12.345,00(实际是12345E-4).

Scientific notion:科学记数法 输入:253.7E2,输出:253.7E2 Date:日期型变量,有27种表示方法。点date即可以看到 Dollar:货币型变量,有12种表示方法

Custom currency: 自定义型变量,是一种用户利用Edit 菜单的Options功能定义的。

String:字符型变量

一般最常用的是数字型变量与字符型变量。

日期型变量格式:

dd—mmm—yyyy 日日-月月月-年年年年

mm/dd/yyyy 月月/日日/年年年年 qQyyyy 季度Q年年年年 mMmyy 月份年年 wWWKyy 周数WK年年 hh:mm:ss 时时分分秒秒

SPSS中存储的实际上是该时间与1582年10月14日零点相差的秒数,如1582年10月15日存储的就是60×60×24=86400,在我们把变量类型变换为数值型时可以看到这种数字。如定date的类型为mm/dd/yyyy,输入10/15/1582, 当我

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

们把日期型数据转变为数值型数据时,看到数据变为86400。

货币型变量格式

格式 总长度 小数位数 $# 2 0 $# # 3 0 $# # # 4 0 $# # # ·## 7 2 $# ,# # # 6 0 $# , # # # · # # 9 0 $# # #,# # #,# # #,# # # 16 0 $# # #,# # #,# # #,# # # ·# 19 2 # 要求:能够辨别数值型、字符型与日期型变量就可以。 [3]width:宽度,指的是运算宽度,默认值为8,运算宽度实际上只会改变输出结果的显示宽度,数据的存储结果与运算的精度不受宽度的影响。

[4]Decimals:小数位数,根据每个变量数据的大小,定义小数的位数 [5]Label :变量标签, 给相应的变量以文字说明 [6]values:数值标签,

value 1 value 男 add 最后点OK

[7]missing values缺失值,有三种选项

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

No missing values 没有缺失值

Discrete missing values 定义1—3个单一数为缺失值

Range plus optional discrete values 定义指定范围为缺失值,同时指定另外一个不在这一范围内的单一数为缺失值

缺失值的意义是指某一项值数值缺失,软件在进行统计时不将其考虑进去。

用户自己把特定的数据界定为缺失值,则为用户缺失值user-missing. 如可以把把被调查者拒绝回答或者问题不合适而没有回答的情况界定为用户缺失值9

系统缺失值 system missing主要是指计算机默认的缺失方式,如果在录入数据时空缺了某些数据,计算机就把其界定为缺失值,这是的数据标记为‘· ’,而用户界定的缺失值则不会在数据显示时出现‘· ’。

[8]columns:定义数据管理器纵列的长度 [9]字符排列方向:有三种选择 left左对齐 right 右对齐 center 居中

[10] measure:数据量度选择,有三种: scale 连续型变量,是测量的最高层次。 ordinal 定序型变量 Nominal 定类型变量

将变量定义完毕,点击数据编辑窗口,定义的变量会自动地出现在窗口中。 如何定义,进行操作演示

数据录入和变量定义完毕,可以将其存成*·sav文件,然后就可以用这些数据进行统计分析

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

(四)Epidat录入

http:/1121.91.14.201/php/index.php http:/www.epidata.dk 下载软件Epidat

建立数据描述文件——建立数据文件——数据录入——数据输出 *·qes *·rec dbase; excel;txt;data 屏幕设计 逻辑校验*·chk 1. 打开Epidat

[1]Define data——点选new qes file——建立一个空的untitled1文件,qes是qustionaire的缩写

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

[2]把空文件untitled1文件存成一个你想要的文件名(如存成first.qes)

方法:file菜单—— save as ——出来一个对话框——把untitled1改成 first.qes

[3]在空白的EpiEditor中录入——相当于变量名、变量标签、变量值的界定 录入原则: A. 必须有一个变量的名字,如V1, Sex, occupation等 B. 对变量进行描述,如V1 “个案号” “出生年月”等 C. 对变量录入的定义说明:Shift +#——#号键

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

变量有几个码,就打几个#键 V1 sex# 1:M 2:F V2 Income ####

[4]录入完成以后存盘。File------save as ----------first.qes或Ctrl+S [5]看一下录入变量的格式

找preview the dataform(左边工具栏第三个), 或按一下Ctral + T键。

在屏幕上你可以看到变量的格式,这相当于预览,在里面的空白处录入东西没

有用。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

2. Make datafile

Make datafile——Make datafile——默认 Enter name of ·qes Enter name of datafile (当然也可以改成自己喜欢的路径,但·qes 与·rec不能改) 点OK——生成first·rec文件 first·qes是数据描述文件,first·rec为建立了数据文件 rec为record 的缩写 3.Add Checks

经常出现Checks无法进入,碰到这种情况,点File——Close all, 把所有打开的文档关闭即可)

对录入数据的方式进行某种专门的规定,如果没有可修改的,则直接录入数据

修改检查 A. Value label——赋值(sex income等) B. Range/legal——规定变量值的范围(10-80,99) C. Jumps——跳答1>write 如果是回答1的 ,跳到职业(S2):录入1>S2 D. Must enter——一定要录入某个值(yes ) E. RepeatNo ——一般选择NO,把以前录入的某个值在出现类似情况时进行

复制。 修改完成以后或逻辑校验完成以后的数据存成fiest·chk 4.Enter Data

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

对话框——找first·rec——录入完毕——点File-----close form

5. Document 6. Export data 存成SPSS等

7. 打开SPSS----- File-----open-------syntax------first.sps-----select all------点黑-------RUN(运行)

点数据窗口--------可以看到已经转换好的数据 FILE-------SAVE AS 存成SPSS的SAV文件。

(五)数据文件的编辑与管理

数据录入完成以后,对数据进行编辑与管理非常重要,这可以为分析打下基础。编辑与管理主要的操作有: 1.增加新的变量(Insert Variable)

激活待增加新变量区的那个变量, Data-------Insert Variable,系统会自动为

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

用户插入一个新的变量var00001,用户可以根据需要对其进行定义并录入数据。

2.增加新的个案(Insert case)

如果要在第29个个案之前增加一个新的个案,可先激活第29个个案的任一单元格,然后点击Data菜单中的Insert case, 系统会自动为用户增加一个新的观察行,默认为第29个个案,原来的第29个个案观察值变为第30个观察值,然后可以录入数据。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

2.删除一个变量列(Delete Variable)

点选要删除的列,点Edit菜单中的CUT或按Delete键 3.删除一个个案(delete case)

点选要删除的那个个案,点Edit菜单中的CUT或按Delete键 4.查找个案(Go To Case)

如果数据量很答,查找某一个观察值就很有必要,如果想查找第10个观察值,则点击Data中的Go To Case, 出现对话框 case number 10------OK即可

5.数据的排序(Sort Case)

Ascending 升排序 Descending 降排序

可以对某一个变量为基准进行排序 5. 数据的行列对换(Transpose)

点击Data菜单中Transpose,出现对话框

对话框左侧是需要转换的变量,全部点击进入对话框右侧——OK 转换后的数据行列的位置发生了改变 6.数据文件的拆分(Split File)

在进行数据处理时经常要对文件中的观察值进行分组分析,如要求求出不同性别人员的平均收入,但是男女的收入数据是在一个数据文件中,在进行分析以前,可以对数据进行拆分,这里的拆分不是将一个数据分成两个文件,而是进行按性别变量为基础的排序,创造对男女收入数据进行分别分析的条件。 点击Data菜单中的Split File,打开Split File对话框, 为了获得对不同组别观察值的各自分析,选择Compare Groups选项,系统默认的是对数据文件中所有的观察值进行分析,选择性别进入Groups Based On对话框,指以性别作为分组的依据。在Groups Based On对话框下有两个选项: File is already sorted指数据文件已经按照选择的变量排序;Sort the file by grouping variables是指要求按照所选择的变量对数据文件进行排序,在本例选择这一项。 然后点击OK,即可完成对数据文件的拆分。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

7.数据文件的合并(Merge Files)

合并数据文件包括两种方式:一种是从外部数据文件中增加观察量到当前数据文件中——add cases; 另一种是从外部数据文件中增加变量到当前数据文件add variables.

将liu1·sav的个案添加到liu·sav

add cases: 点击Data------Merge File----add cases-----弹出Add Cases: Read File对话框——打开liu1·sav——弹出对话框Add Cases From D:\\liu1.sav——对话框左侧为不能匹配的变量,右侧是可以匹配的变量,如果在合并时出现两个数据文件的变量不能匹配的情况,就一定要对变量进行处理,使其能够完全匹配,然后再进行合并。 add variables:要将liu2·sav中的变量横向合并到liu·sav中去,以某个变量为基点将同源的两部分数据连接在一起,一般是用ID或身份记号, [*] 原文件中的变量; [+]新文件中的变量。

8. 数据文件的分类汇总(Aggregate)

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

9.

对数据进行分类汇总就是按照指定的分类变量值对观察值进行分组,对每组观察量的各个变量求描述统计,生成新的数据文件,在新数据文件中对应分类变量的每一个值产生一个观察量。如在liu·sav中要对30个人的身高、体重按照年龄、性别进行分类汇总,求平均值。具体操作为:

Data-------Aggregate-------弹出Aggregate对话框——将性别、年龄变量选入Break Variables框中,表示要以年龄、性别作为分组变量——在Aggregate Variables框选入身高、体重,表示要将身高、体重进行汇总。系统会默认新的变量名,但是我们可以根据自己的需要对变量名进行变换。

用Aggregate换可以进行其他很多计算,如 means of values:求平均值 Standard deviation 标准差

First value 只保留该组的第一个数值 Minimum value 只保留该组的最小值

Last Value 只保留该组的最后一个数值 Maximum value 只保留该组的最大值 Number of cases 合计该组的观察数值 Sum of values 求和

Percentage above 先确定一个数值,求大于该数值的所有个案占总个案的百分比(%)

Percentage below 先确定一个数值,求小于该数值的所有个案占总个案的百分比

Fraction above 先确定一个数值,求大于该数值的所有个案占总个案的比例(0-1)

Fraction below 先确定一个数值,求小于该数值的所有个案占总个案的比例

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

(0-1)

Percentage inside 先确定一个下限,再确定一个上限,求在该区间内个案占

总个案的百分比(0-100%)

Percentage outside先确定一个下限,再确定一个上限,求在该区间之外个

案占总个案的百分比(0-100%)

Fraction inside 先确定一个下限,再确定一个上限,求在该区间内个案占

总个案的比例(0-1)

Fraction outside 先确定一个下限,再确定一个上限,求在该区间内个案占

总个案的比例(0-1)

Aggregate命令非常有用,如我们入户调查得到了一家人所有的资料,包括 编号、年龄、收入。根据这些资料,我们可以计算家庭负担系数,即大于 60岁和小于18岁的人口占家庭总人口的比例。 DATA---Aggregate-----age-----per-----outside Low 18 High 59

------continue-----新生成的变量即为家庭负担系数

还可以算年龄均值、人均月收入。选择-----percentage, value---1 家庭人口数-----INC----number of cases 家庭总收入----INC--- number of cases

然后把这些新得到的变量存成默认值或者是你希望的文件,然后你可以看

下生成的到底是什么变量。 File ---open---找文件---新生成的变量与一般调 查得到的变量是一致的,因此可以进行匹配,这个时候可以用Merge命令

9.数据的选择( Select Cases)

数据文件中收集到的数据,在进行分析的时候只需要用其中的一部分,则可以用Select Cases命令

点击Data------ Select Cases---弹出Select Cases对话框,左边为可以进行选择的变量名,右边是选择的6个功能:

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

all cases 包括所有观察值

if condition is satisfied 仅当某种条件满足时

random sample of cases 表示对观察单位进行随机抽样——大概抽样(approximately),键入抽样比例后由系统进行抽样;精确抽样(Exactly)——要求从第几个观察值起进行抽样

based on time or case range 顺序抽样,点击Range…钮, 弹出Select Cases:range对话框,然后定义从第几个观察值抽样到第几个观察值。

use filter variable 如果数据文件已经存在一个观察量或专门为过滤观察量建立了一个变量,该变量值为0的要剔除,该变量取其他值的为准备分析或保留用。

unselected cases are 是确定处理时未被选取的观测量的方式。

10.对变量进行加权(weight cases)

点击Data------ weight cases-----弹出weight cases对话框- do not weight cases

weight cases by ----选择一个变量做加权,往往使用频数作为加权变量。 例:数据文件的数据排列为 code sex age income household 01 2 34 1500 3 02 1 25 2500 4 03 1 43 2000 5 04 2 17 0 3 如果household代表的是该个案相应性别的家庭人口数,则以household作为加权变量,然后看性别,我们的操作是把household变量放到weight cases by框中,

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

此时如果看数据,则看不出来我们到底对数据进行做了什么变换,对性别变量做一下频次分析,可以发现频次统计结果是:SEX

Frequen Percent Valid Cumulat

cy Percent ive

Percent

Valid 1.00 9 60.0 60.0 60.0

2.00 6 40.0 40.0 100.0 Total 15 100.0 100.0

加权的原则:是把加权变量的值赋在其它你希望计算的变量上,以家庭相应性别人口作为加权,在加权时家庭户人口数这个值就赋到了性别变量上,对性别变量进行频次统计,统计出来的数据含义可以这样理解:性别是1的有9人,性别为2的有6人。而如果我们以性别变量来看household,则会发现性别1的人正好是9人(4+5),性别2的人正好是6人(3+3)。

调用Weight Cases命令完成定义后,SPSS将在主窗口的最下面状态行中显示Weight On字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示Weight On字样,意味着数据加权命令依然有效。

本文来源:https://www.bwwdw.com/article/cxa.html

Top