SPSS数据录入

更新时间:2024-06-30 22:03:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、编码录入6 i. k6 m0 @; F2 K0 q

调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。要根据问卷问题的不同定义变量。定义变量值得注意的两点:1、区分变量的度量,其中Scale是定量、Ordinal是定序、Nominal是指定类;2、注意定义不同的数据类型。0 l; P8 W7 _\

各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,现详细举例介绍如下:& u# j# J3 f$ C2 A\ 1、单选题:答案只能有一个选项# q0 \\4 _7 m2 q

例一、当前贵组织机构是否设有面向组织的职业生涯规划系统?# m/ W8 |6 q& |\ A有 B 正在开创 C没有 D曾经有过但已中断7 Y4 U; U) z, I: e

编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。 录入:录入选项对应值,如选C则录入3

2、多选题:答案可以有多个选项,其中又有项数不定多选和项数限定多选。 (1)方法一(二分法): 例二、贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。6 y' t1 ~- F5 U: JA月薪员工 B日薪员工 C钟点工! {7 ?9 {& D; S1 K

编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。

录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。9 B+ [% B5 P: U (2)方法二(多重分类法):( P( r- p8 M# P+ e: t\ 例三、你认为开展保持党员先进性教育活动的最重要的目标是那三项:$ `9 N& ]\o- s7 {1( ) 2 () 3( )

A、提高党员素质 B、加强基层组织 C、坚持发扬民主

D、激发创业热情 E、服务人民群众 F、促进各项工作; ^: X! P) L9 h4 i\

编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。3、排序题: 对选项重要性进行排序 例四、您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列)- q2 K1 T8 _\

第一位 第二位 第三位 第四位 第五位3 Z/ `& ]# w+ u- D

编码:定义五个变量,分别可以代表第一位~第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格- G, e1 w/ y4 R* Q$ Y

录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。6 v1 P$ P' J* Z) \\5 ^5 ]

4、开放性数值题和量表题:这类题目要求被调查者自己填入数值,或者打分8 T2 j) F4 }; K' Z; p' P3 {例六 你的年龄(实岁):______* e. O- a) a- B3 m 编码:一个变量,不定义Value值

录入:即录入被调查者实际填入的数值。& |- r4 ^5 S9 L$ ^& W* X2 E1 G6 d 5、开放性文字题:# b1 r V2 d L( e' }! i

如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。# L* Y( ]3 A2 [) R T% |1 R 二、问卷一般性分析/ H8 f( `\

1

下面具体介绍SPSS中问卷的一般处理方法,操作以版本spss13.0为例 ,以下提到的菜单项均在Analyze主菜单下

1、频数分析:Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。1 c# ?7 i! K5 K 适用范围:单选题(例一),排序题(例四),多选题的方法二(例三)6 I; U: \\% V8 D# k1 T 频数分析也是问卷分析中最常用的方法。/ L. |& d2 y) j& w+ p. G 实现: Descriptive statistics……Frequencies' J9 E5 O- a2 w2 ^/ F$ h 2、描述分析:Descriptives:过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。, J+ Y/ T\ 适用范围:选择并排序题(例五)、开放性数值题(例六)。

实现: Descriptive statistics……Descriptives,需要的统计量点击按钮Statistics…中选择 3、多重反应下的频次分析:; p% r- z6 H# w, [6 Q2 f, H 适用范围:多选题的二分法(例二)

实现:第一步在Multiple Response……Define Sets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入1。第二步在Multiple Response……Frequencies中做频数分析。

4、交叉频数分析:解决对多变量的各水平组合的频数分析的问题* U% ~: ~: r0 }2 h7 d 适用范围:适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表则一目了然。

实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptive statistics……Crosstabs3 i: P4 |0 H* [9 e( h

' e 三、简单图形描述介绍1 q8 Y\

在做上述频数分析、描述分析等分析时就可以直接做出图形,简单方便,同时也可以另外作图。SPSS的作图功能在菜单Graphs下,功能强大,图形清晰优美。现在把常用图简单介绍如下) J\

1、饼图:又称圆图,是以圆的面积代表被研究对象的总体,按各构成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系的统计图。频数分析的结果宜用饼图表示。0 z) U s: T0 x

2、曲线图:是用线段的升降来说明数据变动情况的一种统计图。它主要表示现象在时间上的变化趋势、现象的分配情况和2个现象的依存关系等。 3、面积图:用线段下的阴影面积来强调现象变化的统计图。

4、条形图:利用相同宽度条形的长短或高低表现统计数据大小及变化的统计图。 四、问卷深入分析

除了以上简单的分析,spss强大的功能还可以对问卷进行深入分析,比如常用的有聚类分析、交叉分析、因子分析、均值比分析(参数检验)、相关分析、回归分析等。因为涉及到很专业的统计知识,下面只将个人觉得比较有用的方法的适用范围和分析目的简单做介绍:

1、聚类分析

样本聚类,可以将被调查者分类,并按照这些属性计算各类的比例,以便明确研究所关心的群体。比如按消费特征对被调查者的进行聚类。 2、相关分析) u- _. n, {2 M+ _: V

相关分析是针对两变量或者多变量之间是否存在相关关系的分析方法,要根据变量不同特征

2

选择不同的相关性的度量方式。问卷分析中的多数用的变量都属于分类变量,要采用斯皮尔曼相关系数。

其中可以用卡方检验,其是对两变量之间是否具有显著性影响的分析方法。, `) `% }: D# d, L3 i8 |% J/ w 3、均值的比较与检验, x' }. ~/ [ ?1 Q g, X( k

(1)Means过程:对指定变量综合描述分析,分组计算计算均值再比较。比如可以按性别变量分为男和女来研究二者收入是否存在差距。 (2)T 检验:\

独立样本t检验用于不相关的样本是否开来自具有相同均值的总体的检验。比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。 如果样本不独立则要用配对t检验。比如研究参加职业培训后 工作效率是否提高。 @$ q$ q9 j3 z% l. G4、回归分析

问卷分析中的回归分析常采用的是用离散回归模型,一般是逻辑斯蒂模型,解释一个变量对另一变量的影响具体有多大。比如,研究对某商品的消费受收入的影响程。

多选题,就是说一个题目可以有多个答案。在录入的时候有两种选择。 下来举例说明: 4 x+ Y b2 Z3 P$ x v

Q1 你经常使用的搜索引擎是哪几个? 1 百度 2 Google 3 雅虎 4 其他 假设有5个被访者,分别选择了

A 1 B 1,2 C 1,2,3 D 2,3 E 1,48 m, D1 v! @5 f

一 数据录入7 H\

有两种录入法,分别是二分法和分类法。0 K& q |- C. F, K7 G0 t! v) [ 4 i) ]) f9 G. U# b* O/ l4 c 1 二分法,数据结构如下

二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。选项选中为1,不选中为0(也可以自己定义)。 ' |! |- T( n* \\\ 2 分类法,数据结构如下

3

分类法的话,就是把选项序号依次输入到SPSS里面就可以了。变量个数等于同时选中的选项个数的最大值。

如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。比如,题目之间用TAB或逗号分开,选项之间用|分开。 , u! [+ o; B M! j- K1 U4 y, P

二 多选题定义

SPSS中处理多选题,其实有两个模块。( g' G, H0 r0 k7 t3 n& E

一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。除非你使用Syntax,否则不推荐。 g# V x3 e' t& j9 B9 O- b

另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tables -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。) i/ ]2 u6 s- Y+

1 二分法:

1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 \这个框中

2)在Variable Coding里选中 Dichotomies,即二分法 3)在Category Label Source里选 \

4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)5)点击Add

4

2 分类法:3 K1 \\0 m5 F; g

1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 \这个框中

2)在Variable Coding里选中 Categories,即分类法* L+ ?. e. _, c2 s. Z H& C 3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签) 4)点击Add

5

定义完以后,就会生成以$号开头的多选变量集了。这些多选变量集可以在Custom Tables里面使用。 % {' R6 a) u/ C: z, q# e8 | 三 多选题统计

二分法和分类法在统计的时候用法是一样的。 打开菜单 Analyze -- Tables -- Custom Tables

可以看到,在窗口左侧,出现了我们刚才定义的多选变量集 $Q1 ,把它拖到右侧的表格里。然后点击确定,即可输出频次表。

如果需要更详细的统计结果,可以打开位于左下角的Define框。其中,Summary Statistics可以定义输出的统计量(如Valid N,四分之一分位数等)及输出格式;而Categories And Totals则可以控制是够输出合计项等。

6

需要与其他变量交叉的时候,把其他变量拖到Columns(列)就可以了。

Tips:如何选中只选择了某个选项的Cases:

比如我们要选中所有经常使用百度的Cases做统计,则 1 二分法:

Select Cases -- Select If 输入: Baidu=1 2 分类法

Select Cases -- Select If 输入: ANY(1, Q3_1 TO Q3_3)

多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。对多选题数据的分析除了使用SPSS中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data

7

Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。

一、多选题数据在SPSS中的录入方式

SPSS软件中对于多选题答案的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)即把本道多选题的每个候选答案均看作一个变量Variable来定义,0代表没有被选中,1代表被选中。(2)多重分类法(Multiple category method)即根据被访者可能提供的答案数量来设置相应个数的变量Variable(假设被访者最多只能选择n个不同答案,则在SPSS中设置n个变量用以录入本道多选题数据)。

实际操作中我们基本都会采用第二种数据录入方式,因为大多数被访者只会选择相对少数几个候选答案作为自己所提交的答案,如果我们采用第一种录入方式就显得繁琐,输入数据时也容易出错,尤其是当样本量增大时,不利于提高工作效率。

二、案例介绍

某次市场调研项目中向被访者收集以下数据,A1题为多选题,把上述数据以第二种方式录入进SPSS软件中,其中设置a101、a102、a103三个变量用来录入多选题A1,并定义好相应的变量值标签(Values)如图1。 三、多选题两种数据录入格式的转换

由于只有第一种数据录入方式才是符合统计分析原则的数据排列格式,能够直接进行后续的统计推断,而第二种录入方式只是一种简化纪录方式,需要转化为前者。其转化方法操作如下:

8

选择菜单File→New→Syntax,在弹出的Syntax对话框中输入相应的命令,其中新变量“a”代表被访者是否选择了“A牌”这个选项(1代表选择,0代表未选择)这样通过上述数据转换,我们就把a101、a102、a103三个旧变量(以第二种录入方式)的数据转化成了a、b、c、d、e 5个新变量(以第一种数据录入方式)的数据,并定义好新的变量值标签(Values),如图2。

# g5 i3 w\

四、多重对应分析

现在我们运用多重对应分析方法来研究“购买品牌”(A1题)、“性别”和“年龄”三个变量之间的联系。

选择菜单Analyze→ Data Reduction→ Optimal Scaling ,默认弹出对话框中的设置(如图3),点击Define,选中变量“a”、“b”、“c”、“d”、“e”、“性别”和“年龄”,然后通过点击Define Range ,为每个变量设置取值范围:“a”、“b”、“c”、“d”、“e”、“性别”的取值范围在1~2之间,“年龄”的取值范围在1~5之间(如图4),点击OK 后得到多重对应分析图(如图5)。

9

在解释多重对应分析图(图5)时要遵从的原则和简单对应分析图类似,具体来说就是:由原点(0,0)出发做四象限图,落在同一象限内的各个变量类别

10

间可能有联系问卷调查是发现和确定问题的重要环节,也是解决问题的前提。如果问卷编

制和使用有问题,结果也一定有问题。

一、问题的形成( P4 ~# a. D+ I+ J

问题的形成,一般经过如下步骤: (1)情况(或课题)分析,提出假设; (2)概念具体化,寻找变项; (3)确定指标;

(4)为测定已经确定的指标,编制直接与间接的问题。大体步骤如下:课题(或情况)→假设→概念→变项→指标→问题 举例:

现有这样一个调查课题:“少数学生为什么厌学?”从这一课题,我们可以形成一系列的问题,具体过程如下。 课题:少数学生为什么厌学?

假设:有些学生因学习成绩不好而厌学,有的学生因人际关系处理不当而厌学。 概念:学习成绩、人际关系、厌学

变项:对学习内容的掌握、测验成绩、平时测验成绩、作业情况; 与教师的关系、与同学的关系、与学校行政人员的关系、与家长的关系;

不愿意上学、对教师所讲的内容不感兴趣、对教师的说教有厌烦的心理、对学校环境不适应。 问题:你的入学成绩如何?你在最近一次测验中的成绩如何?你经常做作业吗?对教师布置的作业乐于去完成吗?你喜欢所任教的教师吗?你喜欢与同学相处吗?你能适应学校的学习环境吗?你对教师的说教有厌烦心理吗?

二、问卷的结构/ d4 K! N% Z\

1、前言:

前言是写在问卷开头的一段话,又称说明信、封面信。一般包括这样几方面的内容:(1)调查的目的与意义;(2)关于匿名的保证;(3)对被调查者回答问题的要求:(4)调查者的个人身份或组织名称

11

通常,一份问卷的开头,会请受测者填明一些所谓基本资料,如所在学校、年级、城市或乡村、性别、年龄、父母亲职业与教育程度、家庭情况等等。这些基本的问题,是基本的自变量,几乎所有的教育研究都必须设法了解。如果这些最基本的差别都无法获得具体结果的话,进一步的分析就非常困难。 2、主体 L: d' U& X! w% D3 F

问卷的主体是问题表,包括问题、回答方式以及对回答的指导语等。 指导语主要有4种类型:

(1)关于选出答案做记号的说明。一般用圆括号“()”或方框“□”来限定答案前的空间,并要求回答者在括号或方框内做记号“∨”。

(2)关于选择答案数目的说明,如“选择一项”、“有几项选几项”等。 (3)关于填写答案要求的说明。你所在班级的人数是()人。

(4)关于答案适用于哪些被调查者的说明。问卷中有的问题可能并不是普遍适用的,而只是使用于某一类人。当这类问题出现时,可说明由特定的一类人填写,其他人跳过这些问题。 3、结束语

一段短语内容是对被调查者的合作再次表示感谢,以及关于不要漏填与复核的请求。 提出1—2个关于本次调查形式与内容感受等方面的问题,征询被调查者的意见。 封闭性问题举例:7 J3 _ s6 b/ K- P% F9 i 您填完问卷后对我们这次调查有何感想? ()(1)很有意义 ()(2)有些意义 ()(3)没有意义 ()(4)说不上

开放性问题举例:) k1 v& q\

您还有需要补充的吗?如有,请写在下面:__________________

三、编制问卷中要注意的几点

12

1、问题中应避免使用引导性或倾向性的语句。

如;您认为目前中小学生的课业负担重吗?您是否赞成现行的教育制度需要改革? 2、一个问题中只能包含一个调查指标。% L' R& }% s7 O; V* P6 J

如:有人认为的教师、知识分子收入偏低,你是否同意这一观点? 3、不要使用普遍性的语句,以避免几乎被所有人接受或拒绝的情况出现。 如:你有时会对学习感到厌烦吗?

4、避免双重否定的问题。. T6 V5 q( k6 A) p8 o# H4 ^9 [ 如:我从未否定我自己。

5、避免多选题。多选题可在开放性的地方出现。 6、一份问卷的题目形式要一致,选次的数目也要一致。

7、问卷内容和时间不宜过长,时间控制在30分钟以内,20分钟为宜;题目控制在20—30道之间。& R2 ]\

四、测量各种情况常使用的词汇

1、测量次数

经常 经常 偶尔 很少 从不 总是 经常 有时 很少 从不

几乎 总是 超过一半以上 大约一半 少于一半 很少 从不

总是 经常 偶尔 很少 从不 2、测量感觉9 G\ O0 C8 T

非常喜欢 比较喜欢 难说 不喜欢 非常不喜欢 3、测量同意感* ?* R( h\

完全同意 比较同意 基本不同意 完全不同意 很同意 同意 很难说 不同意 很不同意

13

完全符合 比较符合 一般较不符合 很不符合 完全符合

五、问卷编制后自我对照项目检查

若以下项目中出现“否”,要及时修改问卷后再正式使用 1、问题没有使用引导性的语句。 2、问题没有使用倾向性的语句。 3、问题只含有一个调查指标。

4、问题没有使用文言文、倒装句、俗语、俚语、缩写等。 5、问题没有使用普遍性的语句。 6、问题没有使用双重否定的语句。 7、问题文字说明浅显易懂。 8、问题文字数量适中。 9、问题已列出所有可能的选项。 10、问题选项间具有互斥性。 11、问题没有涉及不受欢迎的语句。

14

本文来源:https://www.bwwdw.com/article/vky.html

Top