专题4 问卷调查的数据输入

更新时间:2024-06-04 18:14:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

专题4:问卷调查的数据输入

? 变量和变量值的设置(编码) ? 数据输入的操作流程 ? 示例与练习

§1 变量和变量值的设置(编码)

编码的概念:

根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。 总的对应关系 1.1 填空式问题

1.2 互斥型选择题(单选题)

1.3 评定式问题(含态度量表中的问题) 1.4 互容型选择式问题(多项选择题) 1.5 限制式多项选择题 1.6 限制式多项选择排序题 1.7 完全排序式问题 1.8 自由式问题

返回

总的对应关系:

问句与变量对应,问卷(或者说调查对象)与case对应。

变量与变量值的设置是一项很灵活的工作,特别是变量值的设置,下面介绍的是一种行之有效的方法,但并不是必须完全遵守的方法。

返回

1.1 填空式问题

例:您的年龄为_____周岁。 例:您的职业为_________。

填空题的每一个空格对应一个变量。填数字的填空题,可直接用所填的数字作为变量值输入。填文字的填空题,最好先进行归类,每类给一个编号,用类的编号作为变量值输入。

若未填,则应输入某一个固定的符号(常用“0”)代表,并定义为缺失值。

返回

1.2 互斥型选择题(单选题)

例:您的年龄为

① 22岁以下 ② 22~27岁 ③ 28~33岁

④ 34~39岁 ⑤ 40岁以上

单选题每题对应一个变量,以所选的选项编号为变量值输入。如在上题中若选“22~27岁”,则输入“2”。 若未选,则应输入某一个固定的数字(常用“0”)代表,值标签为“未选”。

返回

1.3 评定式问题(含态度量表中的问题)

例:(影响因素调查)

以下是一些可能影响运动员训练积极性的因素,您认为这些因素对运动员训练积极性的影响程度如何?请对各个影响因素给出您的意见,并在表中相应位置上打“√”。

编号 1 2 影响因素 教练员对运动员是否 尊重 训练方法是否科学 ?? ?? 影响程度 很大 较大 一般 较小 很小 您对下面陈述的这些内容是否同意?请您逐条给出意见,并在表中相应的位置上打“√”。

编号 1 8 内 容 很同意 体育报的内容 很丰富 ?? 体育报的版面 不够活泼 ?? 同意程度 同意 未定 不同意 很不同意

评定式本质上是单选式的一种特殊情况,处理上与单选式基本相同。每一个评定内容对应一个变量。 所评定的等级需进行编码,通常可按顺序用1、2、3、4、5、6、7等代表,然后用所评定(选择)的等级的代码作为变量值输入。例如上述影响程度问题中,若选“较大”,则输入“2”,若选“较小”,则输入“4”。 若未选,则输入某一个固定的数字(常用“0”)代表,并定义为缺失值。

返回

1.4 互容型选择式问题(多项选择题)

例:您参加体育锻炼的目的是(可选多项) ①强身健体 ②防病治病 ③娱乐消遣 ④增进人际交往 ⑤使心情开朗 ⑥参加比赛 ⑦使体型健美 ⑧其他(请注明)__________

多项选择题的每个选项对应一个变量,若该项被选择了,以“1”为变量值输入,若未被选择,以“0”为变量值输入。

注意:多选题中若“其他”项填“没有”,则“其他”项对应的变量的值应该输入“0”(即作为未选对待),只有填入具体内容时,才输入“1”(即作为被选择对待)。

返回

1.5 限制式多项选择题

例:在下列这些体育活动项目中,您最喜欢参加的有(限选3项)

①篮球 ②足球 ③排球 ④乒乓球 ⑤羽毛球 ⑥健美操 ⑦其他(请注明)_______ 限制式多项选择题中,限选几项就要设几个变量。用所选择的选项编号作为这几个变量的值输入。例如上述问题需设置3个变量,不妨假设为x1、x2、x3,若某人选择了②、④、⑤项,则三个变量的值分别输入2、4、5。若只选了2项,则x3的值不输入,让其空缺,或输入“0”,并将“0”定义为缺失值。

返回

1.6 限制式多项选择排序题

例:在下列这些体育项目中,您最喜欢观赏的有那些(限选3项)?请将项目编号填入下面的相应位置:

最喜欢观赏的项目:_____ 第二喜欢观赏的项目:____ 第三喜欢观赏的项目:____

①篮球 ②足球 ③排球 ④乒乓球 ⑤羽毛球 ⑥健美操 ⑦其他(请注明)_______ 限制式多项选择排序题,若不考虑排列顺序,则可当限制式多项选择题处理;若要考虑排列顺序,则可当多个单选题处理(如上述问题可当三个单选题处理)。

返回

1.7 完全排序式问题

例:您认为在孩子的身心发展中,下面几方面的重要性顺序是怎样的?请按重要性顺序给下列各项编号,并填入各项下面的括号中(您认为最不重要的编号为1,最重要的为3)。

健康 性格 智力 ( 2 ) ( 3 ) ( 1 ) 这是限制式多项选择排序题的特例,可按限制式多项选择排序题输入数据,但必须考虑排序,否则毫无意义。

另外,也可当多个单选题处理(但与限制式多项选择排序题的不同)。例如上题中,设三个变量:x1、x2、x3,分别对应“健康”、“性格”、“智力”。变量值就用所填的重要性顺序编号输入,若表中所填情况如下:

健康 性格 智力 ( 2 ) ( 3 ) ( 1 ) 则x1的值为2、x2的值为3、x3的值为1。 但这样也割裂了各选项之间的联系,所以分析的时候要把三个变量放在一起分析。若不是特别需要,不要用。

返回

1.8 自由式问题

例:您对学校体育工作改革方面如有其他建议和意见,请写在下面空白处。

自由式问题一般无法用计算机处理,只能人工归纳。

返回

§2 数据输入的操作流程

2.1 计算机登录准备 2.2 计算机登录

2.3 常规统计与逻辑检查

返回

2.1 计算机登录准备

2.1.1 问卷编号和逻辑检查

给问卷编号,即给每张问卷一个唯一的标识号码。在输入计算机时,问卷编号也设置一个变量输入(如用ID或No),且按编号顺序输,这样分多次输入时不会搞错、混淆,也便于日后对输入的数据进行核查。

在编号的同时,可对问卷进行逻辑检查,将明显有问题(如明显不负责任乱填、自相矛盾、漏填大量重要内容等)的问卷剔出另作分析。该部分问卷可以全部参与编号,但不与其他问卷一起输入计算机。

2.1.2 调查对象类别标识

某些时候,调查对象的某些属性不宜(或忘了)事先在问卷中设置问句来辨别,如地域、单位等,而在分析时又要作分类对比,这时还需对回收的问卷进行类别标识。标识时不用在每张问卷上注明,只要记下各类问卷的编号范围即可。该类别标识在输入计算机时也应设置相应变量输入。

2.1.3 变量与代码设计

问卷编号和对象类别也应设置相应变量并输入各张问卷的变量值,以便对问卷识别。

变量命名,可字母与数字并用,变量名最好能直观地反映该变量与哪个问题相对应,如问卷中第5个问题是单选题,可用a5或q5作变量名。又如第7个问题为多选题,共有5个选项,则需5个变量,可用a7_1、a7_2、a7_3、a7_4、a7_5作变量名。另外最好

用变量标签和变量值标签对变量和变量值进行说明,这时需设计简明扼要的词语作标签。

返回

2.2 计算机登录

2.2.1 建立数据文件结构 2.2.2 输入数据

输入数据时,每份问卷为一行(一个case),根

据问卷填写情况逐个输入变量值即可。

返回

2.3 常规统计与逻辑检查

2.3.1 常规统计

对选择式、排序式、评定式以及填空式分类或分段后对应变量,变量值都只有少数几种,一般计算各变量值的频数和百分比。这可通过Frequencies过程来完成。

对调查某数值的填空式问句,若不分段直接输入的,可计算均数、标准差、最大值、最小值等。这可通过Frequencies过程或Descriptives过程来完成。

2.3.2 逻辑检查

做完常规统计后,应检查各变量的值是否有超出正常值范围的情况。对有内部逻辑关系的若干个变量,可检查其是否满足逻辑关系。有时制定问卷时也可有意设置若干有内部逻辑关系的问句作检验用,若某问卷不满足应有的逻辑关系,说明填写者态度不认真,应考虑作废卷处理。

2.3.3 修正或剔除有问题的数据

发现有问题的数据后,应与原始问卷核对,若是

输错了,应改正;若没有输错,则应视情况将该数据剔除,甚至将整张问卷作废卷处理。改正后应重新做常规统计和逻辑检查,直至没有问题数据为止。

然后即可正式进行统计分析。

返回

§3 示例与练习

例:若问卷表如下,试建立数据文件的结构,然后根据该份问卷的情况输入数据。

(引言略)

1、您的年龄为 35 周岁。

2、您的性别为: ①√男 ② 女 3、您的文化程度为:

① 小学或小学以下 ② 初中 ③ 高中(含中专) ④√大学专科或本科 ⑤ 硕士研究生以上

4、以下是一些可能影响运动员训练积极性的因素,您认为这些因素对运动员训练积极性的影响程度如何?请对各个影响因素给出您的意见,并在表中相应位置上打“√”。 编号 影响因素 很大 √ 影响程度 较大 一般 √ 较小 很小 1 教练员对运动员是 否尊重 2 训练方法是否科学 5、您参加体育锻炼的目的是(可选多项) ①强身健体 ②防病治病 ③娱乐消遣 ④√增进人际交往 ⑤使心情开朗 ⑥参加比赛 ⑦√使体型健美 ⑧其他(请注明) 没有

6、在下列这些体育活动项目中,您最喜欢参加的有(限选3项)

①√篮球 ②√足球 ③ 排球 ④√乒乓球 ⑤ 羽毛球 ⑥ 健美操 ⑦ 其他(请注明)_______

相应的数据文件

返回

本文来源:https://www.bwwdw.com/article/pcj6.html

Top