第1讲 SPSS 的基础知识

更新时间:2023-08-13 19:56:01 阅读量: IT计算机 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

教材:《基于SPSS的数据分 析》,薛薇 编著,中国人民大 学出版社

第1讲 SPSS的基础知识 1 SPSS

1.1 SPSS的数据结构1 变量名(name):不超过4个的汉字或不多 于8个字符的英文字母(或数字)。 2 数据类型(type):“string”为字符串,数字 不能计算。 3 度量尺度(measure):定距数据(scale) 定序数据(ordinal):如高、中、低等表示 顺序但不等距的数据 定类数据(nominal):如“汉、回、满”等3

1.2 SPSS数据文件的合并(1)纵向合并:data→merge file→add cases。 例1.1 将表t1-1与t1-2中的数据进行纵向合并,结果 见表1-1。

t1-1 职工基本情况数据 职工号 性别( ) 年龄( ) 性别(xb) 年龄(nl) (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 职称( ) 学历( ) 职称(zc) 学历(xl) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 5

t1-2 职工号 性别(xb)职称(zc1) (zgh) 017 018 019 020 015 2 1 2 1 1 1.00 1.00 2.00 2.00 3.00 基本工资 (income) 570.00 400.34 690.00 1,003.00 520.00

表1-1职工号 (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 015 性别( ) 性别(xb) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 2 1 2 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! #NULL! #NULL! #NULL! #NULL!

t1-1与t1-2数据纵向合并结果基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 570.00 400.34 690.00 1,003.00 520.00 职称( ) 职称(zc) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 1 2 2 3 学历( ) 学历(xl) 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! #NULL! #NULL! #NULL! #NULL! 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! #NULL! #NULL! #NULL! #NULL! source01 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1

(2)横向合并:data→merge file→add variable。 例1.2 将t1-1与t1-3横向合并,结果见表1-2。t1-3 职工号(zgh) 001 003 004 007 010 016 040 奖金(bonus) 1,000.00 2,000.00 1,200.00 1,400.00 2,000.00 1,500.00 2,000.008

表1-2 t1-1与t1-3的横向合并结果职工号 (z gh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 040 性别 基本工资 年龄( ) (x 年龄(nl) (sr) ) b) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 #NULL! 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.0

0 1,014.00 989.00 938.00 889.00 887.00 887.00 #NULL! 职称 学历( ) (z 学历(xl) c) ) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 #NULL! 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! 失业保 险 (b x) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! 奖金 (bo nus) ) 1,000.00 #NULL! 2,000.00 1,200.00 #NULL! #NULL! 1,400.00 #NULL! #NULL! 2,000.00 #NULL! #NULL! #NULL! #NULL! #NULL! 1,500.00 2,000.00

source01 1 0 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 9

1.3 数据排序data→sort cases。 例1.3 将t1-4按主排序变量“户口”的升序、 第二排序变量“存款金额”的升序排序后 可知,城镇户口存款金额最小值3元,最大 值50250元,农村户口存款金额最小值1元, 最大值80502元。可以看出,无论是城镇居 民还是农村居民,一次存款金额的差距是 非常大的,在一个侧面上反映出一定的贫 富差距。10

1.4 变量计算 transform→compute。 例1.4 利用t1-1的职工基本情况数据,假设 职称1至4的职工工资分别上调50%、30%、 20%和10%,计算调后工资。 结果见表1-3。

表1-3 上调后工资计算结果 职工号 (zgh) ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 性别 (xb) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 失业保险 职称( ) 学历( ) 职称(zc) 学历(xl) (sr) ) (bx) ) 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 12 9 13 8 8 7 7 7 8 7 12 9 8 8 8 8 涨后工资 (sr1) 1521 1279.2 1566 1039.2 1017.6 906.4 906.4 906.4 1116.7 992.4 1521 1285.7 1125.6 1155.7 1064.4 1064.412

1.5 数据选取 data→select cases。 例1.5 从t1-4中抽出城镇储户数据或随机抽 出70%的数据。

1.6 计数 transform→count。 例1.6 利用t1-4,对“收入情况”和“未来 的收入情况”进行计数,计数区间定义为 value,并输入1(1表示收入增加)。如果 储户收入今年比去年增加了,且认为今后 两年内仍会增加,被认为收入状况较好, 那么计数结果为2的储户收入状况较好。进 一步计算数值为2的个案占总个案数的百分 比。14

1.7 分类汇总 data→aggregate 例1.7 利用t1-4,分析城镇储户和农村储户的一次平均存 款金额是否有显著差异。汇总结果见表1-4。

表1-4 居民储蓄分类汇总结果 户口 平均金额 金额标准差 N_BREAK 1(城镇) 2687.20 5737.57 223 2(农村) 1944.97 8816.37 90

从表1-4中可以看出,城镇储户的一次平均存款金额高于 农村储户,农村储户的一次平均存款金额平均差异高于城 镇储户。据此认为,本批样本数据所反映的城镇储户和农 村储户的一次存款金额存在一定差异。 15

1.8 组距分组将变量值划为若

干区间,并将这一区间的变量值作 为一组。组数确定可参照Sturgets提出的经验公式 K=1+lgn/lg2,组距为(最大值-最小值)/组数。 transform→recode 例1.8 对t1-1中基本工资进行组距分组,组数 K=1+lg16/lg2=5,组距=(1044—824)/5=44, 近似取为50,分组区间为850以下、851~900、 901~950、951~1000、1000以上,结果见表15。

表1-5 组距分组结果 zgh 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 sr 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 sr1 5 4 5 2 1 1 1 1 2 1 5 4 3 2 2 217

1.9 数据拆分 data→splid file 例1.9 利用t1-1的数据,按职称进行数据拆 分。

本文来源:https://www.bwwdw.com/article/dwhj.html

Top