第1讲 SPSS 的基础知识
更新时间:2023-08-13 19:56:01 阅读量: IT计算机 文档下载
教材:《基于SPSS的数据分 析》,薛薇 编著,中国人民大 学出版社
第1讲 SPSS的基础知识 1 SPSS
1.1 SPSS的数据结构1 变量名(name):不超过4个的汉字或不多 于8个字符的英文字母(或数字)。 2 数据类型(type):“string”为字符串,数字 不能计算。 3 度量尺度(measure):定距数据(scale) 定序数据(ordinal):如高、中、低等表示 顺序但不等距的数据 定类数据(nominal):如“汉、回、满”等3
1.2 SPSS数据文件的合并(1)纵向合并:data→merge file→add cases。 例1.1 将表t1-1与t1-2中的数据进行纵向合并,结果 见表1-1。
t1-1 职工基本情况数据 职工号 性别( ) 年龄( ) 性别(xb) 年龄(nl) (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 职称( ) 学历( ) 职称(zc) 学历(xl) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 5
t1-2 职工号 性别(xb)职称(zc1) (zgh) 017 018 019 020 015 2 1 2 1 1 1.00 1.00 2.00 2.00 3.00 基本工资 (income) 570.00 400.34 690.00 1,003.00 520.00
表1-1职工号 (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 015 性别( ) 性别(xb) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 2 1 2 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! #NULL! #NULL! #NULL! #NULL!
t1-1与t1-2数据纵向合并结果基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 570.00 400.34 690.00 1,003.00 520.00 职称( ) 职称(zc) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 1 2 2 3 学历( ) 学历(xl) 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! #NULL! #NULL! #NULL! #NULL! 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! #NULL! #NULL! #NULL! #NULL! source01 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
(2)横向合并:data→merge file→add variable。 例1.2 将t1-1与t1-3横向合并,结果见表1-2。t1-3 职工号(zgh) 001 003 004 007 010 016 040 奖金(bonus) 1,000.00 2,000.00 1,200.00 1,400.00 2,000.00 1,500.00 2,000.008
表1-2 t1-1与t1-3的横向合并结果职工号 (z gh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 040 性别 基本工资 年龄( ) (x 年龄(nl) (sr) ) b) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 #NULL! 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.0
0 1,014.00 989.00 938.00 889.00 887.00 887.00 #NULL! 职称 学历( ) (z 学历(xl) c) ) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 #NULL! 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! 失业保 险 (b x) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! 奖金 (bo nus) ) 1,000.00 #NULL! 2,000.00 1,200.00 #NULL! #NULL! 1,400.00 #NULL! #NULL! 2,000.00 #NULL! #NULL! #NULL! #NULL! #NULL! 1,500.00 2,000.00
source01 1 0 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 9
1.3 数据排序data→sort cases。 例1.3 将t1-4按主排序变量“户口”的升序、 第二排序变量“存款金额”的升序排序后 可知,城镇户口存款金额最小值3元,最大 值50250元,农村户口存款金额最小值1元, 最大值80502元。可以看出,无论是城镇居 民还是农村居民,一次存款金额的差距是 非常大的,在一个侧面上反映出一定的贫 富差距。10
1.4 变量计算 transform→compute。 例1.4 利用t1-1的职工基本情况数据,假设 职称1至4的职工工资分别上调50%、30%、 20%和10%,计算调后工资。 结果见表1-3。
表1-3 上调后工资计算结果 职工号 (zgh) ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 性别 (xb) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 失业保险 职称( ) 学历( ) 职称(zc) 学历(xl) (sr) ) (bx) ) 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 12 9 13 8 8 7 7 7 8 7 12 9 8 8 8 8 涨后工资 (sr1) 1521 1279.2 1566 1039.2 1017.6 906.4 906.4 906.4 1116.7 992.4 1521 1285.7 1125.6 1155.7 1064.4 1064.412
1.5 数据选取 data→select cases。 例1.5 从t1-4中抽出城镇储户数据或随机抽 出70%的数据。
1.6 计数 transform→count。 例1.6 利用t1-4,对“收入情况”和“未来 的收入情况”进行计数,计数区间定义为 value,并输入1(1表示收入增加)。如果 储户收入今年比去年增加了,且认为今后 两年内仍会增加,被认为收入状况较好, 那么计数结果为2的储户收入状况较好。进 一步计算数值为2的个案占总个案数的百分 比。14
1.7 分类汇总 data→aggregate 例1.7 利用t1-4,分析城镇储户和农村储户的一次平均存 款金额是否有显著差异。汇总结果见表1-4。
表1-4 居民储蓄分类汇总结果 户口 平均金额 金额标准差 N_BREAK 1(城镇) 2687.20 5737.57 223 2(农村) 1944.97 8816.37 90
从表1-4中可以看出,城镇储户的一次平均存款金额高于 农村储户,农村储户的一次平均存款金额平均差异高于城 镇储户。据此认为,本批样本数据所反映的城镇储户和农 村储户的一次存款金额存在一定差异。 15
1.8 组距分组将变量值划为若
干区间,并将这一区间的变量值作 为一组。组数确定可参照Sturgets提出的经验公式 K=1+lgn/lg2,组距为(最大值-最小值)/组数。 transform→recode 例1.8 对t1-1中基本工资进行组距分组,组数 K=1+lg16/lg2=5,组距=(1044—824)/5=44, 近似取为50,分组区间为850以下、851~900、 901~950、951~1000、1000以上,结果见表15。
表1-5 组距分组结果 zgh 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 sr 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 sr1 5 4 5 2 1 1 1 1 2 1 5 4 3 2 2 217
1.9 数据拆分 data→splid file 例1.9 利用t1-1的数据,按职称进行数据拆 分。
正在阅读:
第1讲 SPSS 的基础知识08-13
13-14第二学期艺术学院分班级课表01-19
大学生安全教育期末考试答案(新版)01-08
成都体育学院-体育教育训练学专业历年考研真题-体育基本理论-运02-27
信息技术与英语学科整合教学设计案08-06
河南省周口市中英文学校2017-2018学年高二下学期第三次月考化学03-17
药物化学第12章在线测试04-26
很完善的员工手册05-26
《工程热力学及内燃机原理》教学大纲04-07
- 供应商绩效评价考核程序
- 美国加州水资源开发管理历史与现状的启示
- 供应商主数据最终用户培训教材
- 交通安全科普体验教室施工方案
- 井架安装顺序
- 会员积分制度
- 互联网对美容连锁企业的推动作用
- 互联网发展先驱聚首香港
- 公司文档管理规则
- 机电一体化系统设计基础作业、、、参考答案
- 如何选择BI可视化工具
- 互联网产品经理必备文档技巧
- 居家装修风水的布置_家庭风水布局详解
- 全省基础教育信息化应用与发展情况调查问卷
- 中国石油--计算机网络应用基础第三阶段在线作业
- 【知识管理专题系列之五十八】知识管理中如何实现“场景化协同”
- 网络推广方案
- 中国石油--计算机网络应用基础第二阶段在线作业
- 汽车检测与维修技术专业人才培养方案
- 详解胎儿颈透明层
- 基础知识
- SPSS
- 区域发展条件分析
- 包河大道高架工程三标段支架方案评审会
- 江西理工大学稀土学院简介
- 信息技术奥林匹克竞赛_VB程序设计的常用算法
- IE浏览器设置
- 物质的量浓度课时提升作业(五) 1.3.3
- 工厂成本控制与现场改善
- 2015高考理综真题及解析_2015年四川高考理综真题及解析
- 六年级数学上册复习资料 (1)
- 高中对英语动词被动语态的要求
- 2020年煤矿安全生产知识竞赛精选题库及答案(共120题)
- 基于KeilC51软件的电子钟设计与制作
- 历年安徽省电子设计大赛竞赛题目
- 提篮拱现浇钢管支架计算施工)
- 土地增值税培训
- 妊娠期高血压的降压药选择
- 2013年秋四年级数学上册期末测试卷
- 中华人民共和国农民专业合作社法
- 2010教师资格证教育学考试资料大全(小抄版)
- SPI_Layout_Guide_AN