第1讲 SPSS 的基础知识
更新时间:2023-05-25 04:50:01 阅读量: 实用文档 文档下载
教材:《基于SPSS的数据分 析》,薛薇 编著,中国人民大 学出版社
第1讲 SPSS的基础知识 1 SPSS
1.1 SPSS的数据结构1 变量名(name):不超过4个的汉字或不多 于8个字符的英文字母(或数字)。 2 数据类型(type):“string”为字符串,数字 不能计算。 3 度量尺度(measure):定距数据(scale) 定序数据(ordinal):如高、中、低等表示 顺序但不等距的数据 定类数据(nominal):如“汉、回、满”等3
1.2 SPSS数据文件的合并(1)纵向合并:data→merge file→add cases。 例1.1 将表t1-1与t1-2中的数据进行纵向合并,结果 见表1-1。
t1-1 职工基本情况数据 职工号 性别( ) 年龄( ) 性别(xb) 年龄(nl) (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 职称( ) 学历( ) 职称(zc) 学历(xl) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 5
t1-2 职工号 性别(xb)职称(zc1) (zgh) 017 018 019 020 015 2 1 2 1 1 1.00 1.00 2.00 2.00 3.00 基本工资 (income) 570.00 400.34 690.00 1,003.00 520.00
表1-1职工号 (zgh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 015 性别( ) 性别(xb) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 2 1 2 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! #NULL! #NULL! #NULL! #NULL!
t1-1与t1-2数据纵向合并结果基本工资 (sr) ) 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 570.00 400.34 690.00 1,003.00 520.00 职称( ) 职称(zc) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 1 2 2 3 学历( ) 学历(xl) 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! #NULL! #NULL! #NULL! #NULL! 失业保险 (bx) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! #NULL! #NULL! #NULL! #NULL! source01 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
(2)横向合并:data→merge file→add variable。 例1.2 将t1-1与t1-3横向合并,结果见表1-2。t1-3 职工号(zgh) 001 003 004 007 010 016 040 奖金(bonus) 1,000.00 2,000.00 1,200.00 1,400.00 2,000.00 1,500.00 2,000.008
表1-2 t1-1与t1-3的横向合并结果职工号 (z gh) ) 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 040 性别 基本工资 年龄( ) (x 年龄(nl) (sr) ) b) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 #NULL! 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 #NULL! 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.0
0 1,014.00 989.00 938.00 889.00 887.00 887.00 #NULL! 职称 学历( ) (z 学历(xl) c) ) 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 #NULL! 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 #NULL! 失业保 险 (b x) ) 12.00 9.00 13.00 8.00 8.00 7.00 7.00 7.00 8.00 7.00 12.00 9.00 8.00 8.00 8.00 8.00 #NULL! 奖金 (bo nus) ) 1,000.00 #NULL! 2,000.00 1,200.00 #NULL! #NULL! 1,400.00 #NULL! #NULL! 2,000.00 #NULL! #NULL! #NULL! #NULL! #NULL! 1,500.00 2,000.00
source01 1 0 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 9
1.3 数据排序data→sort cases。 例1.3 将t1-4按主排序变量“户口”的升序、 第二排序变量“存款金额”的升序排序后 可知,城镇户口存款金额最小值3元,最大 值50250元,农村户口存款金额最小值1元, 最大值80502元。可以看出,无论是城镇居 民还是农村居民,一次存款金额的差距是 非常大的,在一个侧面上反映出一定的贫 富差距。10
1.4 变量计算 transform→compute。 例1.4 利用t1-1的职工基本情况数据,假设 职称1至4的职工工资分别上调50%、30%、 20%和10%,计算调后工资。 结果见表1-3。
表1-3 上调后工资计算结果 职工号 (zgh) ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 性别 (xb) ) 1 1 1 1 1 2 2 2 2 1 1 1 1 1 1 1 年龄( ) 年龄(nl) 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 失业保险 职称( ) 学历( ) 职称(zc) 学历(xl) (sr) ) (bx) ) 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887 1 2 1 3 3 4 4 4 2 3 1 2 3 2 3 3 1 2 3 3 1 3 3 3 2 1 2 2 4 1 4 4 12 9 13 8 8 7 7 7 8 7 12 9 8 8 8 8 涨后工资 (sr1) 1521 1279.2 1566 1039.2 1017.6 906.4 906.4 906.4 1116.7 992.4 1521 1285.7 1125.6 1155.7 1064.4 1064.412
1.5 数据选取 data→select cases。 例1.5 从t1-4中抽出城镇储户数据或随机抽 出70%的数据。
1.6 计数 transform→count。 例1.6 利用t1-4,对“收入情况”和“未来 的收入情况”进行计数,计数区间定义为 value,并输入1(1表示收入增加)。如果 储户收入今年比去年增加了,且认为今后 两年内仍会增加,被认为收入状况较好, 那么计数结果为2的储户收入状况较好。进 一步计算数值为2的个案占总个案数的百分 比。14
1.7 分类汇总 data→aggregate 例1.7 利用t1-4,分析城镇储户和农村储户的一次平均存 款金额是否有显著差异。汇总结果见表1-4。
表1-4 居民储蓄分类汇总结果 户口 平均金额 金额标准差 N_BREAK 1(城镇) 2687.20 5737.57 223 2(农村) 1944.97 8816.37 90
从表1-4中可以看出,城镇储户的一次平均存款金额高于 农村储户,农村储户的一次平均存款金额平均差异高于城 镇储户。据此认为,本批样本数据所反映的城镇储户和农 村储户的一次存款金额存在一定差异。 15
1.8 组距分组将变量值划为若
干区间,并将这一区间的变量值作 为一组。组数确定可参照Sturgets提出的经验公式 K=1+lgn/lg2,组距为(最大值-最小值)/组数。 transform→recode 例1.8 对t1-1中基本工资进行组距分组,组数 K=1+lg16/lg2=5,组距=(1044—824)/5=44, 近似取为50,分组区间为850以下、851~900、 901~950、951~1000、1000以上,结果见表15。
表1-5 组距分组结果 zgh 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 sr 1,014.00 984.00 1,044.00 866.00 848.00 824.00 824.00 824.00 859.00 827.00 1,014.00 989.00 938.00 889.00 887.00 887.00 sr1 5 4 5 2 1 1 1 1 2 1 5 4 3 2 2 217
1.9 数据拆分 data→splid file 例1.9 利用t1-1的数据,按职称进行数据拆 分。
正在阅读:
第1讲 SPSS 的基础知识05-25
银川市四年级上学期数学期中试卷(测试)05-11
05-2017县委经济工作会议讲话稿01-06
X-RAY - Dage - XD7500保养手册 - 图文10-27
四复习106-11
银行资金回笼情况调查报告范文03-10
法律法规案例分析与解答及选择题05-09
加固工程合同范本05-09
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 基础知识
- SPSS
- Chinese cheongsam(presentation)
- 中华人民共和国农民专业合作社法
- 妊娠期高血压的降压药选择
- 人教版高中化学选修3第2章第2节第1课时分子的立体结构
- 奥斯特罗姆,制度分析与发展框架
- 我国的国家机构教案
- 生极板化成工艺规程
- 工厂成本控制与现场改善
- Fedora 7 Linux文本模式安装图解详细教程
- 挑选总经理面试题
- 第3章 最简单的C程序设计(2)
- 2005基于GIS铁路抢险救援移动平台的研究
- 八年级上学期语文教学反思
- 七年级思想品德(上)第三单元练习试题及答案
- 2013年秋四年级数学上册期末测试卷
- 6 用配方法化二次型成标准型
- 2010年度中国综合布线市场发展峰会在北京召开
- 区域发展条件分析
- 机械加工工艺设计
- 论经济欠发达地区的职业教育发展