多元统计分析-东北大学秦皇岛分校
更新时间:2023-03-08 05:10:47 阅读量: 高等教育 文档下载
多元统计分析实验指导书
李喆 编写
东北大学秦皇岛分校
二○一六年五月
1
前 言
本课程为金融学专业大二学生的专业平台课。通过本课程的学习,使学生掌握多元统计分析的基本概念、基本原理和基本结果及各种多元统计分析方法的背景、功能、作用、计算方法及实际应用,能够利用SPSS软件运行数据处理方法,从而为学会如何通过建立模型对现实的经济生活进行分析模拟,为实证分析打下一定的理论基础
2
目 录
实验一 熟悉SPSS软件 ................................. 4 实验二 实验三 实验四
假设检验、相关分析和回归分析.................. 22 聚类分析 ..................................... 36 主成分分析和因子分析,对应分析................ 40
3
实验一 熟悉SPSS软件
[实验目的]
1、利用SPSS软件建立数据文件;
2、利用SPSS软件进行基本的统计分析; 3、学会使用SPSS软件统计绘图; [实验内容]
一、熟悉SPSS界面 (一)启动方法
启动方法:开始→程序→SPSS Inc→SPSS 16.0。 (二)SPSS 的主窗口
启动SPSS 16.0后,弹出一个选择对话框,可以选择打开已经存在的数据文件,也可以做出其他选择。
各选项分别对应:运行指南;数据录入;运行已存在的查询;使用数据库向导建立一个新的文件;打开已存在的数据文件*.sav/*.sys;打开其它类型的数据文件*.xls/*.txt/*.dat;运行SPSS时不显示该对话框。
(三)数据编辑窗口
4
菜单栏包括:
File:文件操作。完成文件的打开、新建、 保存、打印和关闭等操作
Edit:文件编辑。完成文本或数据内容的 选择、复制、剪贴、查找和替换等操作 View:浏览编辑。完成文本或数据内容的 状态栏、工具栏、字体、网格线和数值标签 等功能的操作
Data:数据管理。完成数据变量名称和格式 的定义,数据资料的选择、排序、加权,数 据文件的转换、连接和汇总等操作
Transform:数据转换。完成数据的计算、 重新编码和缺失值替代等操作
Analyze:数据分析。完成基本统计分析、均值比较、相关分析、回归分析、聚类分析、因子分析、对应分析等一系列统计分析方法的选择与应用
Graphs:制作统计图形。完成条形图、饼形图、直方图、散点图等统计图形的制作与编辑。
Utilities:实用程序。有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。
Add-ons:附加
Windows:窗口控制。可进行窗口的排列、选择和显示等 Help:帮助
二、利用SPSS软件建立数据文件 (一)变量的定义
窗口视图中有“Variable View”标签 和“Data View”标签。
单击“Variable View”标签,定义变量。每一个变量须定义如下属性: Name;Type;Width;Decimals;Label;Values;Missing;Columns; Align; Measure。
1、 Name:
变量名称,其总长度不能超过64个字符(32个汉字)。定义变量名应注意:
5
① 以字母为首,后面跟A~Z,0~9字符; ② 不允许以数字、横线或下划线开头; ③ “?”、“!”、“/”等不能作为变量名。 ④ 可以用汉字做变量名。 2、 Type
变量类型,单击变量类型,弹出Variable Type对话框,有8种类型可供选择 Numeric; Comma; Dot; Scientific notation; Date; Dollar;Custom Currency;String;
3、 Width
数据或字符串的宽度,默认的变量长度是8位。当变量为某些特定类型时,该设置无效,如日期型变量。
4、 Decimals
小数位数。默认的小数位数是2位 5、 Label
变量标签。用来说明变量代表的实际意义。建议使用中文 。 6、 Values 变量值标签。对变量可能取值附加的进一步说明。对分类变量往往要定义其取值的标签。 7、 Missing
缺失值 ,单击“Missing”按钮: ① No Missing Values:没有缺失值。 ② Discrete missing values:离散缺失值。
③ Range plus one optional discrete miss:定义缺失值范围 8、 Columns
显示数据的宽度。定义数据在屏幕上该变量对应列的显示列宽。默认值为8个字符,范围是1~255。显示宽度不影响机内值和分析运算结果,只影响显示。
9、 Align
字符排列方向。 10、 Measure
数据测量类型。是指变量是如何测量的, 可有3种选择
① Scale:尺度变量(连续变量)。是默认的类型,即使用距离或比率量尺测量的数据。 Scale可以是数值型、日期型和货币型变量,但不能是字符串型变量。例如,身高和体重。
Ordinal:顺序变量。是指变量之间的顺序有实际意义,但没有距离关系。顺序变量可以用有序的数字作为代码,设置了值标签的变量被认为是有序的分类变量,可以作为分组变量,也可以参与某些分析过程的运算。Ordinal可以是数值型和字符串型变量。
③ Nominal:分类变量。分类变量值之间没有顺序关系,只能作为分组变量使用。Nominal与Ordinal一样,只是不要求变量有次序关系。
(二)数据的输入
单击“Data View”标签,从数据编辑器中输入数据。 (三)数据的编辑 1.修改数据:
找到想要修改的数据,双击,修改 2.插入或删除一行数据
6
3.插入或删除一个变量(列)
(四)数据文件的合并 1.横向合并数据文件
(1) 打开第一个数据文件。
(2) 单击Data→Merge File→Add Variables (3)单击“OK”按钮
7
注意事项:两个文件中有重复的关键变量,要保证关键变量中间不要缺少数字,如果有不足的必修不足之后才能进行合并,否则会出现错误结果。
8
2.纵向合并数据文件
纵向合并数据文件就是将一份数据按观测量分成几部分,然后分别输入数据并存储为几个较小的SPSS 观测量数据文件,最后将这几个观测量数据文件中的数据上下对接,进行纵向合并。
SPSS纵向合并数据文件的操作过程如下: (1) 打开第一个数据文件
(2) 单击菜单Data→Merge File→Add Cases
(3) 若要求合并后的数据能看出来自哪个数据文件,可以选Indicate case source as
variable项,操作同横向合并数据文件。
(4) 单击“OK”按钮
9
三、用SPSS进行基本统计分析 (一)数据整理 1.数据排序
(1) 选择菜单Data→Sort Cases,弹出一个Sort Cases对话框。
(2) 将主排序变量从左面的列表框中选到右侧的Sort by框中,并在Sort Order选项中
选择按该变量的升序(Ascending)还是降序(Descending)排序。 (3) 单击“OK”按钮
10
2.分类汇总
选择菜单Data→Aggregate项,弹出一个Aggregate Data对话框
3.数据变换
11
数据变换是在原有变量数据的基础上,计算产生一些含有更丰富信息的新数据。 选择菜单Transform→Compute,弹出Compute Variable对话框。
(二)数据分组
数据分组就是根据统计研究的需要,将数据按某种标准重新划分为不同的组别。 1.单项式分组
(1) 选择菜单Transform→Automatic Recode,弹出Automatic Recode对话框。
12
(2) 将对话框左侧列表框的分组变量选择到右侧的Variable→New Name框中。
(3) 在“New Name”按钮右侧的框内输入存放分组结果的新变量名,并单击“New Name”
按钮。
(4) 在“Recode Starting from”选项中选择单项式分组按升序还是按降序) 进行。 (5) 单击“OK”按钮
2.组距式分组
组距式分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 (1) 确定分组:
首先将原始资料按升序进行排列并计算极差R; 其次由斯特吉斯经验公式确定组数和组距, 即组数k=1+3.322lgN,组距d=R/k;
13
最后确定组限。取第一组下限略高于最小变量值,则该组上限=该组下限+组距。 (2) 选择菜单Transform→Visual Binning
14
(三)计算基本描述统计量 1、标准化:
SPSS提供了计算描述统计量的功能,它可以将原始数据资料转换成标准化值并以变量
?X的形式存入数据编辑窗口中,公式: Z_X?
S运行:Analyze→Descriptive Statistics→Descriptives
15
16
(四)频数分析
SPSS提供:频数分布表,基本描述统计量,统计图 (条形图、饼形图和直方图)
17
四、统计绘图
(一)统计图的绘制 1.条形图(Bar) Graphs→Bar
18
2.饼形图(Pie) Graphs→Pies
19
3.线形图(Line):Graphs→Line
4.散点图(Scatter):Graphs→Scatter
(二)统计图的编辑1.图形编辑窗口、设置图形中的数值标签
20
分别是未旋转和旋转之后的因子载荷矩阵,可以看出每个变量在某个公因子上有较高的载荷。GDP、工业总产值、固定资产投资和货物周转量在第一因子上有较高载荷,因此,第一因子命名为总量因子;职工平均工资、居民消费水平在第二因子上有较高载荷,因此,第二因子命名为收支因子;居民消费价格指数、商品零售价格指数在第三因子上有较高载荷,因此第三因子命名为价格因子
因子得分的系数矩阵,计算得到的因子得分作为新变量存放在数据文件中,可以进行后续的评价和分类
给出了因子得分的协方差矩阵,各因子之间是正交的,即彼此相互独立。 (三)根据因子得分进行综合评估
以提取的3个公因子的方差贡献率作为权重,结合各因子得分,建立综合评价模型:
W?0.40091FAC1_1?0.27713FAC2_1?0.21784FAC3_1
46
47
三、学会使用SPSS进行对应分析;
同一直角坐标系内同时表达出变量与样品两者之间的相互关系 (一) 操作步骤 1、数据预处理
对数据要定义三个变量:行变量、列变量和尺度变量(实际观测值,常被指定为加权变量)
Data->Weight Cases
运行以后,数据编辑器中的原始数据并没有变化,只是在右下角的状态栏中显示“Weight on”字样。但利用加权后的数据进行统计分析后所得到的结果与没加权数据进行统计分析后得到的结果完全不同。
48
、对应分析
49
2
(二) 结果解释
50
正在阅读:
多元统计分析-东北大学秦皇岛分校03-08
无损探伤工高级(理论)题库12-04
关于“净地出让”的相关规定01-31
内蒙古自治区大豆有害生物可持续控制技术 的可 行 性 研 究 报 告01-09
构造科技成果转化平台08-25
四上:《比较数的大小求近似数》练习题01-11
2013新版PEP小学四年级英语上册最新版第三单元测试题03-28
艾滋病防治知识宣传资料3篇_节日习俗03-23
模具移交协议及清单05-04
- 2012诗歌鉴赏讲座 师大附中张海波
- 2012-2013学年江苏省苏州市五市三区高三(上)期中数学模拟试卷(一)
- 市政基础设施工程竣工验收资料
- 小方坯连铸机专用超越离合器(引锭杆存放用)
- 荀子的学术性质之我见
- 氩弧焊管轧纹生产线操作说明
- 小学科学六年级上册教案
- (商务)英语专业大全
- 外汇储备的快速增长对我国经济发展的影响
- 幼儿园中班优秀语言教案《小猴的出租车》
- 第七章 仪表与显示系统
- 身份证号码前6位行政区划与籍贯对应表
- 单位(子单位)工程验收通知书
- 浅谈地铁工程施工的项目成本管理
- 沉积学知识点整理
- 前期物业管理中物业服务企业的法律地位
- 2014微量养分营养试卷
- 地质专业校内实习报告范文(通用版)
- 内部审计视角下我国高校教育经费支出绩效审计研究
- 高次插值龙格现象并作图数值分析实验1
- 东北大学
- 秦皇岛
- 统计分析
- 分校
- 多元
- (新资讯)荥阳市推荐报考河南成人高考院校有哪些?【分享推荐】_s
- 18年11月《公文写作》作业考核试题
- 大工18秋《大学英语2(远程英语2)》在线测试1
- (新资讯)新密市推荐报考河南成人高考院校有哪些?【分享推荐】_s
- (新资讯)偃师市推荐报考河南成人高考院校有哪些?【分享推荐】_s
- 《科技文献检索(专科)》18年12月作业考核
- 2016国家基金项目名单分解
- 大工18秋《大学英语4》在线测试2
- 山东大学课程中心
- 【自考真题】全国2018年4月自考大学语文真题 (3)
- 中央电大入学指南答案
- 201801-财务管理(专升本)课程:大学英语3(专升本)
- 关于对2012届普通本科优秀毕业设计论文评选结果-郑州大学科研
- 《大学物理学》机械振动练习题(2011马)分解
- 2016年中国医科大学《计算机应用基础(本科)》在线作业课件
- 高等教育自学考试-上海师范大学
- 【最新2018】201X贵阳学院录取分数线-范文word版 (3页)
- 《拣麦穗》教案课件
- 华东交通大学教案
- 功能作用机制及应用-西北大学科学技术处