SPSS因子聚类案例分析报告
更新时间:2023-04-16 18:13:01 阅读量: 实用文档 文档下载
S P S S因子聚类案例分析
报告
GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-
喀什大学实验报告
《多元统计分析SPSS》
实验报告
实验课程:基于SPSS的数据分析
实验地点:现代商贸实训中心实验室名称:经济统计实验室
学院: xxx学院年级专业班: xxx班
学生姓名: xxx 学号: 20131808015 完成时间: 2016年x月x日
开课时间: 2016 至 2017 学年第 1 学期
实验项目:中国上市银行竞争力分析
(一)实验目的
本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。
(二)实验资料
通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。
具体数据如下所示:
十家同类型上市商业银行2012年指标
(三)实验步骤
1、选择菜单
2、选择参与因子分析的变量到(变量V)框中
3、选择因子分析的样本
4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、
图形等
5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:主成分分析法
6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法
7、在所示窗口中点击(得分
S)按钮选择计算因子得分的方法
8、在所示窗口中点击(选项)按钮
(四)实验结果及分析 分析结果如下表所示。
通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t 假设。相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。
KMO 和巴特利特检验
KMO 取样适切性量数。 .518 巴特利特球形度检验
近似卡方 50.188
自由度 28 显著性
.006
相关性矩阵
每股收益增长率
贷款增长率
存款增长率
总资产增长率
相关性
资产利润率 .383 -.144 -.404 -.359 不良贷款率 -.207 -.025 -.009 -.086 资产负债率 .563 -.166 .105 .494 资本充足率 -.479 .357 .044 -.392 每股收益增长率 1.000 -.366 -.345 .159 贷款增长率 -.366 1.000 .922 .551 存款增长率 -.345 .922 1.000 .738 总资产增长率
.159 .551 .738 1.000 显著性 (单尾)
资产利润率 .137 .346 .124 .154 不良贷款率 .283 .472 .490 .407 资产负债率 .045 .323 .386 .073 资本充足率 .081
.155 .452 .131 每股收益增长率
.149
.164 .330 贷款增长率 .149 .000
.049 存款增长率 .164 .000 .007
总资产增长率
.330
.049
.007
同时,KMO级Bartlett检验是否适合做因子分析。以上是KMO级Bartlett
检验结果,由表可知:KMO值为0.518,说明该数据适合做因子分析。上表中的
巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原
假设,说明数据具有相关性,适宜做因子分析。
反映像矩阵
每股收益增长率贷款增长率存款增长率总资产增长率反映像协方差矩阵资产利润率-.075 -.025 .025 -.005 不良贷款率.038 .031 -.012 -.031
资产负债率-.064 -.001 -.007 .027
资本充足率-.002 -.021 .011 .015
每股收益增长率.207 -.026 .034 -.107
贷款增长率-.026 .025 -.021 .018
存款增长率.034 -.021 .020 -.032
总资产增长率-.107 .018 -.032 .175 反映像相关性矩阵资产利润率-.277 -.273 .306 -.019 不良贷款率.113 .266 -.114 -.101
资产负债率-.464 -.031 -.158 .214
资本充足率-.018 -.524 .307 .146
每股收益增长率.496a-.358 .533 -.560
贷款增长率-.358 .496a-.932 .269
存款增长率.533 -.932 .503a-.542
总资产增长率-.560 .269 -.542 .651a a. 取样适切性量数 (MSA)
反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子
分析,小于0.05则不适合因子分析。从表中得知,适合做因子分析。
公因子方差
初始提取
资产利润率 1.000 .818
不良贷款率 1.000 .519
资产负债率 1.000 .912
资本充足率 1.000 .928
每股收益增长率 1.000 .786
贷款增长率 1.000 .953
存款增长率 1.000 .979
总资产增长率 1.000 .865
提取方法:主成分分析法。
变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,2h i是i X方差的重要组成部分。
检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示
综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了
33.383%,F3的贡献率也达到了16.104%。这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。
从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;第5个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取3个或4个因子较为合适。
成分矩阵a
成分
1 2 3
总资产增长率.897 -.157 .187
存款增长率.892 .400 .150
贷款增长率.685 .607 .339
资本充足率-.367 .873 .175
资产负债率.475 -.822 -.104
每股收益增长率-.107 -.789 .391
资产利润率-.596 -.006 .680
不良贷款率-.040 .239 -.678
提取方法:主成分分析法。a
a. 提取了 3 个成分。
表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3个因子的实际含义比较模糊。为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。
旋转后的成分矩阵a
成分
1 2 3
资本充足率-.962 .051 .020
资产负债率.951 .084 .011
每股收益增长率.602 -.267 .593
存款增长率-.001 .977 -.153
贷款增长率-.302 .928 .016
总资产增长率.493 .788 .023
资产利润率-.347 -.322 .771
不良贷款率-.131 -.151 -.692
提取方法:主成分分析法。
旋转方法:凯撒正态化最大方差法。a
a. 旋转在 4 次迭代后已收敛。
表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。第一个公共因子在指标X2每股收益增长率、X3 资产负债率、X4 资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为一类,因此可以把第一个因子命名为“流动因子”;第二个公共因子在指标X6 贷款增长率、X7 存款增长率、X8总资产增长率上有较大载荷,同样可以归
为一类,第二个因子可以命名为“发展因子”;同理,X1资产利润率、X5不良贷款率归到第3 类,将其命名为“安全和盈利因子”。
在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转后的成分矩阵’的成分几。
成分得分系数矩阵
成分
1 2 3
资产利润率-.165 -.029 .544
不良贷款率-.009 -.138 -.516
资产负债率.359 .012 -.034
资本充足率-.368 .046 .072
每股收益增长率.203 -.051 .370
贷款增长率-.138 .378 .137
存款增长率-.016 .371 .003
总资产增长率.167 .304 .083
提取方法:主成分分析法。
旋转方法:凯撒正态化最大方差法。
组件得分。
表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。旋转后的因子得分表达式可以写成: F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-
0.016x7+0.167x8
F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8 F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8五、结论
本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。
实验项目:商厦评分
(一)实验目的:
本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。
(二)实验资料:
(三)实验步骤:
表一
聚类成员
个案 3 个聚类 2 个聚类
1:A商厦
1 1
2:B商厦
1 1
3:C商厦
2 2
4:D商厦
3 2
5:E商厦
3 2
表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E 两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类,SPSS的层次聚类能够产生任意类数的分类结果。
图一
图一,可知,D商厦与E商厦的距离最近,首先合并成一类,其次,合并的是A,B俩个商厦它们的距离比D商厦与E商厦大,最后是合并C商厦。最后聚城一体。
图二:
图二,可知,当聚成4类时,D,E两个商厦为一类;其他各商厦自成一类,聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类。
表二
初始聚类中心
聚类
1 2 3
购物环境94.00 66.00 84.00
服务质量90.00 64.00 82.00
表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。
表三
迭代历史记录a
迭代
聚类中心中的变动
1 2 3
1 1.803 4.031 .000
2 .000 .000 .000
a. 由于聚类中心中不存在变动或者仅有小幅变
动,因此实现了收敛。任何中心的最大绝对坐
标变动为 .000。当前迭代为 2。初始中心之间的
最小距离为 12.806。
表三,可知,第一次迭代后,3个类中心点分别偏移了
1.803,4.013.0.000,第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准(0.02),聚类分析结束。
表四
表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。
表五
ANOVA
聚类误差
均方自由度均方自由度
F 显著性
购物环境268.100 2 14.500 2 18.490 .051
服务质量272.600 2 5.000 2 54.520 .018
由于已选择聚类以使不同聚类中个案之间的差异最大化,因此 F 检验只应该用于描述目
的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设
的检验。
由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率P-值。仍然看出第二类的差异最大。
(三)实验结论:
因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优类;C,D商厦属良好类;A,B商厦属合格类。
正在阅读:
SPSS因子聚类案例分析报告04-16
中秋贺卡贺词12-13
东山镇双罗小学安全工作应急预案10-10
八年级语文下册第六单元第27课《岳阳楼记》同步练习(含解析)(07-04
2018年电大《工程经济与管理》阶段作业2(网上作业)10-31
中职学校管理制度12-31
ciw网页制作专家模拟题12-23
江西省南昌市湾里区第一中学高中政治1.2关于世界观的学说教案新05-20
行程--难题--6页01-12
摘抄本的自述作文400字06-16
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 分析报告
- 因子
- 案例
- SPSS
- 宋城旅游节庆活动策划案例
- 高考数学一轮复习 10.2 排列与组合精品教学案(教师版)新人教版
- 大学英语听说四答案
- 公文函格式范文6篇_公文函这样写
- 科技馆运营管理方案范本
- 广西壮族自治区南宁市检测服务公司名录2022版234家
- 第二章Verilog基本知识
- 兼职的劳动合同范本.doc
- 中原地产培训连载之五(策划活动)
- 第8单元 第24讲 人体的内环境与稳态
- 大理白族建筑工程代理发表职称论文发表-小学数学高效课堂策略论
- 《等差数列前n项和》教案
- 安全设施、设备安装验收制度示范文本
- 电视节目制作技艺复习提纲
- 最新人教版 2022-2022年第一学期九年级数学上册全册导学案(含答
- 共同理想 共同使命
- 最新牛津上海版六年级第二学期期末模拟卷
- 高中化学常见元素的性质特征或结构特征
- 2022年苏教版五年级数学下学期第七单元检测卷(含答案)
- 部编人教版九年级上册语文名著阅读知识点总结(含练习题及答案)