SPSS作业汇总
更新时间:2024-02-02 05:21:01 阅读量: 教育文库 文档下载
高级应用统计作业汇总
操作一:
某年级中随机抽取35名学生,现随机分成两组,A组有20名学生,B组有15学生具体资料见“学生基本资料”:
1. 利用数据5,对35名学生的英语成绩进行描述统计:均值、众值、中位数、标准差、第1
十分位数、第35百分位数,绘制直方图(带正态曲线)
这说明35名学生的英语平均成绩为73.71分,中位数(35名学生成绩由高到低排列中间位置同学的成绩)为76,全部学生中79分最多,标准差为11.116。第一个十分位数为58.40,第35百分位数为70.20。
2. 利用数据5,对35名学生按性别分组,对英语成绩进行描述统计,绘制箱式图、茎叶图
由上表可知男、女同学英语成绩的平均分分别是74.80、72.90。男生中,中位数为78.00,最低分为49,最高分为88.女生中,中位数为74,最低分为45,最高分为89。下面是男女同学英语成绩的茎叶图和箱式图。
3. 对性别和专业进行交叉分组的频数分析
通过性别和专业的交叉分组可以看出,男生中,有4个会计专业的,7个工商管理专业的,4个经济学专业的。女生中,有8个会计专业的,4个工商管理专业的,8个经济学的。总计有12个会计专业的,11个工商管理专业的,12个经济学的。
4. 该35名学生的英语平均分与80分是否有显著差异(显著性水平0.05,假定成绩正态分布:
此问题为单样本t检验,设原假设为H0:??80,由于?=0.05>p=0.002,所以应该拒绝
原假设,即35名学生的英语平均分与80分存在显著差异。
5. 男生和女生的英语平均分有无显著差异(显著性水平0.05,利用参数检验:
该问题为独立样本t检验模型,由F统计量和其概率值来完成。
设原假设为H0??1??2?0。首先,由于F统计量观测值为0.409,其概率p=0.527>0.05=?,所以男女生英语平均分的方差屋显著性差异。其次,由于方差无显著性差异,所以对其均值检验中只需要看假设方差相等那一行的t值就行。由于t=0.624>0.05=?,所以应该接受原假设,即男女生英语平均分无显著性差异。
6. 不同专业的英语水平有无显著差异(显著性水平0.05,利用参数检验:单因素方差分析
此题进行单因素方差分析,由F统计量和其概率值来完成。原始假设为H0=不同专业的英语水平均值无显著性差异。由于F统计量观测值为1.946,而概率p=0.159>?=0.05,所以接受原始假设,认为不同专业间英语水平无显著性差异。 下面为与常规线性方程单变量的比较:
由上表可以看出其概率p值依然为0.159,所以与单因素方差分析结果一致。
操作三:非参数检验
1. 马在8个圆形跑道的起点标杆位置上获胜的记录如下,试检验起点标杆位置对赛马结果是否
有影响?(皮尔逊ka方检验) 起点位置号 获胜频数 1 29 2 19 3 18 4 25 5 17 6 10 7 15 8 11 总数 144
此题首先需要对其数据进行加权,然后分析。下面为左图对其进行加权后的数据,右图为分析结果。
该问题的原始假设为H0=起点标杆对赛马结果没有影响。由右图的分析结果可以知道,卡方检验的概率p=0.022=0.05,所以拒绝原始假设,认为起点标杆位置对赛马结果是有影响的。 2. 操作一中35名学生的,英语成绩的不及格率是否明显低于0.01(显著性水平0.05,)(二项分
布检验)
该问题首先需要根据35名学生的成绩,利用SPSS软件找出其不及格的个案,讲所有结果用0、1表示为二值分布,然后进行二项分布检验。
原始假设为:H0=英语成绩的不及格率不明显低于0.01。根据上面的检验结果可以看出不及格的观测概率为0.09,其二项分布检验的概率p=0.254>?=0.05,所以不应拒绝原假设,认为不及格率不明显低于0.01。
3. 对操作一中的35名学生的具体成绩,检验其是否服从正态分布(单样本K-S检验)
该问题的原假设为H0=35名学生的成绩服从正态分布。其检验的概率p=0.905>?=0.05,所以不能拒绝原假设,即认为35名学生的成绩分布与正态分布无显著性差异。
4. 操作一(5)中,若假定现在35名的排列顺序就是学生抽取的顺序,试分析抽取学生的性别
是否是随机的(游程检验)。
原假设为H0=抽取学生的性别是随机的。其检验的概率p=0.634>?=0.05,所以接受原假设,即抽取学生的性别是随机的。 5. 对操作一的(8),利用非参数检验,试问男女生的平均成绩有无显著差异?(Mann-Whitey U
检验)
根据题意知此题为两独立样本的Mann-Whitey U检验。原假设为H0:男女生平均成绩无显著差异。其概率p=0.458>?=0.05,所以应该接受原假设,即男女生平均成绩无显著性差异。 6. 对操作一的(8),利用非参数检验,分别男女生成绩的分布是否一样?(可用两种方法)
上面为应用Mann-Whitney Test 检验结果。其检验的概率p=0.458>?=0.05,所以接受原假设,即认为男女生成绩的分布是一样的。
上面为应用两独立样本的游程检验的结果。其最小可能性的概率p=0.177>?=0.05,所以接受原假设,即男女生成绩分布无显著性差异;其最大可能性的p=0.970>?=0.05,所以接受原假设,即男女生成绩分布也无显著性差异。所以,该检验的结果是男女生成绩分布无显著性差异。
7. 有一种新的游泳训练方法,人们怀疑它可能会提高一部分人的游泳成绩,但也会降低另一部
分人的游泳成绩。先从一个少年游泳队中随机抽20人,在随机分成两组,一组用老方法,一一组用新方法,训练一段时间后,测的成绩如下,试回答怀疑是否有根据。(Moses极端反应检验,注意数据录入方式) 老方法 66 新方法 95 86 85 80 56 78 46 77 91 63 79 62 94 87 45 75 41 84 54 该问题应该采用两独立样本的录入方法,具体如下:
分析结果显示如下:
原假设为H0:新方法与老方法的训练效果无显著性差异。根据上面的结果显示可以看出:跨度和截头跨度分别为12和10。未剔除极端值的检验概率p=0.003=0.05;而剔除极端值的概率p=0.035=0.05,所以不管是否剔除极端值都有检验概率小于显著性水平,因此应该拒绝原假设,即认为新方法和老方法的训练效果有差异。
8. 操作一中35名学生,不同性别的不及格率是否有显著差别?(四格表卡方检验) 该问题首先需要对数据进行交叉分组处理,处理结果如下:
分析结果如下图:
该问题的原假设为H0:男女生的不及格率存在显著差异。根据上面的结果可以看出,双侧
检验的概率p=0.565>?=0.05,单侧检验的概率p=0.390>?=0.05,所以无论单侧还是双侧其概率值都大于显著性水平?,所以应该接受原假设,即认为男女生的不及格率有显著差异。 9.检验幼儿园生活是否对儿童的社会知识有影响,随机指定每对孪生儿童中的一个在幼儿园生活,另一个在幼儿园之外生活。一学期期未,进行社会知识的考查,成绩如下(可用两种方法) 配对 1 2 69 42 3 73 74 4 43 37 5 58 51 6 56 43 7 76 80 8 85 82 82 幼儿园 非幼儿园 63 利用符号检验和Wilcoxon符号秩检验。原假设为H0:幼儿园生活对儿童的知识有影响。 符号检验的结果如下:
符号检验的结果分析:检验的概率p值=0.289>?=0.05,所以应该接受原假设,即:幼儿园生活对儿童的知识有影响。
Wilcoxon符号秩检验结果如下:
Wilcoxon符号秩检验的结果分析:检验的概率p=0.05??=0.05,所以不应该接受原假设,即:幼儿园生活对儿童的知识没有影响。
7. 分析三种不同运动方法在30分钟内消耗的热量是否相等。(可用三种方法) 游泳 打球 骑车 306 311 289 285 364 188 319 338 221 300 315 302 320 398 201 该问题应该采用多独立样本进行分析:其原假设都为H0:三种不同运动方法消耗的热量相等。 (1)Kruskal-Wallis 检验:
由上面两个表可知三种方法的平均秩分别为:8.2,12.2,3.6,K-W统计量为9.26。检验的概率p=0.01=0.05,于是应该拒绝原假设,即认为三种不同运动在30分钟内消耗的热量不相等。
(2)中位数检验:
上面的结果表面三种方法的共同中位数为306。中位数检验的概率p=0.006=0.05,因此应该拒绝原假设,即认为三种不同运动在30分钟内消耗的热量不相等。 (3)Jonckheere-Terpstra 检验
J-T 检验的概率p=0.154>?=0.05,所以不应该接受原假设,即:三种不同运动在30分钟内消耗的热量相等。
8. 为了试验某种减肥药的性能,测量10个人在服用该药物前以及服用该药物一个月后、两个
月后、3 个月后的体重。请问在这4个时期,10个人的体重有无发生显著的变化。
该问题为多配对样本的非参数检验。其原假设为H0:10个人的体重无显著性变化。本问题可以用三种方法进行检验,在此采用Friedman 方法进行检验,检验结果如下:
上面左表表明在使用前、使用后一月、两月和三月的秩的平均值分别为3.65,3.15,1.85,和1.35。右表表明其卡方观测值为24.929,其检验的概率p=0.000=0.05,所以应该接受原假设,即认为在使用药物时期体重无明显变化。
9. 消费者协会调查顾客对3种品牌的电视机的满意程度,共10名顾客参与了调查。数据表如
下所示,请问顾客对这三个品牌的电视机的满意度有无显著性差异?
该问题采用多配对样本进行检验,本题采用Friedman 方法进行检验,其原假设为H0:顾客对这三个品牌的电视机的满意度无显著性差异。下面为检验结果:
上面的结果表明,检验的概率值p=0.115>?=0.05,所以应该拒绝原假设,即认为顾客对这三种品牌的电视机的满意度有显著性差异。
10. 某公司聘请了5名心理学家为其进行中层干部招聘考试中的面试,面试分数记录如下。
请问各考官评分的一致性如何? 专家1 专家2 专家3 专家4 专家5 79 80 77 88 77 干部1 2 89 88 78 88 88 3 67 77 78 55 77 4 56 66 56 46 66 5 78 56 45 78 55 6 56 56 34 65 44 7 89 78 45 78 89 8 90 67 67 66 76 9 56 67 78 55 56 10 66 56 89 46 45
本题为对配对样本模型,采用Kendall协同系数检验。其原假设为H0:各考官评分的一致性无差异。检验结果如下:
结果表明,检验的概率值p=0.004=0.05,所以不能拒绝原假设,即认为各考官的评分一致性无显著性差异。
操作四:回归分析及扩展
研究某市各经济开发区经济发展与招商投资的关系,因变量Y为各开发区的销售收入(百万元),选取两个自变量:X1到1998年底各开发区累计招商数目,X2为招商企业注册资本(百万元)。 要求:
1计算各变量间的简单相关系数,偏相关系数 (1)、简单相关系数
上表说明X1与X2之间的简单相关系数为0.439,说明两者之间存在着正的弱相关关系,其相关系数检验的概率值p=0.101>?=0.05,应该接受原假设,即认为X1与X2之间是零相关的。
(2)、偏相关系数
本题的偏相关分析可以采用分别控制Y.X1.X2,在此仅以控制Y为例进行分析。
上面的结果表明,在没有控制变量的情况下,X2与X1之间存在正的弱相关性,但是其相关系数检验的概率值p为0.101,大于显著性水平0.05,所以认为两者之间存在零相关关系。X2与Y之间的简单相关系数为0.746,两者存在正的强相关关系,其相关系数检验的概率值p为0.001小于显著性水平0.05,所以认为两者之间确实存在着正的强相关关系。X1与Y之间的简单相关系数为0.807,说明两者之间存在正的强相关关系,其相关系数检验的概率值近似为0,小于显著性水平,说明两者之间确实存在正的强相关关系。
下面的结果为在Y作为控制变量的情况下,X2与X1之间的偏相关系数为-0.416,存在着负的弱相关关系,偏相关系数检验值的概率p=0.139>?=0.05,所以两者之间存在着零相关关系。
2建立 Y对X1和X2的二元线性回归,写出回归方程,回归方程的显著性检验的分析(F、t检验)。
上表为回归方程的显著性检验,其检验的概率值p近似为0,小于显著性水平(?=0.05),因此被解释变量与解释变量间的线性关系显著,建立线性模式是恰当的。
此表为向后筛选的结果,结果显示在回归方程中应该包括X1和X2两个变量,对X1而言,其回归系数的显著性检验的概率值p=0.001=0.05,因此X1与Y之间的线性关系是显著的,保留在模型中是合理的。对X2而言,其回归系数的显著性检验的概率值p=0.003=0.05,因此X2与Y之间的线性关系也是显著地,保留在模型中时合理的。 回归方程可以表示为Y??327.039?2.036X1?0.468X2 3.探测样本是否存在异常值。
观察上图可以看出,存在着异常值。 4.异方差的检验:(1)绘制残差和各自变量的散点图,判断是否可以存在异方差
上图为X1与Y的散点图
上图为X2与Y的散点图
上图为残差与Y的散点图 通过上面三个散点图可以判断出存在异方差。
(2)利用等级相关系数,判断是否存在异方差,并确定主要是哪个自变量导致的异方差(哪
个的等级相关系数大则可能就是哪个变量引起的)。
上表为标准化残差与标准化预测值的Spearman 等级相关分析的结果。结果表明,X1的残差与预测值的等级相关系数为0.068,且检验显著;X2的残差与预测值的等级相关系数为0.064,检验同样显著;X1与X2残差的等级相关系数为0.979,且检验不显著,所以认为存在异方差,由于X1的相关系数大于X2的相关系数的绝对值,所以异方差主要由X1引起的。
(3)利用weight estimate估计幂指数m,得到的最优值后,进行加权最小二乘法回归估计
上表为进行weight estimate 估计的结果,WGT1表示以Y作为权重变量,WG2表示以X1作为权重变量,WG3表示以X2作为权重变量。
上表为进行最小加权二乘法的F检验,其检验的概率值p=0.002>?=0.05,所以认为被解释变量与解释变量全体的现行关系显著,可以进行建立模型。
上表为最小加权二乘法的最后结果,X1的T检验观测值为2.736,概率值p=0.0181=0.05,X2的T检验观测值为2.187,概率值p=0.0493=0.05,所以它们的检验结果表明回归方程是有效的,回归方程为:Y??267.698?2.123X1?0.4188X2
(4)计算加权最小乘法估计的残差并保存,绘制残差同各自变量的散点图,计算等级相关系数,分析是否还存在异方差。
上图为加权最小二乘法估计的残差
上面两图分别为变量X2、X1的散点图
上表为Spearman 相关性检验结果,结果表明 不存在异方差。
4.为研究民航客运量的变化趋势及其成因,以民航客运量为因变量,以国民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数为影响因素。 (1)拟合多元线性回归方程 采用向后筛选策略进行拟合。
上表为回归方程的显著性检验,其检验的概率值p近似为0,小于显著性水平(?=0.05),所以被解释变量与解释变量间的线性关系显著,建立线性模式是恰当的。
上表为模型最终结果,模型中包括国民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数,它们的回归系数的显著性检验的概率值分别为0.001,,0001,0.003,0.000,0.000,都小于显著性水平?(0.05)。所以认为最终模型中保留这些变量时恰当的。其回归方程为:
Y?468.868?0.351X1?0.554X2?0.007X3?20.861X4?0.436X5
(2)利用方差膨胀因子等、特征根、条件数指标判断是否存在多重共线性。
上表中最后一列为方差膨胀因子的检验结果,其中国民收入、消费额、民航航线里程和来华旅游入境人数都大于10,说明他们与其它解释变量之间存在这较强的多重共线性。
上表第二列为特征值的检验结果,可以看出国民收入的特征值为0.381远远大于其它解释变量的特征值,这说明解释变量之间存在着相当多的重叠信息,所以它们之间存在着较强的多重共线性。第三列为条件指数的检验结果,可以看出,除了国民收入外,其它的条件指数均大于10,且来华旅游入境人数的条件指数为262.018>100,所以它们之间也是存在着较强的多重共线性的。 (3)运用软件中的逐步回归拟合回归方程,对最终结果判断是否还存在多重共线性
上表为逐步回归的拟合优度检验。从第二列开始依次为被解释变量与解释变量的复相关系数、判定系数R、调整的判定系数R、回归方程的估计标准误差。其调整的判定系数均接近1,所以其拟合优度较高,但是模型2的R=0.985>模型1的R=0.978,所以认为模型2更能较高的拟合方程,所以模型2为最终的拟合回归方程。
2
2
22
上表为对其变量进行多重共线性的检验。模型1中,容忍度为1,表示多重共线性弱,方差膨胀因子为1,表示多重共线性强,两者矛盾;模型2中,容忍度为0.033,接近0,表示多重共线性强,而方差膨胀因子为30.748,表明多重共线性强,两者一致。
上表为剔除的解释变量的多重共线性检验,根据上面的分析可知,在每个模型中把它们剔除是正确的。
根据上面的分析可以得出使用逐步回归的回归方程为:
Y??299.019?0.083X1?17.314X4
操作五: 1. 聚类分析
对2007年江苏省的13个地市的国民经济进行了聚类分析,试探讨依据本文选取的若干主要经济指标进行的分类是否与传统上将江苏省划分为苏南、苏中和苏北三部分是否一致。结果供有关决策部门参考。
X1年末户籍人口(万人),X2城镇化率(%);X3地区生产总值GDP(亿元); X4第三产业占GDP的比重 (%);X5城镇固定资产投资额(亿元);X6社会消费品零售总额(亿元) X7城市居民人均可支配收入(元);X8恩格尔系数(城市)(%);X9农村居民人均纯收入(元) X10恩格尔系数(农村)(%) 地 区 苏州 无锡 常州 南京 镇江 南通 扬州 泰州 徐州 淮安 盐城 x 1x 2x 3x 47.4 9.1 18.6 11.0 24.5 35.1 35.3 33.2 36.0 36.2 34.8 34.1 x 5x 6x 7x 8 x9 9033 8020 7668 6905 6586 6469 5534 4828 5010 6092 x10 624.43 65.6 5700.85 461.74 67.4 3858.54 357.38 60.9 1881.28 617.17 76.8 3283.73 268.78 59.6 1206.69 766.13 48.6 2111.88 459.25 50.2 1311.89 500.70 47.6 1201.82 940.95 45.8 1679.56 618.18 765.23 534.00 39.9 1704.27 1250.05 21260 37.9 10475 1180.74 1134.75 20898 39.8 10026 748.89 363.73 633.94 438.35 347.73 769.59 409.56 394.91 470.06 610.85 331.36 736.54 418.90 321.07 543.01 249.08 269.40 433.74 19089 35.0 16775 38.7 16451 38.5 15057 37.9 14940 43.1 14875 34.9 13254 38.9 12164 38.9 13857 38.5 1443.40 1380.46 20317 35.3 35.7 37.6 38.0 37.4 39.4 37.9 38.9 38.1 39.0 43.7 43.2 41.7 连云港 482.23 40.5 809.79 43.7 1371.26 宿迁 531.53 34.1 542.00 32.0 256.18 158.87 9468 42.4 4783 46.0 采用层次聚类进行聚类。 依据题意将13个城市分为三类,下面为结果:
根据上面的文件结果和树状图可以知道苏州、无锡、常州和南京为第一类,扬州、泰州、徐州、盐城、镇江、南通为第二类,连云港、淮安和宿迁为第三类。 2. 判别分析
从世界国家或地区中选取13个典型的发达国家(I)、11个典型的中等发达国家(II)和9个典型的发展中国家(III)2005年的数据。然后运用判别分析方法,从定量的经济指标入手,建立各个国家和地区的判别模型, 从而为各国或地区政府部门制定经济政策提供帮助。在众多衡量经济水平的指标中采用下列指标:
x1:人均GDP(万美元)x2:万美元国内生产总值能耗(吨标准油) x3:城镇人口比重(%)x4:人口预期寿命(年)有关国家的具体数据如下:
国家 美国(I) 日本(I) 德国(I) 法国(I) 英国(I) 意大利(I) 加拿大(I) 荷兰(I) 新西兰(I) 西班牙(I) 澳大利亚(I) 葡萄牙(I) 希腊(I) 匈牙利(II) 韩国(II) 阿根廷(II) 科威特(II) 墨西哥(II) 斯洛文尼亚(II) 印度(III) 伊朗(III) 乌克兰(III) 泰国(III) 越南(III) 菲律宾(III) 尼日利亚(III) 埃及(III) x1 4.18 3.56 3.38 3.51 3.71 3.02 3.50 3.85 2.61 2.59 3.30 x2 1.17 x3 x4 1.89 80.8 77.4 66 81.8 1.24 73.4 78.5 1.29 76.7 80.2 1.05 89.7 78.5 1.05 67.6 80 2.4 80.1 79.8 1.3 80.2 78.7 1.57 86.2 79.2 1.29 76.7 80.4 1.81 88.2 79.9
1.76 1.46 58.0 78.0 2.22 1.26 60.0 79.0 1.09 2.52 66.0 73.0 1.64 2.70 80.8 78.0 0.47 3.47 91.0 75.0 3.19 3.48 98.0 78.0 0.82 2.09 76.0 74.0 1.78 2.03 50.0 78.0 0.07 0.28 0.28 0.06 0.12 0.08 0.12 6.64 28.7 63.5 8.46 66.9 71.1 5.67 33 70.5 0.18 16.63 67.8 68.2 9.66 27.4 70.3 4.53 62.7 70.8 9.25 46.2 43.7 6.26 48.1 67.4 6.84 42.6 70.2 印度尼西亚(III) 0.13
现知广东省和整个中国2005年数据如下:
x1 x2 x3 x4
广东 0.29 4.54 60.68 73.27
中国 0.17 7.65 40.4 71.5
要求:运用距离判别法和Bayes判别法,两者属于哪个层次。
下面对软件运行结果进行分析:
(1)、对判别函数的 Wilks ’Lambda 检验
根据上表显示的概率值,可以知道在显著性水平为0.05的情况下,两个判别函数的结果都是显著性的。 (2)、特征值
根据上面的特征值分析,可以知道这两个函数可以解释全部的方差。 (3)、结果的显著性检验
上面对三个分组的检验的概率值都近似为0,所以认为结果是显著的。 (4)最终结果分析
根据后三列(贝叶斯后验概率值)的结果可以看出,广东对第一类的贡献率为0.0001,对第二类的贡献率为0.57088,对第三类的贡献率为0.42903,所以广东应该分到第二类;中国对第一类的贡献率近似为0,对第二类的贡献率为0.00006,对第三类的贡献率为0.9994,所以应该归为第三类。而先验结果显示广东为第二类,中国为第三类。所以,分类正确,即广东属于二类,中国属于三类。 3. 因子分析
选择14家上市的商业银行,选则8个指标:X1为主营业务利润率(%)、X2为不良贷款率(%)、 X3为资本收益率(%)、X4为净资产收益率(%)、X5为资产负债率(%)、X6为
总资产周转率(次)、X7为资本充足率(%)、X8为股东权益率(%),原始数据见下:
试对各银行的经营绩效进行因子分析,给出合理的因子命名,总绩效排名,结合实际考虑结果是否和实际情况相符合。
1、主成份分析法的输出结果及其分析
(1)KMO和bartlett检验P值为0.00小于显著性水平0.05,可以进行主成分分析。
(2)由碎石图和总方差分解表可知,保留三个主成分是合适的,这时对每个原始变量住处的撮均大于50%(见公因子方差),约能解释90.242%的总方差。
(3)输出成分矩阵(因子载荷矩阵)
(4)求各成分的特征向量(见下表)
表中A1、A2、A3分别为成分矩阵中的数据,?1、?2、?3为求出的特征向量。
(5)输出各个因素的标准化变量和主成份得分表
主成份得分表可以看出成份一中,因素5、7、8起重要作用;成份二中因素1、3、4起主要作用;成份三中因素2、6起主要作用。
(6)利用特征向量和特征值求出主成分及其最终排名。
根据上表最后一列的排名可以看出各上市商业银行的绩效排名为(从低到高):深发银行、民生银行、兴业银行、浦发银行、交通银行、中国银行、华夏银行、工商银行、招商银行、宁波银行、建设银行、申信银行、北京银行和南京银行。 2、因子分析的输出结果及分析 (1)提取因子
上表为变量共同度数据分析。由第二列数据可知所有变量的共同度都很高,各个变量的信息丢失很少,表明因子提取的总体效果理想。
上表第二列到第四列为因子分析出示解的情况:第一个因子的特征值为3.461,解释了原有变量总方差的43.259%,知道第八个因子被提出,其累计方差贡献率达到100%,这说明原有变量的总方差均被解释了。第五列到第七列表明提取3个因子就能解释原有变量总方差的90.242%,原有变量信息丢失较少,表明提取三个因子是合理的,效果也较理想。第八列到第十列为最终因子
解的情况。因子旋转后,总的累计方差贡献率并没有改变,没有影响到原有变量的共同度。
上图为碎石图,从途中可以看出前三个特征值都很大,对解释原有变量的贡献很大;而从第四个开始都小于1,对解释原有变量的贡献很小。所以提取三个因子是合适的。 (2)输出因子载荷矩阵和旋转矩阵
上面左表为因子载荷矩阵:通过表可以看出因素5、7、8在第一个因子上的载荷很高,说明它们与第一个因子的相关程度高;因素3、4、1在第二个因子上的载荷很高,表明它们与第二个因子的相关程度较高;因素2、6在第三个因子上的载荷很高,它们与第三个因子的相关程度很高。
右表为通过方差极大法对因子载荷矩阵实行正交旋转后的矩阵。可以看出股东权益率、资产负债率和资本充足率在第一个因子上有较高的载荷,第一个因子主要解释了这三个变量,可解释为银行资本情况;而主营业务利润率、资本收益率和净资产收益率在第二个因子上有较高的载荷,可解释为银行的经营状况;剩余的可解释为坏账情况。 (3)计算因子得分并排名
首先输出因子得分系数矩阵:
其次计算得分和排名:
可以看出绩效从高到低为:招商银行、浦发银行、南京银行、建设银行、北京银行、申信银行、宁波银行、工商银行、交通银行、兴业银行、中国银行、民生银行、华夏银行、深发银行。
比较符合实际情况。
正在阅读:
SPSS作业汇总02-02
“官打说贼”的游戏作文700字07-03
我想有个小弟弟作文400字07-03
什么让我铭记作文作文400字06-24
公共政策复习重点01-12
哲学励志小故事02-18
IE常见问题解决方案03-12
《湖心亭看雪》对比阅读精简版04-19
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 汇总
- 作业
- SPSS
- 关于终身学习与培养创新的论文
- 2019-2020学年苏教版七年级上册期中阶段性质量调研语文试卷(有答案)
- 金凡购物高大模板工程方案
- 模拟集成电路设计实习讲义 - SCUT-自由下载
- 2018年上海市青浦区中考英语一模试卷及参考答案
- 2018年中国口岸发展现状与市场前景分析(目录) - 图文
- 五年级:纸的力量与神奇综合实践活动方案
- 庆七一活动宣传标语
- 贪心算法
- 英语作文-对大学的建议
- 甘肃省文物保护单位保护范围和建设控制地带划定办法
- 医学遗传学复习资料
- 参加会议委托书
- 数据库技术复习题(选择 附答案)
- 中医饮食营养学
- 澳洲旅游签证所需在读证明及工作证明样本
- 最新 尔雅今日的日本答案
- 古诗词语言炼字类题目答题技巧
- EHA101农杆菌感受态细胞
- 民俗学课程论文