基于SPSS 软件的因子分析法及实证分析

更新时间：2023-08-31 17:01:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

基于spss的数据分析论文推荐度：
相关推荐

spss使用

科技信息高校理科研究

基于SPSS软件的因子分析法及实证分析

赣南师范学院

刘芊

蓝国赈

［摘要］本文论述了多元统计分析中的因子分析方法，以及ＳＰＳＳ软件应用时的正确操作步骤，并借助于ＳＰＳＳ１２．０ｆｏｒＷｉｎｄｏｗｓ统计软件进行实证分析。［关键词］因子分析ＳＰＳＳ软件实证分析

１、因子分析的数学模型１．１概念和意义

因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计方法，在教育、医学、市场经济等领域以及其它领域的科学研究中，往往需要对反映事物、现象从多个角度进行观测，也就设计出多

多变量个观测变量，从多个变量收集大量数据以便进行分析寻找规律。

大样本虽然会为我们的科学研究提供丰富的信息，但确增加了数据采

更重要的是在大多数情况下，许多变量之间存在一定集和处理的难度。

的相关关系，从而增加了问题分析的复杂性。

因子分析就是将大量的彼此可能存在相关关系的变量转换成较少彼此不相关的综合指标的一种多元统计方法。这样既可减轻收集信的、

息的工作量，且各综合指标代表的信息不重叠，便于分析。

１．２基本过程

因子分析的基本过程可分为两个步骤：第一步主因子分析

是通过原始变量的相关系数矩阵内部结构的研究，导出能控制所有变量的少数几个综合变量，通过这少数几个综合变量去描述原始的多个变量之间的相关关系。一般来说，这少数的几个综合变量是不可观测的，故称其为因子，我们又称这种通过原始变量相关系数矩阵出发的

因子分析所获得的反映变量间本质联系、变因子分析为Ｒ型因子分析。

量与公共因子的关系的全部信息通过导出的因子负荷矩阵体现。

第二步对因子解释和命名

从因子分析导出的负荷矩阵的结构出发，把变量按与公共因子相关性大小的程度分组，使同组内变量间的相关性较高，不同组的变量的相关性较低，按公因子包含变量的特点（即公因子内涵）对因子作解释命名。

１．３数学模型

设ｍ个可能存在相关关系的测试变量Ｚ１，Ｚ２，…，Ｚｍ含有Ｐ个独立的公共因子Ｆ１，Ｆ２，…，Ｆｐ（ｐ≤ｍ），测试变量Ｚｉ含有独特因子Ｕｉ（ｉ＝１…ｍ），诸Ｕｉ间互不相关，且与Ｆｊ（ｊ＝１…ｐ）也互不相关，每个Ｚｉ可由Ｐ个公共因子和自身对应的独特因子Ｕｉ线性表出：

Ｚ１＝ａ１１Ｆ１＋ａ１２Ｆ２＋…＋ａ１ｐＦｐ＋ｃ１Ｕ１Ｚ２＝ａ１２Ｆ１＋ａ２２Ｆ２＋…＋ａ２ｐＦｐ＋ｃ２Ｕ２

……………………………

Ｚｍ＝ａｍ１Ｆ１＋ａｍ２Ｆ２＋…＋ａｍｐＦｐ＋ｃｍＵｍ

用矩阵表示：

Ｚ１Ｆ１ｃ１Ｕ１

ＺＦｃＵ２２２２

＝（ａｉｊ）ｍ×ｐ· ＋

…

ＺＦ

简记为：

Ｚ＝Ａ·Ｆ＋Ｃ

（ｍ×1)（ｍ×p)（ｐ×1) ｍ

ｐ

ｍ

且满足：（１）Ｐ≤ｍ；

（２）ＣＯＶ（Ｆ，Ｕ）＝０（即Ｆ与Ｕ是不相关的）；（３）Ｅ（Ｆ）＝０ＣＯＶ（Ｆ）＝Ｉｐ（即Ｆ１，……ＦＰ不相关，且方差皆为１，均值皆为０）；

且都是标准化的变（４）Ｅ（Ｕ）＝０ＣＯＶ（Ｕ）＝Ｉｍ（即Ｕ１，……，Ｕｍ不相关，量，假定Ｚ１，…，Ｚｍ也是标准化的，但并不相互独立）。

式中Ａ称为因子负荷矩阵，其元素ａｉｊ表示第ｉ个变量（ｚｉ）在第ｊ个公共因子Ｆｊ上的负荷，简称因子负荷，如果把Ｚｉ看成Ｐ维因子空间的一个向量，则ａｉｊ表示Ｚｉ在坐标轴Ｆｊ上的投影。因子分析的目的就是通过上述模型，以Ｆ代Ｚ，由于一般有Ｐ＜ｍ，从而达到简化变量维数的愿望。

１．４因子分析法和ＳＰＳＳ软件应用时一对一的正确步骤（１）指标的正向化。（２）指标数据标准化（ＳＰＳＳ软件自动执行）。（３）指标之间的相关性判定：用ＳＰＳＳ软件中表“ＣｏｒｒｅｌａｔｉｏｎＭａｔｒｉｘ（相关系数矩阵）”判定。

（４）确定因子个数ｍ：用ＳＰＳＳ软件中表“ＴｏｔａｌＶａｒｉａｎｃｅＥｘｐｌａｉｎｅｄ”特征值累计贡献率，结合表“ＲｏｔａｔｅｄＣｏｍｐｏｎｅｎｔＭａｔｒｉｘ（旋转后因子载荷

中变量不出现丢失，确定因子个数ｍ。阵）”

（５）求旋转后因子载荷阵：ＳＰＳＳ软件中表“ＲｏｔａｔｅｄＣｏｍｐｏｎｅｎｔＭａｔｒｉｘ”。（６）因子Ｚｉ的命名：将ＳＰＳＳ软件中表“ＲｏｔａｔｅｄＣｏｍｐｏｎｅｎｔＭａｔｒｉｘ”因子载荷矩阵的第ｉ列绝对值大的对应变量归为Ｚｉ一类，并由此对Ｚｉ命名（命名清晰性高）。

（７）回归求因子得分函数Ｚｉ表达式：ＳＰＳＳ软件中表“ＣｏｍｐｏｎｅｎｔＳｃｏｒｅＣｏｅｆｆｉｃｉｅｎｔＭａｔｒｉｘ（因子得分系数矩阵）”的第ｉ列向量为第ｉ个因子得分函数Ｚｉ的系数，由此写出因子得分函数Ｚｉ表达式。

（８）求单因子得分值（ＳＰＳＳ软件自动执行）与综合因子得分值（在“ｔｒａｎｓｆｏｒｍ→ｃｏｍｐｕｔｅ”中进行计算）。

（９）检验：综合评价值用实际结果、经验与原始数据做聚类分析进行

。检验（对有争议的结果，可用原始数据做判别分析解决争议）

（１０）综合实证分析。２、实证分析举例

２．１数据准备本文拟选取以下１１个经济指标构建城市工业现代化的指标体系：

Ｘ１：人均国内生产总值（元）Ｘ２：工业总产值（亿元）Ｘ３：全社会固定投资额（亿元）Ｘ４：进出口总额（亿美元）Ｘ５：工业用电（亿千瓦时）Ｘ６：专业技术人员比重（％）Ｘ７：大中型企业比重（％）Ｘ８：二三产业对ＧＤＰ贡献率（％）Ｘ９：二三产业从业人员比重（％）Ｘ１０：人均可支配收入（元）Ｘ１１：利用外资额（万美元）

这里选取的具有代表性的一些指标，能够反映江苏省各个城市的工业现代化指标，其具体的数据见下表１：Ｘ６

Ｘ７大中型

企业比重（％）０．１５６０．１１３０．２９６

Ｘ８二三产业ＧＤＰ贡献率（％）０．９７８０．９７４０．９７８

Ｘ９二三产业从业人员比重（％）

０．８６６０．８６９０．８２４

Ｘ１０人均可支配收入（元）８８４８９４５４７６１６

Ｘ１１利用外资

额（万美元）８５１３４８８５７５１３７１５

…

ｃＵ

ｍ

（ｍ×m）（ｍ×1)（对角阵）

Ｕ

表１江苏省城市工业化指标数值

Ｘ１

指标城市

人均国内生产总值（元）２６０２５３７７００１９７２６

Ｘ２工业总产值（亿元）１５７９．２１１１５．１２９５．７３

Ｘ３固定资产投资（亿元）４１６．７２７７１７６．７

Ｘ４

Ｘ５

专业技术进出口

工业用电

人员比重总额

（亿千瓦时）

（％）（亿美元）９４．６９４９．１１２．９

１２２．５７９．０１４０．１１

０．１５０．１６４０．１４７

南京无锡徐州

spss使用

常州苏州南通连云港淮安盐城扬州镇江泰州宿迁

２５４１７２９６９３２４１８０１７８７０７０２２１３６１７２１３１１２６３１０２０５７９８３８３

４６４．９９１０３９．６２９２．１４１１２．１８１８８．２１９０．０３３０９．７９２２７．６１１８８．３３１１．２２

１００．８２４３．５７８．１８９２．０７９７．０６４３．２８７４．０３６０．２１５４．７６２４．１８

１９．９４１１９．８３２１．８７６．３２２．６５１．９３６．６７１０．４２１．８２０．１６

２９．９６６６．４７２５．１７１１．９１２０．２７．８６１５．９３２５．４１８．６８１．３９

０．１９３０．１２５０．１４７０．１５４０．０４５０．１９１０．１２２０．２０７０．１１６０．０６３

０．１４８０．０９７０．１９１０．１６３０．１２５０．３４０．１５６０．２７８０．３０３０．３３３

０．９８２０．９５９０．９７７０．９４１０．７７４０．９３２０．９５３０．９９００．９６３０．９４６

０．９４４０．８２５０．８１１０．８２４０．４７８０．８６８０．８５７０．９０６０．７７８０．７３２

表７主因子命名

变量高载荷指标因子命名

主因子一

Ｘ３、Ｘ４、Ｘ５、Ｘ７、Ｘ１０、Ｘ１１Ｘ２、

综合实力因子

主因子二Ｘ１、Ｘ６、Ｘ８、Ｘ９产业发展因子９４０６１０５１５８４８５６９８１６５１３６９３５７２０５７６９８７４３９４８９９

３５９４９１１８４８２９８６１４１１９１２４３１０４９６４３３１９５９４４３５８２７５

２．２因子分析

下面用ＳＰＳＳ１２．０ｆｏｒＷｉｎｄｏｗｓ统计软件进行实证分析。２．２．１首先将数据进行标准化，以备后用（表２略）２．２．２求出１１个指标的相关系数矩阵Ｒ（表３略）由相关系数矩阵可以看出，１１个指标彼此之间存在一定的相关性，说明１１个指标反映的经济信息有一定的重迭。

２．２．３计算矩阵Ｒ的特征值，求特征值的贡献率和累计贡献率（表４略）

根据特征值大于１的提取原则，有两个因子符合原则，并且前两个因子的累计贡献率为８４．３３７％，即前两个公因子所解释的方差占总方差的８４．３３７％，用这两个公因子来反映城市的工业现代程度所损失的信息不多，所以这两个公因子能够综合反映江苏各城市的工业现代化水平。

２．２．４采用主成分分析法计算出初始因子载荷矩阵（表５略）２．２．５因子旋转建立因子分析模型的目的不仅是找出主因子，更重

然而用上述方法求出的公因子解，各主要的是知道每个主因子的意义。

因子的典型代表变量不很突出，容易使因子的意义含糊不清，不便于对

因此用方差最大正交旋转法对因子进行旋转，得表实际问题进行分析。

６。

表６旋转后因子载荷矩阵（方差最大正交旋转矩阵）

变量

人均国内生产总值（Ｘ１）工业总产值（Ｘ２）全社会固定投资额（Ｘ３）进出口总额（Ｘ４）工业用电（Ｘ５）专业技术人员比重（Ｘ６）大中型企业比重（Ｘ７）二三产业对ＧＤＰ贡献率（Ｘ８）二三产业从业人员比重（Ｘ９）人均可支配收入（Ｘ１０）利用外资额（Ｘ１１）

Ｃｏｍｐｏｎｅｎｔ１．６４３．９５４．９１８．９２０．９２０．０２９－．７４５．０９９．１０５．７７０．９３３

２．６５８．１７５．０９１．１１７．１６５．８９７．１９３．９１５．９６７．４５３．２１５

２．２．６利用ｒｅｇｒｅｓｓｉｏｎ（回归法），得出因子得分系数矩阵（见表８）

表８因子得分系数矩阵

变量

人均国内生产总值（Ｘ１）

工业总产值（Ｘ２）全社会固定投资额（Ｘ３）

进出口总额（Ｘ４）工业用电（Ｘ５）专业技术人员比重（Ｘ６）大中型企业比重（Ｘ７）二三产业对ＧＤＰ贡献率（Ｘ８）二三产业从业人员比重（Ｘ９）人均可支配收入（Ｘ１０）利用外资额（Ｘ１１）城市南京苏州无锡常州镇江南通徐州扬州连云港泰州盐城宿迁淮安

Ｚ１１．８６６７７１．７４１４４１．３０４２９－．００９９６－．６４４３８－．２２３５０－．３７０４３－．３５８９３－．５０４８７－．７０５０７－１．０６５７５－１．０７７０３．０４７４１

Ｚ２．０８５９０－．０９６３５．５２８９０．９６８７４１．１５６８４．２９７７８．３２２４７－．０１７２６－．０３３６２．０２２９８．４８１６３－．８３７１３－２．８８０８９

Ｃｏｍｐｏｎｅｎｔ１．０６６．１６９．１６９．１６７．１６３－．０７４－．１６１－．０６２－．０６６．１０８．１６１Ｚ１．０２７３８．９０４２０．８６１８４．２９２２１．００９８０－．０２８３８－．０９９５９－．１９７７７－．２８１０４－．３７１０１－．４２３５４－．８３４６５－．８５９４４

２．１６５－．０２６－．０５１－．０４２－．０２６．３００．１３１．２９９．３１７．０８４－．０１０排序１２３４５６７８９１０１１１２１３

（下转第１０５页）

表９因子综合得分及排序

由旋转后的因子载荷矩阵可以看出：

因子１主要反映一个城市的经济发展状况，因子１得分越高说明城市的经济越发达，城市的工业现代化程度越高。

因子２主要反映城市二﹑三产业的比重及产业的集中度，因此，因子２得分越高城市的工业化程度越高。

给主因子命名，见表７：

spss使用

密度函数为

∞

ｆＲ（ｒ）＝ｒＪ０（）×仪Ｊ０（）Ｊ０（ｒｑ）ｑｄｑｒ＞＝０

ｎ＝１０姨０姨０是时间ｔ和包络幅度ｒ的函数。可以得出Ｊａｋｅｓ仿真器产生的不是广义平稳（ＷＳＳ）信号。同理其自相关函数即使当Ｎ０→∞，ｔ１＝ｔ２＝ｔ时ＲＲＲ（ｔ，ｔ）→１＋Ｊ０（２ωｍｔ）仍然是时变的，因此Ｊａｋｅｓ仿真器不是各态历经的，统计特性不能达到Ｒａｙｌｅｉｇｈ信道模型的要求：基包络并未严格服从Ｒａｙｌｅｉｇｈ分布，且是时变的；自相关函数并未趋向于贝塞尔函数，同相和正交分

分析其统计特性产生偏差的原因量之间具有相关性，互相系数不为零。

可将（１）式改写如下：

Ｔ（ｔ）＝｛Σ［ｅｘｐｊ（ωｍｃｏｓαｎｔ＋ｂｎ）＋ｅｘｐｊ（-ωｍｃｏｓαｎｔ＋ｂｎ＋２Ｎ０＋１）

ｎ＝１

＋ｅｘｐｊ（ωｍｃｏｓαｎｔ＋ｂ４Ｎ０＋２－ｎ）＋ｅｘｐｊ（-ωｍｃｏｓαｎｔ＋ｂ２Ｎ０＋１－ｎ）

（３）＋ｅｘｐｊ（ωｍｔ＋ｂ４Ｎ０＋２）＋ｅｘｐｊ（-ωｍｔ＋ｂ２Ｎ０＋１）｝

将式（２）、（３）进行比较可以得出相移ｂｎ，ｂ２Ｎ０＋１－ｎ，和ｂ４Ｎ０＋２－ｎ之间具有相关性，也就具有相同多普勒频移的到达波具有相关性，这与参考模型“不同路径的附加相移是相互独立的”假设是矛盾的。Ｊａｋｅｓ仿真器利中

用多普勒频移的对称性减少了振荡器的数目，同时也使得生成的信号不稳定，这就是Ｊａｋｅｓ仿真器产生的信号不平稳的根本原因。

２．２Ｊａｋｅｓ仿真器的多普勒频移简化法

此法与Ｊａｋｅｓ仿真器不同之处在于考虑多普勒频移的同时，把所有对应的随机相移都考虑进去了，这样就避免了Ｊａｋｅｓ仿真器中随机相移产生的问题，保证了物理信道的真实特性，能够与参考模型的所有特性

。相吻合（Ｊａｋｅｓ改进仿真模型见图３）

乙

Ｎ０

关函数除了与时间差有关外，还与时间和有关［１］。综上所述，Ｊａｋｅｓ信道

模型在减少振荡器的同时，引入相移之间的相关性，使输出信号偏离了

而多普勒频移简化法充分考虑了相移的随机特Ｒａｙｌｅｉｇｈ信道统计模型。

性，更符合参考模型的统计特性。

姨

Ｎ０

图１Ｊａｋｅｓ仿真器模型

Ｒ（ｔ）＝Σｃｏｓ（ωｃｔ＋ωｍｔｃｏｓαｎ＋φｎ）＝Ｘｃ（ｔ）ｃｏｓωｃｔ＋Ｘｓ（ｔ）ｓｉｎωｃｔ

ｎ＝１

对同相分量和正交分量表达式做如下变化：

Ｎ

姨

图２对比模型和理论自相关函数（σ２＝１，ｆｍａｘ＝９１Ｈｚ）

Ｐｎ＝ｃｏｓφｎ＋ｃｏｓφ２Ｎ０＋１－ｎ＋ｃｏｓφ２Ｎ０＋１＋ｎ＋ｃｏｓφ４Ｎ０＋２－ｎＰｎ＝ｓｉｎφｎ－ｓｉｎφ２Ｎ０＋１－ｎ－ｓｉｎφ２Ｎ０＋１＋ｎ＋ｓｉｎφ４Ｎ０＋２－ｎＱｎ＝ｓｉｎφｎ＋ｓｉｎφ２Ｎ０＋１－ｎ＋ｓｉｎφ２Ｎ０＋１＋ｎ＋ｓｉｎφ４Ｎ０＋２－ｎＱｎ＝ｃｏｓφｎ－ｃｏｓφ２Ｎ０＋１－ｎ－ｃｏｓφ２Ｎ０＋１＋ｎ＋ｃｏｓφ４Ｎ０＋２－ｎＰＮ＋１＝ｃｏｓφ２Ｎ０＋１＋ｃｏｓφ４Ｎ０＋２

０

ｃｓ

ｓ

ｃ

ｃｓ

ＰＮ＋１＝ｓｉｎφ２Ｎ０＋１－ｓｉｎφ４Ｎ０＋２

０

ＱＮ＋１＝ｓｉｎφ２Ｎ０＋１＋ｓｉｎφ４Ｎ０＋２

０

ｓ

图３

４结束语