基于因子_聚类分析的大学生就业满意度统计及预测

更新时间:2023-05-14 08:30:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

hao

7070(2010)06-0510-04文章编号:1674-

基于因子-聚类分析的大学生就业满意度统计及预测

摘要

引用满意度指数的概念,根据实际满意度调查的数据,利用多元统计分析的方法,对2010届毕业生选择的第一份工作的满意度进行了实证分析,得出影响毕业生就业满意度的主要因子分别为单位内部因子”、“个体发展因子”、“外

显所得因子”,其中起主要影响的因素是

单位因子”,三者的影响程度依次递减,同时对2010届大学毕业生对工作的满意程度进行了预测.关键词

大学生;就业;满意度;因子分析;聚类分析

中图分类号O212.4文献标志码A

收稿日期2010-06-12作者简介

吴亚娟,女,硕士,讲师,研究方向为数学教学论.wuyajuan2002@sohu.com

1南京信息工程大学数理学院,南京,

210044吴亚娟

1

0引言

Introduction

用户满意度指数(CustomerSatisfactionIndex,

CSI)是目前许多国家积极研究和使用的一种新型宏观经济指标,是专门用来测量用户对产

品和服务满意程度的质量指标,用来反映产品和服务的质量状况[1],目前美国已经完成了行业覆盖面最广泛的用户满意度指数体系.

就业是民生问题,它关系到社会的稳定和经济发展.近年来,大学生就业观念和就业环境正日益发生变化,毕业生择业过程中也呈

现出许多新的特点,影响因素也越来越多[2].为进一步了解当代大学生的就业观念,清楚的反映当代大学生就业方面的要求,协调好社

会、学校、学生三者间的关系,引用用户满意度指数的理论和方法,研究大学生对就业的满意度是可行的,也是必要的.

1

因子分析与聚类分析

Factoranalysisandclusteranalysis1.1

因子分析

因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,再现原始变量与因子之间的相互关系,同时根据因子的不同还可以对变量进行分类的一

种多元统计分析方法[3]

因子分析的基本过程:

1)因子分析的前提条件鉴定.考察原始变量之间是否存在较强的相关性,是否适合进行因子分析.因为因子分析的主要任务之一就是对原有变量中信息重叠的部分提取和综合成因子,最终实现减少变量个数的目的,所以要求原有变量之间应存在较强的相关关系.否则,如果原有变量相互独立,不存在信息重叠,也就无需进行综合和因子分析.

2)因子提取.研究如何在样本数据的基础上提取综合因子.3)因子旋转.通过正交旋转或斜交旋转提取出的因子具有可解释性.

4)计算因子得分.通过各种方法求解各样本在各因子上的得分,为进一步分析奠定基础.

““

hao

2010,2(6):510-513学报:自然科学版,

JournalofNanjingUniversityofInformationScienceandTechnology:NaturalScienceEdition,2010,2(6):510-513

511

1.2

聚类分析

聚类分析(ClusterAnalysis)是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物

归类.它的原则是同一类中的个体有较大的相似性,

不属于同一类的个体之间差异性很大.聚类分析的大部分应用都属于探测性研究,

最终结果是产生研究对象的分类,通过对数据的分类研究还能产生假设.聚类分析也能用于证实性目的,对于通过其他方

法确定的数据分类,可以应用聚类分析进行检验[4]

.聚类分析有利于处理随意和主观性的不确定问题,并达到归类效果,而因子分析法是用于将诸多影响因素归为几个主要指标的统计方法,故将其相结合用于大学生就业满意度的研究与分析.

本文采用了K-均值聚类法[5-6],这种算法的基

本思想是将每一个样品分配给最近中心(均值)的

类中,具体算法至少包括以下3个步骤:

1)从n个数据样本中任意选择k个对象作为初始聚类中心,对于剩下的样本,根据其与聚类中心的距离,分配给距离最近的类;2)计算获得每个新类的中心,根据各个样本与聚类中心的距离,重新分配各个样本归属类别;3)不断重复上述过程,直到样本所属类别达到稳定,或者达到指定的循环次数.衡量样本间或者类与样本间距离的方法常用的

是欧氏距离.假设有p个变量,则样本i(xi1,xi2,xi3,…,xip)与样本j(xj1,xj2,xj3,…,xjp)间的距离d计算

公式如下:d(x,y)=

xi1

-xj1)

+…+(xip-xjp).

2

实例分析

Casestudy2.1

数据来源

本研究中就业满意度评价体系列举了现实工作

中的18个评价指标,具体为签约单位的性质X1;单位在同行业的竞争力及实力X2;工作地点及周围环境X3;单位人员结构及用人机制X4;规章制度X5;单位在这次聘用的新人情况(学历、毕业学校、户籍等)X6;与专业的对口X7;工作强度X8;硬件设施X9;实习期间人际关系X10;薪酬及福利待遇X11;在单位里拥有的个人发展空间X12;对所在单位工作领域获得的社会声望X13;单位能够提供的培训计划或进修机会X14;能够对社会做出的贡献X15;实现自我X16;工作的挑战性X17;工作的创造性X18.每个评价指标

分别按照非常满意、

满意、基本满意、不满意和非常不满意5个等级要求毕业生评判,评价结果量化分别对应5分、

3分、1分、1/3分和1/5分.在满意度调查中,通过校内纸质调查问卷和校外网络调查,

随机抽取了不同地区、不同学校、不同专业的2010届毕业生进行工作满意度调查评价.为保证评价信息的效度和信度,校外网络调查在校园和高校论坛里进行,评价时间选择安排在毕业生签约后实习期间,这样保证对用人单位基本情况有所了解.本研究采用随机抽样的方法,以100名毕业生的评价数据为样本.2.2

因子分析结果

用SPSS软件进行数据处理.1)可行性检验

首先对原始数据进行主成分分析可行性检验,

由KMO和Bartlett检验结果知,

KMO值为0.905>0.6,同时Bartlett检验的伴随概率为0,小于显著水平0.05,以上检验结果都说明原始数据能够进行主

成分分析.

2)方差分解

接下来对原始数据进行总方差分解,

在此设置提取的因子对应的特征值界限为1,因子提取和因子旋转的分析结果表明,采用主成分分析提取公因子后,前3个变量特征值的累积贡献率为79.193%,这说明前3个特征值包含要调查信息的79.193%.所以可以选择前3个特征值对应的向量为公共因子.

3)因子旋转

将评价指标体系中的18个评价指标划分为3类,再对样本进行分析.为了清楚解释该3类因素的构成,可对因子载荷进行方差最大化旋转,得到旋转前后矩阵.从旋转前的因子载荷矩阵中,每个因子在不同原始变量上的载荷没有明显的差别.为了便于

对因子进行命名,

还需对因子载荷阵进行旋转,而后得出旋转后的因子载荷阵,

经过旋转后的载荷系数已近明显地两级分化了.根据因子载荷的大小(在此取载荷因子>0.5),第1个公共因子(F1)在指标X1、X4、X5、X6、X8、X9、X10上有较大载荷,说明这7个指标有较强的相关性,可以归为一类,从整体看这7个指标属于单位内部工作实际环境的指标,因此可

以把第1个因子命名为

“单位内部因子”;第2个公共因子(F2)在指标X7、

X12、X14、X16

、X17、X18上有较大载荷,同样可以归为一类,这6个指标多数属于毕业生后续发展的指标,因此可以把第2个因子命名为

hao

512

吴亚娟.基于因子-聚类分析的大学生就业满意度统计及预测.

WUYajuan.Undergraduateemploymentsatisfactionstatistics&evaluationbasedonfactoranalysisandclusteranalysis.

“个体发展因子”;同样X2、X3、X11、X13、X15归为第3类,与工作所带来的经济、地位等变化有关,因此把第3个因子(F3)命名为

“外显所得因子”.从以上可以得出这样的结论,即影响毕业生就业满意度受多方面因素影响,但可将若干因素归结为3个方面,按影响力的大小顺序依次为F1“单位内部因子”

、F2“个体发展因子”、F3“外显所得因子”.4)因子分值计算通过以上研究可以发现影响毕业生就业质量的主要因素,接下去计算这3个因子的分值.首先计算这3个因素的因子得分系数矩阵,可以得出因子的得分表达式如下:

F2=0.129X1-0.041X2+0.086X3+0.272X4+ 0.322X5+0.240X6-0.148X7+0.189X8+

0.214X9+0.289X10+0.024X11-

0.051X12-0.205X13-0.108X14- 0.169X15-0.051X16-0.150X17-

0.062X18, F2=-0.084X1-0.116X2-0.160X3-0.048X 4-

0.109X5-0.181X6-0.162X7-0.049X8-

0.057X9+0.073X10-0.012X11+0.236X12+ 0.048X13+0.198X14+0.140X15+

0.314X16+0.325X17+0.400X18, F3=0.084X1+0.319X2+0.201X3-0.130X4- 0.129X5+0.049X6-0.480X7-0.035X8-

0.046X9-0.296X10+0.134X11-0.056X12+

0.335X13+0.047X14+0.186X15-0.145X16- 0.033X17-0.226X18.其中Xi(1≤i≤18)也表示第Xi个就业满意指标的得分值.取前10位毕业生就业满意指标的得分带入表达式,

计算各因子得分值.以每个公共因子所对应的特征值占所提取公共因子总的特征值之和的比例

作为权重计算综合得分模型:

F=λ1λFλ2λ3

1+F2+F3

1+λ2+λ3λ1+λ2+λ3λ1+λ2+λ3其中λ1、λ2、λ3分别为各对应因子的特征值.依此式计算10名毕业生综合得分值,并对其按综合主成分值进行排序,即可对每个毕业生进行满意度综合评价.由表1可以看出,满意度最高的是学生4,最低的是学生6,这符合毕业生实际情况.通过这个实例证明采取因子分析法对毕业生就业满意度的探讨是可行的.

表1毕业生满意综合评价表Table1

Graduatesatisfactionevaluation

学生因子综合评价值F

排名10.1186720.412653-0.3996841.3611150.160766-0.56201070.7372380.6215491.2708210

-0.5017

9

2.3

聚类分析结果

利用因子分析法把18个影响因素降维到3个

主要因子,其累积贡献率为79.193%,在聚类过程中只取这3个因子进行聚类分析.

由SPSS自动给定K-均值迭代的初始类中心坐

标,从5个初始类的中心开始进行K-均值迭代,每次迭代都将导致类中心的变化,同时每次迭代导致的类中心变化量在逐渐减少,第9次迭代导致的类中心的变化量已经为0,达到了收敛.至此100名毕业生被分成5类.

第1类包括15名学生,其类中心3个主因子分值

分别为-0.77161,

1.25125,0.70357.依大小顺序排列可知,主因子F2分值最大,可以理解为这类毕业生中该因子满意度较高,其次是因子F3,满意度最低的是F1,从这个数据可以看出,这一类的毕业生对单位

实际工作环境满意程度较弱,应值得用人单位和有关部门采取措施,

提高这类毕业生的满意度.第2类包括42名学生,其类中心3个主因子分值分别为-0.23360,-0.11753,-0.93075.由于3个因子分值都是负数,这一类毕业生在这3个因子

方面满意度普遍不高,

且比重较大,学校应该加强就业方面的指导工作.

第3类包括28名学生,其类中心3个主因子分值分别为-0.29967,-0.79614,0.56441,满意的程度依大小分别为F3、F1、F2,这类毕业生对单位情况及自我的后续发展空间不够满意.

第4类包括2名毕业生,其类中心3个主因子

分值分别为3.21909,

-2.33971,1.32872.数据很明显,

F1非常高,而因子F2却很低,可知这一类毕业生对自己的评价和预期可能有些误差,应积极调

hao

2010,2(6):510-513学报:自然科学版,

JournalofNanjingUniversityofInformationScienceandTechnology:NaturalScienceEdition,2010,2(6):510-513

51

3

整发展方向,改变对已有工作的某些看法和认识.

第5类包括13名学生,其类中心3个主因子分1.01167,0.77516.从这组数据值分别为1.11600,可知,这类毕业生各项因子满意程度比较均衡,应适当做好追踪毕业生满意度工作,维持好毕业生的平均满意度.

区域分布较为广泛,但是忽略了高校的生参与调查,

类型、学校所处地理位置、学生的专业以及性别差异等影响因素,这些问题有待进一步研究和讨论.

参考文献

References

[1]梁燕.关于顾客满意度指数的若干问题研究[J].统计研究,

2003(11):52-56

LIANGYan.Someaspectsofcustomersatisfactionindex[J].Sta-2003(11):52-56tisticalResearch,

[2]武毅英.高校毕业生就业问题的教育学审视[M].厦门:厦门

2006大学出版社,

WUYiying.Theeducationreviewaboutemploymentofgraduates[M].Xiamen:XiamenUniversityPress,2006

[3]李静萍,M].北京:中国人谢邦昌.多元统计分析方法与应用[

2008:21-60民大学出版社,

LIJingpin,XIEBangchang.Multivariatestatisticalanalysismethodandapplication[M].Beijing:ChinaRenminUniversityPress,2008:21-27,51-60

[4]肖宜滨.聚类分析的理论及其应用[J].江苏统计,2001(11):

13-15

XIAOYibin.Theoryandapplicationofclusteranalysis[J].Jiang-suStatistics,2001(11):13-15

[5]李柏年.模糊数学及其应用[M].合肥:合肥工业大学出版社,

2007:54-60

LIBonian.Fuzzymathematicsanditsapplication[M].HefeiUni-2007:54-60versityofTechnologyPublishingHouse,

[6]勺海(北京)市场研究公司.主成分分析和聚类分析在满意度

EB/OL].(2009-12-02)[2010-05-23].http:∥研究中的应用[

www.datasea.com.cn/article/detail.jsp?aid=79

DataseaMarketingResearch.Applicationofprincipalcomponentanalysisandclusteranalysisinsatisfactionresearch[EB/OL].(2009-12-02)[2010-05-23].http:∥www.datasea.com.cn/arti-cle/detail.jsp?aid=79

3结语

Conclusion

因子分析法结果表明,高校2010届毕业生就业

满意度影响因素可分为3大类,它们分别是“单位内”、“个体发展因子”、“外显所得因子”,部因子其中

,依次影响程度递起主要影响的因素是“单位因子”

减.可见,当高等教育从精英教育向大众教育的转型

过程中,大学生择业观也逐渐趋于现实和理性,将“个体的可持续发展”放到了重要位置,这点在当代

——农业社会向工业社会、中国社会转型期—知识经济社会转变中显得尤为重要.

结合聚类分析后的结果数据可以看到,目前大

有42/100的学生对学生对就业的满意度普遍不高,

上述3个指标都未能表示满意,这就要求各就业主管部门和高校把毕业生就业工作摆在重要议事日

程,继续开辟新的就业渠道,进一步完善促进毕业生就业的政策,努力形成长效机制.

该调查的数据主要来源于网络调查,有来自江苏、山东、四川、广东、北京、上海、陕西等省份的毕业

Undergraduateemploymentsatisfactionstatistics&evaluation

basedonfactoranalysisandclusteranalysis

WUYajuan1

1SchoolofMathematicsandPhysics,NanjingUniversityofInformationScience&Technology,Nanjing210044

AbstractFindingsatisfactoryjobsispursuedbyundergraduates,theuniversityandthewholecommunity,butwhat

istherealpictureofthegraduateemployment?Usingtheconceptofsatisfactionindexandmethodofmultivariatethispaperanalysedthe2010graduates'satisfactionontheirfirstjobbasedontheinvestigativestatisticalanalysis,

statistics.Resultsshowedthattheinfluencefacotsofemploymentsatsfactionmainlyincludecompanyenvironment,individualpromotionandincomelevel,andthethreefactorsexertdegressiveinfluenceonrespondents'satisfaction.Keywords

undergraduate;employment;satisfaction;factoranalysis;clusteranalysis

本文来源:https://www.bwwdw.com/article/3c6e.html

Top