聚类分析及判别分析案例

更新时间:2023-06-11 10:30:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、 案例背景

随着现代人力资源管理理论的迅速发展,绩效考评技术水平也在不断提高。绩效的多因性、多维性,要求对绩效实施多标准大样本科学有效的评价。对企业来说,对上千人进行多达50~60个标准的考核是很常见的现象。但是,目前多标准大样本大型企业绩效考评 问题仍然困扰着许多人力资源管理从业人员。为此,有必要将当今国际上最流行的视窗统计软件SPSS应用于绩效考评之中。

在分析企业员工绩效水平时, 由于员工绩效水平的指标很多,各指标之间还有一定的关联性,缺乏有效的方法进行比较。目前较理想的方法是非参数统计方法。本文将列举某企业的具体情况确定适当的考核标准,采用主成分分析以及聚类分析方法,比较出各员工绩效水平,从而为企业绩效管理提供一定的科学依据。

最后采用判别分析建立判别函数,同时与原分类进行比较。

聚类分析

二、绩效考评的模型建立

1、为了分析某企业绩效水平,按照综合性、可比性、实用性和易操作性的选取指标原则,本文选择了影响某企业绩效水平的成果、行为、态度等6个经济指标(见表1)。

2、对某企业,搜集整理了28名员工2009年第1季度的数据资料。构建1个28×6维的矩阵(见表2)。

3、应用SPSS数据统计分析系统首先对变量进行及主成分分析,找到样本的主成分及各变量在成分中的得分。去结果中的表3、表4、表5备用。

表 5

成份得分系数矩阵a

成份

1 2

Zscore(X1) Zscore(X2) Zscore(X3) Zscore(X4) Zscore(X5) Zscore(X6) 提取方法 :主成份。 构成得分。

a. 系数已被标准化。

4、从表3中可得到前两个成分的特征值大于1,分别为3.944和1.08,所以选取两个主成分。根据累计贡献率超过80%的一般选取原则,主成分1和主成分2的累计贡献率已达到

了83.74%的水平,表明原来6个变量反映的信息可由两个主成分反映83.74%。

从表4可看出,第一主成分基本支持了X1、X2、X3、X5和X6。而第二主成分基本支持了,该成分因子得分还有对未来员工绩效预报作用。第一主成分与工作质量、工作产量以及工作出勤高度正相关。因此第一主成分可以反映影响该企业绩效的工作成绩因素。第二主成分与工作能力以及工作态度高度正相关, 因此第二主成份可以反映影响该企业员工绩效的能力与态度因素。

三、绩效水平的类型划分及区域差异分析

因为本案例要研究职工工作绩效成绩的得分,根据两个主成分的表示重点不同,我们可以看到第一主成份反映的是绩效成绩的得分。所以计算每个样本在第一主成份方向的得分。

可以对数据标准化,并用每个样本乘以第一成分得分矩阵,即得各样本在第一主成份的综合得分。

例如1号样本在第一主成份方向的综合得分为: 2.24478*0.227 + 2.06671*0.228 + 1.82854*0.224 + 1.54332*0.177 + 1.56685*0.1865 + 2.07013*0.185=2.337944

其他各样本均按此方法算出综合得分,并按各样本在在第一主成分方向的综合得分的降序顺序排列数据,得到的就是各个员工工作绩效成绩得分。如表6

四、聚类分析

为了把各个员工工作绩效成绩分类,更好的描述成绩区间,我们要采用聚类分析对员工进行分类。(计划分为4类:优秀、良好、及格、不及格)

分类的步骤为:

1、“分析——分类——系统分类”,把标准化后的变量输入变量框中,在“分群框”中选择“个案”,在“输出框”中选择“统计量”、“图”。

2、“统计量”中选择“合并进程表”、“单一方案”(聚类数为4)。 3、“绘制”中选择“树状图”、“所有聚类”、“垂直”。

4、“方法”中选择“组间连接”、“平方欧式距离”。“标准化”选择“无”(因为采用的是已经标准化后的数据)。

5、“保存”中选择“单一方案”聚类数为4。 6、点击“确定”。 得到以下图表。

11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

图 1

图 2

从表7、图1和图2中我们可以看到聚类的过程

(1) 5、6、7、10、16聚为一类,4、13、21聚为一类,11、18聚为一类;

(2) 5、6、7、8、9、10、16聚为一类,3、4、13、14、15、17、21聚为一类,11、

18、22聚为一类,23、27、28聚为一类,19、20聚为一类,24、26聚为一类,1、2聚为一类;

(3) 3、4、5、6、7、8、9、10、11、13、14、15、16、17、18、21、22聚为一类,

23、25、27、28聚为一类,12、19、20聚为一类; (4) 12、19、20、23、25、27、28聚为一类。

(注:黑色倾斜字体为最终类别)

从表8中我们可以更为详细的看出各个样本的分类情况。 表 8

群集成员 案例 4 群集 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

26 27 28

五、聚类分析结论

根据图2和表8,我们可以把表6进行一定的处理:把同一类别的样本在主成分方向的得分(工作绩效成绩得分)用同一种颜色标记,如表中第一类别为红色,第二类别为粉色,第三类别为绿色,第四类别为蓝色。

并且在改进的表6’中可以看到第一类别的样本的工作绩效成绩得分最高,其次是第二类别、第三类别,得分最低的是第四类别,因此,根据我们可以把最终的分类结果和计划分类结合起来,即:

(1) “优秀”为第一类,包括职工 1、2;

(2) “良好”为第二类,包括职工3、4、5、6、7、8、9、10、11、13、14、15、

16、17、18、21、22;

(3) “及格”为第三类,包括职工12、19、20、23、25、27、28; (4) “不及格”为第四类,包括职工24、26。

判别分析

六、步骤:

1、“分析——分类——判别分析”,把“分类”选入“分组变量”,定义范围:最小值(1),最大值(4),把X1、X2、X3、X4、X5和X6输入“自变量框”,选择“使用逐步式方法”;

2、“统计量”中选择“均值”、“单变量ANOVA”、“Fisher”、“未标准化”、“组内相关”; 3、“方法”默认设置; 4、“分类”中选择“根据组大小计算”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图、分组、区域图”;

5、“保存”中选择“预测组成员”、“判别得分”; 6、点击确定。

得到以下各表和图。

七、样本、变量分析

1、从表1中可以看到各个类别中变量及总变量的均值、方差和标准差等。

2、从表2中的WILKS λ检验中可以看到P(Xi)<0.05,原假设不成立,六个变量均明显显著,其中 i=1、2、3、4、5、6.

八、分析——步骤统计

从表3中可以看出软件最终选取X1、X6最为判别函数的自变量,P(X1)、P(X2)均为零,显著性很强。二者可以很好的表达不同组别的特性。

九、典型判别式函数摘要

1、表4是特征值表,从表显示出典型分析最终形成两个判别函数,判别函数F1的特

征值为15.633,判别函数F2的特征值为0.869,可见判别函数F1的判别能力大于F2。方差百分比的算法为:

94.7%=15.633/(15.633+0.869) 5.3%=0.869/(15.633+0.869)

函数F1能够解释绝大部分方差。典型相关系数现实第一队典型变量的相关系数是0.969,第二对典型变量的相关系数是0.682。

2、表5是判别函数显著性检验。原假设都是所列判别函数不显著。可见在0.05的显著性水平下,用F1、F2两个判别函数判别,Sig.=0.000,判别效果显著;单用F2判别,Sig=0.001,判别效果显著。

3、表6是标准化典型判别函数的系数,写成函数:

F1=1.035*X1+1.088*X6 F2=0.616*X1-0.516*X2

表 7

典型判别式函数系数

函数

1 2

X1 X6

4、表7为非标准化的典型判别函数系数,写成函数为: F1=-34.983+1.422*X1+3.182*X6 F=6.878+0.846*X1-1.509*X6

5、表8为四个类别质心对应两个判别函数的值。

根据非标准化的判别函数和基础数据中各个样本的X1、X6的数值,分别计算各个样本在两个判别函数的值,最终得到表9

左半部分。表9的右半部分是电脑给出的,二者差别微小,可能是软件计算和人工计算的差别。这两组数据也是各个样本在两个判别函数上的判别得分。

6、用计算机给出的判别得分作图。以判别函数F1作为横坐标,判别函数F2作为纵坐标,最终得到了区域图,从区域图中可以清楚的看到四个类别的分类区间。利用各个样本的判别得分可以检验样本是否在相应的区间。

对于新样本也可以利用非标准化典型判别函数计算出相应的判别得分,在图中找出对 应的点,看其在哪个区域内,相对应的就是哪个类别。 图2为各个点在其类别区域内的显示情况。

图 1——区域图

(假定前两个函数以外的所有函数为 0) 典则判别

函数 2

-16.0 -12.0 -8.0 -4.0 .0 4.0 8.0 12.0 16.0 +---------+---------+---------+---------+---------+---------+---------+---------+ 16.0 + 42 21 + I 42 21 I I 42 21 I I 42 21 I I 42 21 I I 42 21 I 12.0 + + + +42 + + 21 + + + I 42 21 I

I 42 21 I I 42 21 I I 42 21 I I 42 21 I 8.0 + + + +42 + + 21 + + + I 42 21 I I 42 21 I I 42 21 I I 42 21 I I 42 21 I 4.0 + + + 4332 + + 21 + + + I 43 32 21 I I 43 32 21 I I 43 32 21 I I * 43 32 21 I I 43 32 * 21 I .0 + + + 43 + 32 + + 21 + * + + I 43 32 21 I I 43 * 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I -4.0 + + + 43 + + 32 + 21 + + + I 43 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I -8.0 + + 43+ + + 32+21 + + + I 43 3221 I I 43 321 I I 43 31 I I 43 31 I I 43 31 I -12.0 + + 43 + + + +31 + + + I 43 31 I I 43 31 I I 43 31 I I 43 31 I I 43 31 I -16.0 + 43 31 + +---------+---------+---------+---------+---------+---------+---------+---------+ -16.0 -12.0 -8.0 -4.0 .0 4.0 8.0 12.0 16.0 典则判别函数 1

区域图中使用的符号

符号 组 标签

---- -- -------------- 1 1 2 2 3 3 4 4

* 表示一个组质心

图 2——单独组图表

十、分类统计量

表 10

分类处理摘要

已处理的

已排除的 缺失或越界组代码

至少一个缺失判别变量

用于输出中

4 合计

1、表13为Fisher的线性判别式函数系数,根据系数可建立Fisher判别函数,四个类别的函数如下:

CF1=-979.149+55.954*X1+149.550*X6 CF2=-668.684+45.742*X1+124.187*X6 CF3=-571.776+39.564*X1+116.667*X6 CF4=-347.036+31.778*X1+89.987*X6

2、通过分类函数,把各个样本中的X1、X6的值带到分类函数中,每个样本都得到四个判别函数值,形成表13。比较四个值,哪个值大,就把样本判别为哪一类。(红色为每行最大值)

本文来源:https://www.bwwdw.com/article/svo1.html

Top