关联度分析

更新时间:2024-06-02 05:24:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

青岛科信软件 决策支持、数据挖掘方法

21.灰色系统关联度分析法

对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于第一,它们的理论基础不同。关联度分析基于灰色系统的灰色过程,而相关分析则基于概率论的随机过程;第二,分析方法不同。关联分析是进行因素间时间序列的比较,而相关分析是因素间数组的比较;第三,数据量要求不同。关联分析不要求数据太多,而相关分析则需有足够的数据量;第四,研究重点不同。关联度分析主要研究动态过程,而相关分析则以静态研究为主。 因此,关联度分析适应性更广,在用于社会经济系统中的应用更有其独到之处。 21.1原理与方法简介

关联度分析一般包括下列计算和步骤:(1) 原始数据变换;(2)

计算关联系数;(3) 求关联度;(3) 排关联序;(4) 列关联矩阵。在应用中是否进行所有步骤,可视具体情况而定。

设有m个时间序列

1

青岛科信软件 决策支持、数据挖掘方法

t12?(m)xn1亦即

xxx?(t)1(1)1(2)1xxx?(t)2(1)2(2)2?x?x?x??(t)n(1)n(2)n(m)x2(m)?xn

(0)(0){X1(0)(t)},{X2(t)},?,{Xm(t)} (t=1, 2, ?, N )

N为各序列的长度即数据个数,这m个序列代表m个因素(变量)。另设定时间序列:

{X0(0)(t)}

(t=1, 2, ?, N )

该时间序列称为母序列, 而上述m个时间序列称为子序列。关联度是两个序列关联性大小的度量。根据这一观点,可给关联度一个量化模型,其计算方法与步骤具体叙述如下:

1均值化变换。先分别求出各个序列的平均值,再用平均值去

除对应序列中的各个原始数据,所得到新的数据列。

2指标差值处理。在均值化变换后得到的新数据列

中,用第一列的数据分别与其他列数据相减取绝对值

3 计算关联系数

经数据变换的母数列记为{X0 (t)},子数列记为{Xi (t)},则在

t=k时母序列{X0 (k)}与子序列{Xi (k)}的关联系数L0i (k)可由下

2

青岛科信软件 决策支持、数据挖掘方法

L ( k ) ? 0i

?min ? ??

max ?0 i ( k ) ? ??max

式计算

,式中?0i (k)表示k时刻两比较序列的绝

对差, 即 ?0i (k)=?x0 (k)?xi (k)? (1 ? i ? m); ?max和?min分别表示所有比较序列各个时刻绝对差中的最大值与最小值。因为比较序列相交,故一般取?min=0;?称为分辨系数,其意义是削弱最大绝对差数值太大引起的失真,提高关联系数之间的差异显著性,??(0, 1),一般情况下可取0.1~0.5。本文取0.5。 分析结果

不难看出,关联度与下列因素有关: 1) 母序列X0不同,则关联度不同; 2) 子序列Xi 不同,则关联度不同;

3) 参考点0 (或数据变换)不同,关联度不同; 4) 数据序列长度N不同,关联度不同; 5) 分辨系数?不同,关联度不同。

一般来说,关联度也满足等价“关系”三公理,即: 1) 自反性: r00=1;2) 对称性: r0i =ri0;3) 传递性: r0a >r0b , r0b >r0c,则 r0a >r0c 。

(4) 排关联序

将m个子序列对同一母序列的关联度按大小顺序排列起来,

便组成关联序,记为{X}。它直接反映各个子序列对于母序列的“优劣”关系。若r0a >r0b ,则称{Xa }对于相同母序列{X0}有优于{Xb }的特点,记为{Xa|X0}?{Xb|X0};若

r0a

3

青岛科信软件 决策支持、数据挖掘方法

母序列{X0}劣于{Xb },记为{Xa|X0}?{Xb|X0};若

r0a=r0b,则称{Xa }

对于母序列{Xo }等价于(或等于){Xb },记为{Xa│X0}~{Xb│X0};若有r0a ?r0b,称{Xa }对于母序列{Xo }优于或等于{Xb },记为

{Xa|X0}?{Xb|X0}~;若有r0a ? r0b,则称{Xa }对于母序列{Xo }劣于或

{Xb|X0}等于{Xb },记为{Xa|X0}?。 ~ 根据上述几种关系,可定义两种有代表性的关联序,即“有

序”与“偏序”。若关联序{X}为有序,那么所有元素之间必存在以下几种关系之一:“优于”(?),“劣于” (?),或“等价于”(~)。若关联序{X}为偏序,则不是所有元素都可比较的。

一般而言,各因素只要能构成关系,算出关联度,则总是“有

序”的。只有在无“参考点”或无参考母序列的情况下,才可能出现“偏序”现象。

(5) 列出关联矩阵

若有n个母序列{Y1}, {Y2}, ?, {Yn } (n≠2)及其m个子序列

{X1}, {X2}, ?, {Xm } (m≠1),则各子序列对母序列{Y1}有关联度[r11, r12, ?, r1m ],各子序列对于母序列{Y2}有关联度[r21, r22, ?, r2m ],类似地,各子序列对于母序列{Yn }有关联度[rn1, rn2, ?, rnm ]。

将rij (i=1, 2, ?, n; j=1, 2, ?, m)作适当排列,可得到关联度

矩阵,根据关联度矩阵,不仅可以作为优势分析的基础,而且可作为决策的依据。若关联矩阵R中第i列满足

4

青岛科信软件 决策支持、数据挖掘方法

?r1i??r??2i???????rmi??r1j??r?2j??????????rmj??(?i,j?1,2,?,n,i?j)

则称母序列{Yi }相对于其它母序列为最优,或者说从Y i 对于子序列Xj (j=1, 2, ?, m)的关联度来看,序列{Yi }是系统最优序列,并记为:

?Yi???Yj?(j?12,,?,n;j?i)

若有

1n1nr??ki?rkjnk?1nk?1(i,j?1,2,?,n;j?i)

则称母序列{Yi }相对于其余母序列,或相对于子序列{Xi } (i=1,2,?,m)的关联度是准最优的,并记为:

{Yi}?{Yj}~ (j?{1, 2, ?, n}, j≠i)

若关联矩阵R为下三角矩阵,即:

r1i r21 r31 ┆ rn1

r22 r32 ┆ rn2

r33 ┆ rn3

? rnm

则称[Y1]相对于[Yi] (i?{2 , 3 , ?, n})是最优势的。 21.2灰色预测法

基于灰色建模理论的灰色预测法。

5

青岛科信软件 决策支持、数据挖掘方法

数列预测就是对某一指标的发展变化情况所作的预测,其预测的结果是该指标在未来各个时刻的具体数值。

数列预测的基础,是基于累加生成数列的GM(1,1)模型。 设x(0)(1),x(2),?,x(M)是所要预测的某项指标的原始数据。

(0)

(0)

如果*趋势无规律可循(如图10-2所示),则无法用回归预测法对其进行预测。

x=x(1)

x(2)=x(1)+x(2) x(3)=x(1)+x(2)+x(3)

(1)

(0)

(0)

(0)

(1)

(0)

(0)

(1)

(0)

6

青岛科信软件 决策支持、数据挖掘方法

,其随机性程度大大弱化,平稳程度大大增加(如图10-3所示)。对于这样的新数列,其变化趋势可以近似地用如下微分方程描述:

在(1)式中,a和u可以通过如下最小二乘法拟合得到:

在(2)式中,YM为列向量YM=[x(2),x(3),?,x(M)];B为构造数据矩阵:

(0)

(0)

(0)

T

微分方程(1)式所对应的时间响应函数为:

(3)式就是数列预测的基础公式,由(3)式对一次累加生成数列的预测值

7

青岛科信软件 决策支持、数据挖掘方法

其观测值之间的残差值ε

(0)

(t)和相对误差值q(t)如下:

对于预测公式(3),我们所关心的问题是它的预测精度。这一预测公式是否达到精度要求,可按下述方法进行精度检验。

首先计算:

其次计算:方差比c=s2/s1

一般地,预测公式(3)的精度检验可由表10-2给出。如果p和c都在允

8

青岛科信软件 决策支持、数据挖掘方法

的分析对(3)式进行修正,灰色预测常用的修正方法有残差序列建模法和周斯分析法两种。 21.3灰色局势决策方法

灰色局势决策,是灰色系统理论中一种重要的决策方法之一,它是将事件、对策、效果、目标等决策四要素综合考虑的一种决策分析方法。这种方法的最大特点是它适用于处理数据中含有灰元,即信息不完备的决策问题。在区域开发活动中,许多问题的解决是在信息不完备的情况下作出决策的。因此,灰色局势决策是学研究中常用的决策分析方法之一。 21.3.1灰色局势决策的数学模型

决策,一般都包括如下四个基本要素:

(1)事件,即需要处理的事物; (2)对策,即处理某一事物的措施;

(3)效果,即用某个对策对付某个事件的效果; (4)目标,即用来评价效果的准则。

9

青岛科信软件 决策支持、数据挖掘方法

所谓决策就是指,对于某个(或某些)事件,考虑许多对策去对付,不同对策效果不同,然后用某种(或某几种)目标去衡量,从这些对策中选择一个(或一批)效果最佳者。

灰色局势决策,是一种将事件、对策、效果、目标等决策四要素综合考虑的一种决策分析方法。灰色局势决策的数学模型,实质上是运用有关的数学语言对决策四要素之间的相互关系所作的一种综合性描述。这种描述主要包括如下几个方面的基本内容。

1.决策元、决策向量与决策矩阵

(1)决策元。在灰色局势决策中,事件ai和对策bj的二元组合sij=(ai,bj)称为局势,它表示用第j个对策(bj)去对付第i个事件(ai)的局势。

若局势sij的效果测度为rij,则称

为决策元。它表示用第j个对策(bj)去对付第i个事件(ai)这一局势的效果为rij。

(2)决策向量。若某一类决策问题有n个事件a1,a2,?,an

和m个对策b1,b2,?,bm,且对于每一个事件ai(i=1,2,?,

10

青岛科信软件 决策支持、数据挖掘方法

n)都可以用b1,b2,?,bm等m个对策去对付。那么,对于每一个事件ai(i=1,2,?,n),就存在有m个局势:

(ai,b1),(ai,b2)?,(ai,bm)

这些局势相应的决策元可排成一行,便构成了一个决策行向量:

(1)式中,rij为局势sij=(ai,bj)的效果测度。

同样,对于每一个对策bj(j=1,2,?,m),可以用事件a1,a2,?,an去匹配,其相应的决策元可排成一列,便构成了一个决策列向量:

(3)决策矩阵。将每一个决策行向量δi(i=1,2,?,n)或每一个决策列向量θj(j=1,2,?,m)依次排列起来,便构成了一个n×m的局势决策矩阵:

11

青岛科信软件 决策支持、数据挖掘方法

2.效果测度效果测度就是对于局势所产生的实际效果,在不同目标之间进行比较的量度。

对于时间序列来说,就是比较两个序列在同一时刻的关联系数,其计算公式为:

(4)式中,Δij(t)为两序列在t时刻的绝对差;Δ

min

和Δ

max

分别是两序列绝对差的最小值和最大值;K是在[0,1]区间上取值的灰数。

作为时间序列的效果测度,其被比较的母线,一般应为规划的目标效益曲线。

对于单点效果测度,可分为以下几种情形: (1)上限效果测度,其计算公式为:

12

青岛科信软件 决策支持、数据挖掘方法

(5)式中,uij为局势sij的实际效果;umax为所有局势sij实际效果的最大值。由于uij≤umax,所以效果测度rij≤1。

(2)下限效果测度,其计算公式为:

(6)式中,uij的意义同(5)式,umin为所有uij中的最小者。由于uij≥umin,显然rij≤1。

(3)适中效果测度,其计算公式为:

(7)式中,uij的意义同(5)式,u0是一个指定的适中值。由(7)式容易知道,rij≤1。

如果u0是以几何中心为参考点的数值,则适中效果测度的计算公式为:

在实际应用中,究竟采用哪种效果测度,应依据目标的性质而定。如产值、效益之类应该是越大越好,可采用上限效果测度;如投资、灾害之类应该是越小越好,可采用下限效果测度;而对于降水量、施肥量等应以适量为宜,可采用适中效果测度。

13

青岛科信软件 决策支持、数据挖掘方法

此外,对于局势sij有效益时间序列,则需求稳态效果测度。即对时间序列{uij(t)}建立GM(1,1)模型,解得灰色参数a=[a,u]。当以u为输入时,则稳态增益为:

T

3.多目标综合决策矩阵当有l个决策目标时,记局势sij在第p个目标

如果第p个决策目标的权重值为ap(p=1,2,?,l),则对于局势sij,可以得到如下的综合效果测度:

14

青岛科信软件 决策支持、数据挖掘方法

这样,我们就得到如下的多目标综合决策矩阵:

4.决策原则决策就是选择效果最佳的局势。这种选择可以有两种方式:

(1)由事件选择最好的对策,即行决策; (2)由对策匹配最适宜的事件,即列决策。

选取效果测度最大的决策元,即:

15

本文来源:https://www.bwwdw.com/article/9il6.html

Top