人工智能第四章不确定推理方法山东大学期末考试知识点复习

更新时间:2023-11-04 01:04:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

山东大学 期末考试知识点复习

第四章 不确定推理方法

在日常生活中,人们通常所遇到的情况是信息不够完善、不够精确,所掌握的知识具有不确定性。为了解决这些问题,必须对不确定知识的表示、推理过程等进行研究。有关不确定性知识的表示及推理方法目前有很多种,但比较重要且比较著名的方法主要有可信度方法、主观Bayes方法和证据理论方法。 1.1 不确定推理概述 (1)不确定推理的概念

不确定推理是从具有不确定性的初始事实(证据)出发,运用不确定性知识(或规则)库中的知识,推出具有一定程度的不确定性、但却是合理的或近乎合理的结论的思维过程。

(2)不确定推理中的基本问题

在不确定推理中,知识和证据都具有某种程度的不确定性,这就使推理机的设计和实现的复杂度和难度增大。它除了必须解决推理方向、推理方法以及控制策略等问题外,一般还要解决证据及知识的不确定性的度量及表示问题、不确定性知识(或规则)的匹配问题、不确定性传递算法以及多条证据同时支持结论的情况下不确定性的更新或合成问题。 (3)推理模型

推理模型就是指根据初始事实(证据)的不确定性和知识的不确定性,推导和计算结论不确定性的方法和过程。不同的推理模型其不确定性的传递计算方法是不同的。目前常用的有可信度方法、主观Bayes方法、证据理论以及模糊推理。 (4)构建推理模型的思路

具有不确定性的知识(规则)如何表示?不确定性的证据如何表示?如何进行推理计算,即如何将证据的不确定性和知识的不确定性传递到结论? 1.2 可信度方法

山东大学 期末考试知识点复习

可信度方法是美国斯坦福大学E.H.Shortlifie等人在确定性理论(Theory of Confirmation)的基础上,结合概率论等提出的一种不确定性推理方法。1976年在专家系统MYCIN中首先应用。可信度是指人们在实际生活中根据自己的经验或观察对某一事件或现象为真的相信程度。知识的不确定性以可信度表示。 1.知识不确定性的表示

在基于可信度的不确定性推理模型中,知识是以产生式规则的形式表示的。其一般形式为

IF E THEN H (CF(H,E))

其中:CF(H,E)是该条知识的可信度,称为可信度因子(Certainty Factor)或规则强度。

在专家系统MYCIN中,CF(H,E)被定义为 CF(H,E)=MB(H,E)-MD(H,E)

这里,啪(Measure Belief)称为信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真的信任增长度。当MB(H,E)>0时,有P(H/E)>P(H)。这里,P(H)表示H的先验概率;P(H/E)表示在前提条件E所对应的证据出现的情况下,结论H的条件概率。MD(Measure Disbelief)称为不信任增长度,它表示因与前提条件E匹配的证据的出现,对结论H为真的不信任增长度,当MD(H,E)>0时,有P(H/E)0时,MD(H,E)=0。

当MD(H,E)>0时,MB(H,E)=0。 MB和MD的值域为[0,1]。

根据CF(H,E)的定义及MB(H,E)与MD(H,E)的互斥性,可得到CF(H,E)

山东大学 期末考试知识点复习

的计算公式:

其中,P(H/E)=P(H)表示E所对应的证据与H无关。CF(H,E)的取值范围是[-1,1]。

2.证据不确定性的表示

如果支持结论的证据只有一条,则证据可信度值的确定分两种情况:第一种情况是,证据为初始证据,其可信度的值一般由提供证据的用户直接指定,指定的方法也是用可信度因子对证据不确定性进行表示,例如CF(E)=0.8表示证据E的可信度为0.8。第二种情况就是用先前推出的结论作为当前推理的证据,对于这种情况的证据,其可信度的值在推出该结论时通过不确定性传递算法计算得到(传递算法将在下面讨论)。证据E的可信度CF(E)也是在[-1,1]上取值。 如果支持结论的证据有多个,当多个证据间的关系是合取时,即E=E1∧E2∧E3∧?∧En,则CF(E)=min{CF(E1),CF(E2),?,CF(En)};当多个证据间的关系是析取时,即E=E1∨E2∨E3∨?∨En,则CF(E)=max{CF(E1),CF(E2),?,CF(En)}。

3.不确定性的推理计算

不确定性的推理计算是从不确定的初始证据出发,通过运用相关的不确定性知识,最终推出结论并求出结论的可信度值。

(1)只有单条知识支持结论时,结论可信度的计算方法

如果支持结论的知识只有一条,且已知证据E的可信度CF(E)和规则(知识)(IF E THEN H)的可信度为CF(H,E),则结论H的可信度计算公式如下: CF(H)=CF(H,E)×max{0,CF(E)} (4.2)

若CF(E)<0,即相应证据以某种程度为假,则CF(H)=0,说明在该模型中没

山东大学 期末考试知识点复习

有考虑证据为假时对结论H所产生的影响。当证据为真,即CF(E)=1时,有CF(H)=CF(H,E),说明当证据E为真时,结论H的可信度即为规则的可信度CF(H,E)。

(2)多条知识支持同一结论时,结论不确定性的合成计算方法

若由多条不同知识推出了相同的结论,但可信度不同,则可用合成算法求出结论的综合可信度。由于对多条知识的综合可通过两两的合成实现,所以下面只考虑两条知识的情况。 设有如下两条知识:

lF E1 THEN H (CF(H,E1))

IF E2 THEN H (CF(H,E2))

则结论H的综合可信度,可先分别应用上述方法计算出CF1(H)和CF2(H),再应用以下公式求出E1与E2对H的综合影响所形成的可信度CF1,2(H):

这实际上是著名的专家系统MYCIN中所使用的结论不确定性计算公式。 (3)在已知结论原始可信度的情况下,结论可信度的更新计算方法 前面式(4.2)、式(4.3)两个公式都是假设在对结论的初始可信度不知或为0的前提下计算结论H的可信度的方法。在某些情况下,如果已知证据E对结论H有影响,且知识IF E THEN H的可信度为CF(H,E),同时结论H原来的可信度为CF(H),那么如何求在证据E下结论H可信度的更新值CF(H/E)呢?即已知规则IF E THEN H (CF(H,E))及CF(H),求CF(H/E)。 这时分三种情况进行讨论: ①CF(E)=1时,即证据肯定出现时,

山东大学 期末考试知识点复习

②当0<CF(E)<1时,

③当CF(E)≤0时,规则IF E THEN H不可使用,对结论H的可信度无影响。实际上,在MYCIN系统中就规定,当CF(E)≤0.2时,规则IF E THEN H不可使用。

1.3 主观Bayes方法

主观Bayes方法又称主观概率论,是由R.O.Duda等人于1976年提出的一种不确定推理模型,它是对概率论中基本Bayes公式的改进,是一种基于概率逻辑的方法。该方法在地矿勘探专家系统PROSPECTOR中得到了成功的应用。 1.知识不确定性的表示

在主观Bayes方法中,知识(规则)的不确定性是以一个数值对(LS,LN)来进行描述的。若以产生式规则的形式表示,则具体为 IF E THEN (LS,LN) H (P(H)) 其中,

(1)(LS,LN)是为度量产生式规则的不确定性而引入的一组数值,LS表示规则成立的充分性,用于指出证据E对结论H为真的支持程度;而LN则表示规则成立的必要性,用于指出证据E对结论H为真的必要性程度。它们的定义如下:

山东大学 期末考试知识点复习

LS和LN的取值范围为[0,+∞)。它们的具体取值由领域专家根据实际经验给出。 (2)E是该条知识的前提条件。它既可以是一个简单条件,也可以是用AND或OR把多个简单条件连接起来的复合条件。

(3)H是结论。P(H)是H的先验概率,它指出在没有任何专门证据的情况下结论H为真的概率。P(H)的值由领域专家根据以往的实践及经验给出。 2.证据不确定性的表示

(1)单个证据不确定性的表示方法

对于初始证据E,其先验概率为P(E),也可以由用户根据观察S给出它的后验概率P(E/S)。但由于后验概率P(E/S)的给出比较困难,因而在PROSPECTOR系统中引进了可信度C(E/S)的概念。给了C(E/S)就相当于给了证据的概率P(E/S)。

这样,用户只要对初始证据给出相应的可信度C(E/S),就可由系统将它转换为相应的P(E/S)。

(2)组合证据不确定性的确定方法

当证据E是由多个单一证据的合取组合而成时,则 P(E/S)=min{P(E1/S),P(E2/S),?,P(En/S)} 当证据E是由多个单一证据的析取组合而成时,则 P(E/S)=max{P(E1/S),P(E2/S),?,P(En/S)} 对于“非”运算,用下式计算:

P(~E/S)=1-P(E/S)

山东大学 期末考试知识点复习

3.不确定性的推理计算

主观Bayes方法推理计算的任务是根据证据E的概率P(E)及影响结论的知识之规则强度(LS,LN),把H的先验概率P(H)更新为后验概率P(H/E)或P(H/~E)。

下面就确定性证据和不确定性证据两种情况分别讨论结论H后验概率的推理计算方法。 (1)确定性证据

确定性证据是指证据的出现与否是肯定的,

①证据E肯定出现时,P(E)=P(E/S)=1,可根据LS和P(H)求出P(H/E)。

②证据E肯定不出现时,P(E)=P(E/S)=0,P(~E)=1,可根据LS和P(H)求出P(H/~E)。

(2)不确定性证据

在现实中,出现确定性证据的情况是不多的,更多的是介于肯定出现和肯定不出现两者之间的不确定情况。对于不确定证据E,0<P(E)<1,问题可转化为:在观察S之下,证据E的概率P(E/S),再根据P(H)和P(E/S)确定H的后验概率P(H/S)。在这种情况下,可使用R.O.Duda等人于1976年证明的公式进行后验概率的计算,包括EH公式和CP公式。

EH公式:

山东大学 期末考试知识点复习

CP公式:

这里,C(E/S)为用户对初始证据给出的可信度。 4.结论不确定性的合成算法

若有n条知识都支持相同的结论,而且每条知识的前提条件所对应的证据Ei(i=1,2,?,,n)都有相应的观察Si与之对应,此时只要先对每条知识分别求出O(H/Si),然后就可运用下述公式求出O(H/S1,S2,?,Sn)和P(H/S1,S2,?,Sn):

这里O(x)是几率函数,它与概率函数P(x)的关系为:

1.4 证据理论 1.证据理论的数学基础

证据理论又称D—S理论,在该理论中,知识是用产生式的形式表示的,而证据和结论则是以集合的形式表示。知识的不确定性通过一个集合形式的“可信度因子”来表示,而证据和结论的不确定性度量则采用信任函数和似然函数来表示。为此引入了概率分配函数、信任函数和似然函数的概念。

概率分配函数的作用是把样本空间D上的任意一个子集A(∈2D)都映射为[0,1]上的一个数M(A)。当A(∈2D)对应一个命题时,M(A)即是对相应命题不确定性的度量。如果定义函数M(x)为集合2D到区间[0,1]上的一个映射函数,其满足下列条件:

山东大学 期末考试知识点复习

则称M(x)为2 D上的概率分配函数。M(A)称为命题A的基本概率数。

信任函数是用来对命题A的不确定性进行度量的。如果定义函数Bel(x)为将集合2 D映射到区间[0,1]上的一个函数,即0≤Bel(A)≤1,并且满足下列条件:

则称Bel(x)为信任函数,或称下限函数。

似然函数也是一个从集合2D到区间[0,1]的映射函数,也将其称为上限函数。设有函数Pl(x)是从集合2到区间[0,1]的映射函数,且

则称Pl(x)为似然函数。

显然,A不为假,并不代表A一定为真,也就是说对A不为假的信任程度应该大于对A为真的信任程度,即有: Pl(A)≥Bel(A)

那么,Pl(A)-Bel(A)就是对A既不为假、又不为真的信任程度。或者说表示了既不信任A也不信任~A的一种度量。这种既不为假,又不为真的情况,就是我们前面所说的“不知道”的情况。证据理论就能处理这种“不知道”引起的不确定性。

命题的不确定性需要用信任函数和似然函数来度量,而信任函数和似然函数的定义又依赖于概率分配函数,所以概率分配函数是对一个命题的不确定性度量的基础。然而在有的情况下,对同样的证据,由于数据的来源不同,会得到两个不同的概率分配函数。为了计算信任函数和似然函数,就必须将两个概率分配函数合并成一个概率分配函数。组合的方法就是求概率分配函数的正交和。 2.特定概率分配函数

D

山东大学 期末考试知识点复习

推理模型是建立在概率分配函数的基础之上的,所选取的概率分配函数之复杂性,直接影响着推理模型的复杂性,进而影响着不确定性计算的复杂性。这里给出一个具体的概率分配函数,并作了一些约束限制,以便简化不确定性的推理模型。

设样本空间D={S1,S2,?,Sn),领域内的命题都用D的子集表示,则定义2D上的概率分配函数M(x)满足如下条件:

其中,|A|表示命题A对应的集合中所包含的元素的个数。

在这一特定的概率分配函数中,定义了只有单个元素构成的子集和样本空间D本身的基本概率数才有可能大于0,其他子集的基本概率数均为0。 3.基于特定概率分配函数的不确定性推理模型

在证据理论中,信任函数Bel(A)和似然函数Pl(A)分别表示对命题A的信任程度的下限和上限。所以,证据及结论的不确定性以及不确定性知识的规则强度,都可以由区间(Bel(A),Pl(A))内的某个数值来进行度量。为了推理计算的方便,可以利用Bel(A)和Pl(A)来构造一个函数,并以它来度量命题的不确定性,该函数的值应落在区间(Bel(A),Pl(A))内。由于Bel(A)是下限,所以该函数可以定义如下:

其中,|A|和|D|分别表示A和D中元素的个数。由于该函数是由信任函数构造而来的,故把它称为信任度函数。

本文来源:https://www.bwwdw.com/article/hkw2.html

Top