粗糙集理论RS

更新时间:2024-05-22 07:52:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

RS理论

一、定义:

粗糙集理论,是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。它是当前国际上人工智能理论及其应用领域中的研究热点之一。

在自然科学、社会科学和工程技术的很多领域中,都不同程度地涉及到对不确定因素和对不完备(imperfect) 信息的处理。从实际系统中采集到的数据常常包含着噪声,不够精确甚至不完整,对这些信息进行合适地处理,常常有助于相关实际系统问题的解决。 二、对比的理论:

模糊集和基于概率方法的证据理论是处理不确定信息的两种方法,已应用于一些实际领域。但这些方法有时需要一些数据的附加信息或先验知识,如模糊隶属函数、基本概率指派函数和有关统计概率分布等,而这些信息有时并不容易得到。

概率与统计、证据理论:理论上还难以令人信服,不能处理模糊和不完整的数据。 模糊集合理论:能处理模糊类数据,但要提供隶属函数(先验知识)。

RS理论与其他处理不确定和不精确问题理论的最显著的区别是:它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理可以说是比较客观的。

由于这个理论未能包含处理不精确或不确定原始数据的机制,所以这个理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。 三、不足: 粗糙集理论还处在继续发展之中,尚有一些理论上的问题需要解决,诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,粗糙集理论与非标准分析(Nonstandard analysis) 和非参数化统计(Nonparametric statistics)等之间的关系等。 四、由来: 1982年波兰学者Z. Paw lak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确,不一致(inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。 五、特点:

(1) 它能处理各种数据,包括不完整(incomplete) 的数据以及拥有众多变量的数据; (2) 它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和非确定性的情况; (3) 它能求得知识的最小表达(reduct) 和知识的各种不同颗粒(granularity) 层次; (4) 它能从数据中揭示出概念简单,易于操作的模式(pattern) ;

(5) 它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则的自动生成. 在粗糙集理论中,“知识”被认为是一种分类能力。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。它的一个重要特点是具有很强的数据定性分析能力,可直接对不完整性和不确定性的数据进行分析处理,提取有用属性,简化知识表达式。 六、前景 将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等)相综合,发挥出各自的优点,可望设计出具有较高的机器智商(MIQ) 的混合智能系统(Hybrid Intelligent System),这是一个值得努力的方向。

软计算(sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具包括粗糙集,模糊逻辑(FL),神经网络(NN),概率推理(PR),信度网络(Belief Networks),遗 传算法(GA) 与其它进化优化算法,混沌(Chaos) 理论等. 传统的计算方法即所谓的硬

计算(hard computing),使用精确,固定和不变的算法来表达和解决问题. 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易于处理,鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调. 七、应用:

粗糙集理论是一门实用性很强的学科,从诞生到现在虽然只有十几年的时间,但已经在不少领域取得了丰硕的成果,如近似推理,数字逻辑分析和化简,建立预测模型,决策支持,控制算法获取,机器学习算法和模式识别等。目前已被成功运用到语言识别、医疗数据分析、机械故障诊断等领域。

下面介绍一下粗糙集应用的几个主要领域: (1)人工神经网络训练样本集化简

人工神经网络具有并行处理,高度容错和泛化能力强的特点,适合应用在预测,复杂对象建模和控制等场合. 但是当神经网络规模较大,样本较多时,训练时间过于漫长,这个固有缺点是制约神经网络进一步实用化的一个主要因素. 虽然各种提高训练速度的算法不断出现,问题远未彻底解决. 化简训练样本集,消除冗余数据是另一条提高训练速度的途径. 文[ 10 ]正是沿着这条思路,应用粗糙集化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余(superfluous) 的数据. 仿真实验表明训练速度提高了4. 77 倍,获得了较好的效果。 (2)控制算法获取

实际系统中有很多复杂对象难于建立严格的数学模型,这样传统的基于数学模型的控制方法就难以奏效. 模糊控制模拟人的模糊推理和决策过程,将操作人员的控制经验总结为一系列语言控制规则,具有鲁棒性和简单性的特点,在工业控制等领域发展较快. 但是有些复杂对象的控制规则难以人工提取,这样就在一定程度上限制了模糊控制的应用。

粗糙集能够自动抽取控制规则的特点为解决这一难题提供了新的手段. 一种新的控制策略—模糊- 粗糙控制(fuzzy-rough control) 正悄然兴起,成为一个有吸引力的发展方向. 应用粗糙集进行控制的基本思路是: 把控制过程的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,然后利用粗糙集理论处理这些数据,分析操作人员在何种条件下采取何种控制策略,总结出一系列控制规则:

规则1 IF Condit ion 1 满足 THEN 采取decision 1 规则2 IF Condit ion 2 满足 THEN 采取decision 2 规则3 IF Condit ion 3 满足 THEN 采取decision 3 (3)决策支持系统

面对大量的信息以及各种不确定因素,要作出科学,合理的决策是非常困难的.决策支持系统是一组协助制定决策的工具,其重要特征就是能够执行IF THEN 规则进行判断分析. 粗糙集理论可以在分析以往大量经验数据的基础上找到这些规则,基于粗糙集的决策支持系统在这方面弥补了常规决策方法的不足,允许决策对象中存在一些不太明确,不太完整的属性,并经过推理得出基本上肯定的结论. 八、运用粗糙集前处理:

1. d维样本属性的获取

(1)小波变换——处理非平稳信号——振动波形频域功率谱中能够区分不同故障的3个频带中的峭度指标、裕度指标、脉冲指标作为频域特征参数。同时利用小波包将信号分解到第3层,取能够表征故障特征的两个子空间「3,l」,「3,2」(记作C[3,l],C「3,2〕)中能量的

平均值作为时一频域特征参数。

(2)当样本属性明显直接获得d维样本属性 HC CO2 O2 NOX CO NO2 2. 样本集的量化(离散化)

粗糙集只能对离散的具有语义性的符号化属性值进行分析处理,因此在应用粗糙集对故障诊断决策系统进行约简处理以及提取规则之前,需要对故障诊断中的连续值型属性进行离散处理。离散化连续值型属性就是将有无穷个取值的连续值型属性转化为有穷个取值的离散值型属性。连续属性的离散化,可以由领域专家根据经验给出相应的区间,也可以由系统根据某种原则自动地对输人空间进行划分。

一般来讲,连续数据的离散化应尽可能满足以下两点: (l)连续属性离散化后的空间维数应尽可能的小; (2)连续属性值离散化处理后丢失的信息应尽量小。

目前已经提出了多种连续属性值离散化方法:等距离法、等频率法、最大嫡法、L方法、W方法、P方法等等。

九、基于RS理论的知识约简和重要性分析(详细算法见基于粗糙集理论的算法研究) (1)知识表达系统

运用RS理论能较好地分析废气成分含量和发动机工作性能状态之间的关系,在RS理论中这种关系可表述成信息系统T=(U,A,C,D),即知识表达系统,其中C={HC,CO2,NOx,CO,O2},称为信息系统的条件属性集;D={f},是决策属性集;A=C∪D。

(2)知识性约简和重要性分析

基于粗糙集理论的知识发现,主要是通过在保持决策表决策属性和条件属性之间的依赖关系不发生变化的前提下对决策表进行约简来实现的。

本文来源:https://www.bwwdw.com/article/env7.html

Top