粗糙集理论及其应用发展综述
更新时间:2023-08-12 08:02:01 阅读量: 外语学习 文档下载
- 粗糙集理论、算法与应用推荐度:
- 相关推荐
模糊粗糙集理论
第21卷第6期
Vol.21 No.6重庆工商大学学报(自然科学版)JChongqingTechnolBusinessUniv.(NatSciEd)2004年12月Dec.2004 文章编号:1672-058X(2004)05-0575-05
粗糙集理论及其应用发展综述
代春艳1,2
(1.重庆工商大学计算机科学与信息工程学院,重庆400067;2重庆大学经济与工商管理学院,重庆400044)
摘 要:介绍了粗糙集理论的基本概念、研究对象,,并
对它和模糊集、证据理论等相关理论,领域的关系进行了阐述。
关键词:粗糙集;不确定性;;中图分类号:TP粗糙集(RoughZ.Pawlak在1982年提出的,该理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1]。1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用。国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家。目前,粗糙集这一新的数学理论已经成为信息科学领域的研究热点之一,它在机器学习、知识获取、决策分析、过程控制等许多领域得到了广泛的应用。
1 粗糙集理论的基本概念
1.1 知识的含义
粗糙集理论建立在分类机制的基础上,并将等价关系对空间的划分与知识等同。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。在粗糙集理论中“,知识”被认为是一种分类能力,也就是将知识理解为对数据的划分。用集合的概念表示就是使用等价关系集R对离散表示的空间U进行划分,知识就是R对U划分的结果。由此,在U和R的意义
(1)下,知识库可以定义为:属于R中的所有可能的关系对U的划分,记为K=(U,R)
这样给定一组数据U与等价关系集R,在R下对U的划分,称为知识,记为U/R。如果一个等价关系集对数据的划分存在矛盾,则将导致不确定划分,可用粗糙度来度量。
1.2 集合的上近似和下近似
粗糙集理论的不确定性是建立在上、下近似的概念之上的。令XΑU是一个集合,R是一个定义在U上的等价关系,则:
(2)R-(X)=∪{Yi∈U/R∶Yi∈X}
-Φ}R(X)=∪{Yi∈U/R∶Yi∩X≠(3)
分别称为X的R下近似集(Lowerapproximation)和R上近似集(Upperapproximation)。集合X的边界区(Boundaryregion)定义为:
(4)bnR(X)=R-(X)-R-(X)
bnR(X)为集合X的上近似集与下近似集之差。如果bnR(X)是空集,则称X关于R是清晰的;反收稿日期:2004-04-27;修回日期:2004-06-15。
作者简介:代春艳(1975-),女,重庆人,讲师,主要从事项目管理与投资决策、电子商务研究。
模糊粗糙集理论
576重庆工商大学学报 (自然科学版) 第21卷之则称集合X为关于R的粗糙集。
在粗糙集理论中,也把posR(X)=R-(X)
称为X的R正域,把negR(X)=U-R-(X)
称为X的R负域。为清楚起见,用图1来描述一
个二维近似空间中集合X的上近似、下近似以及
边界的概念。这个空间由划分的基本区域的方形
块构成的(U,R)定义。
由划分的基本区域的方形块构成的(U,R)
定义,每一个基本区域代表R的一个等价类。下
近似、上近似以及边界区等概念称为可分辨区
(discernbilityregions),刻画了一个边界含糊
(vague)集合的逼近特性。定义粗糙度为:
(5dR(X)=|R-(X)|/|R-(X)|
式(5)中,|#|,图1 粗糙集概念图
X对等价关系集RR下近似集合成员个数与R上近似集合成员个数的比值来量度。显然0≤dR(X)≤1,dR(X)=1,则称集合X相对于R是清晰的,如果dR(X)<1,则称集合X相对于R是粗糙的。
2 粗糙集理论的应用
2.1 粗糙集理论的研究对象
Roughsets的研究对象是由一个多值属性(特征、症状、特性等)集合描述的一个对象(观察、病历等)集合,对于每个对象及其属性都有一个值作为其描述符号,对象、属性和描述符是表达决策问题的3个基本要素。这种表达形式也可以看成一个二维表格,表格的行与对象相对应,列对应于对象的属性;各行包含了表示相应对象信息的描述符,还有关于各个对象的类别成员的信息。通常,关于对象的可得到的信息不一定足以划分其成员类别。换句话说,这种不精确性导致了对象的不可分辨性。给定对象间的一个等价关系,即导致由等价关系构成的近似空间的不分明关系,Roughsets就用不分明对象类形成的上近似和下近似来描述。这些近似分别对应了确定属于给定类的最大的对象集合和可能属于给定类的最小的对象集合。下近似和上近似的差是一个边界集合,它包含了所有不能确切判定是否属于给定类的对象。这种处理可以定义近似的精度和质量。Roughsets方法可以解决重要的分类问题,所有冗余对象和属性的约简包含属性的最小子集,能够很好地近似分类,得到可以接受质量的分类。而且,它还可以用决策规则集合的形式表示最重要属性和特定分类之间的所有重要关系。
2.2 粗糙集理论应用的情况
Roughsets的生命力在于它具有较强的实用性,从诞生到现在虽然只有20a,但已经在许多领域取得了令人鼓舞的成果。
(1)粗糙集应用于智能控制。粗糙集根据观测数据获得控制策略的方法称为从范例中学习(learningfromexamples),属于智能控制的范畴。基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则。形式为:IFCondition=N满足THEN采取Decision=M。粗糙集方法是一类符号化分析方法,需要将连续的控制变量离散化,为此PawlakZ[2]提出了粗糙函数(roughfunction)的概念,为粗糙控制打下了理论基础。
(2)粗糙集应用于神经专家系统。在专家系统中,知识获取是一个非常关键的阶段,定义又很困难。由苏丹卡同大学、马来西亚大学和普恰大学的M.E.Yahia、R.Mahmod[3]等研制的粗糙神经专家系统中提出将神经网络作为专家知识库。而运用粗糙集作为数学工具来处理不确定与不精确数据,将两者结合形
模糊粗糙集理论
第6期 代春艳:粗糙集理论及其应用发展综述577成称之为粗糙神经专家系统的混合结构。前者作为结构中神经网络的预处理器,为预处理粗糙引擎,而将后者加入该结构形成粗糙神经推理引擎的推理引擎新结构,随之设计为一种新知识库结构,其结构基于神经网络与粗糙分析约简的结合上。该系统应用于医学诊断,并通过肝炎病例的检测。
(3)粗糙集应用于决策分析。在决策分析方面,粗糙集理论的决策规则是在分析以往经验数据的基础上得到的,它允许决策对象存在一些不太明确的属性。希腊发展银行ETEVA应用粗糙集理论协助制订信贷政策,是粗糙集理论多准则决策方法的一个成功范例。另外,由意大利卡塔亚大学学者SalvatoreGre2co和波兰波兹纳特大学的RomanSlowinshi[4]提出可以将粗糙集应用于多标准决策分析。
(4)粗糙集和模糊集在词汇挖掘中的应用。美国LowaUniversity和LouisianaStateUniversity的PadminiSrinivasan、MiguelE.Ruiz[5]等人指出,。通常用户的查询对检索主题并不是优化的,词汇挖掘允许概括、,以提高查询性能。该文研究了一种新的词汇挖掘机制,文本查询既可以使用权重即模糊表示,,还解决了多词汇视图的问题。。该机制支持语义(5)G和Ziarko[6]应用粗糙集理论分析了10a股票的历史数据,研,获得的预测规则得到了华尔街证券交易专家的认可。
(6)。在医疗诊断方面,用粗糙集方法根据以往病例归纳出诊断规则,用来指导新的病例。人工预测早产准确率只有17%~38%,应用粗糙集理论可提高到68%~90%[7]。
RS理论的应用领域还包括:地震预报、冲突分析、近似推理、软件工程数据分析、图像处理、材料科学中的晶体结构分析、预测建模、结构建模、投票分析、电力系统等。
2.3 国际上有关粗糙集的软件研制概况
目前,国际上研究粗糙集的机构和个人开发了一些应用粗糙集的实用化软件,也出现了商业化的软件。加拿大ReductSystemInc.公司开发的用于数据库知识发现的软件DataLogicR是用C语言开发的,可安装在个人计算机上,为科研领域和工业界服务。
美国肯萨斯大学开发了一套基于粗糙集的经验学习系统,名为LERS(LearningfromExamplesbasedonRoughSets),它能从大量经验数据中抽取出规则。LERS已被美国国家航空航天管理局(NASA)的约翰逊(Johnson)空间中心采用,作为专家系统开发工具,为(Freedom)空间站上的医疗决策服务。美“自由号”
国环境保护署(USEnvironmentalProtectionAgency)资助的一个项目中也采用了LERS。波兰波兹南工业大学(PoznanUniversityofTechnology)开发的软件RoughDAS和1995-2004TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.RoughClass,也在不少实际领域中得到应用。加拿大Regina大学开发的KDD-R是用C编写的,在UNIX环境下运行,KDD2R基于变精度粗糙集模型(VariablePrecisionRoughSet,VPRS),通过改变粗糙程度而使数据中隐含的模式更清楚的显示出来。
3 粗糙集与其相关理论和领域的关系
鉴于粗糙集发展过程的历史渊源和交叉前沿学科的特点,有必要对粗糙集理论和其他相关理论和相关领域的关系加以阐述。
3.1 粗糙集与模糊集、证据理论的关系
粗糙集与模糊集都能处理不完备(imperfect)数据,但方法不同,模糊集注重描述信息的含糊(vague2ness)程度,粗糙集则强调数据的不可辨别(indiscernibility)、不精确(imprecision)和模棱两可(ambiguity)。使用图像处理中的语言来做比喻,当论述图像的清晰程度时,粗糙集强调组成图像像素的大小,而模糊集则强调像素存在不同的灰度。粗糙集研究的是不同类中的对象组成的集合之间的关系,重在分类;模糊集研究的是属于同一类的不同对象的隶属的关系,重在隶属的程度。因此粗糙集和模糊集是两种不同的理论,但又不是相互对立的,它们在处理不完善数据方面可以互为补充。
模糊粗糙集理论
578重庆工商大学学报 (自然科学版) 第21卷粗糙集理论与证据理论虽有一些相互交叠的地方,但本质不同,粗糙集使用集合的上、下逼近而证据理论使用信任函数(belieffunction)作为主要工具。粗糙集对给定数据的计算是客观的,无须知道关于数据的任何先验知识(如概率分布等),而证据理论则需要假定的似然值(plausibility)。
将粗糙集与模糊集结合,可以弥补粗糙集理论在描述属性集合中的不足,又易于对系统的描述特征进行优选,两者的有机结合可以构成粗糙集—模糊集智能信息处理系统。该系统利用粗糙集和模糊集在处理不完善、不准确性知识中的优势,大大降低了处理信息的维数和计算特征值的工作量,也降低了系统的复杂程度。
3.2 粗糙集与神经网络、知识工程、遗传算法、自动控制的关系
神经网络在自组织自学习自适应处理中的能力给人们留下了比较深刻的印象,其自身的学习能力(特别是在自动知识获取方面)也急需提高和改善(递归神经网络和RBF网)为例,后者的训练过程又不能过于依赖及函数形式,,。由于RBF,。
]和创造性思维等令人注目。关于人工智能(主要)[9,10],同时知识工程的进展还是比较大。例如曾进行[11]国际上对智能系统的问题求解技术历来是重视的,现已深化到非线性动力[12],对此采用的关键技术应该是被称为“数据采矿”的创造性知识发现系统,而这正是粗糙集理论的针对性所在。
如前所述,粗糙集的推理过程是必须有一定的机制来实现的。在现有的各种算法中,反映自适应演化的遗传算法是一种好的形式,在这方面人们也已经取得了某些成果,例如著名的LERS系统就采用了遗传算法的BBA(Buckerbrigadealgorithm)过程,实践证明遗传算法是可以与粗糙集的推理过程相结合的。
历经半个多世纪的努力,自动控制已经发展成相当丰富的科学体系,但是复杂系统对象仍然是一个难点,例如,在计算机控制系统中,由于离散采样、反馈延迟、动态系统优化等原因就会引发混沌,其中包括著名的Henon映射形式,而鲁棒控制要求系统应具有“混沌控制”能力[13],这样非线性动力系统(混沌)的辨识,就是鲁棒性混沌控制器的基本和重要的一项工作。从历史的逻辑角度看,粗糙集会对设计鲁棒非线性控制和开发系统提供功能更强的理论手段。
粗糙集理论与神经网络、知识工程遗传算法、自动控制之间具有交叉关系,其中知识工程和粗糙集理论均以知识处理作为共同的对象,两种技术在应用场合可起到相辅相成的作用;遗传算法属于粗糙集构造中可使用的一种工具与某些神经网络具有一定的语义联系;自动控制已成为粗糙集理论的一个重要的应用场所。
4 结束语
虽然RS至今只有20a的发展历史,但取得的研究成果是令人瞩目的。它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段。相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用。
参考文献:
[1]PAWLAKZ.Roughsets[J].CommunicationsofACM,1995,38(11):89-95
[2]PAWLAKZ.Vaguenessanduncertainty-aroughsetperspective[J].ComputationalIntelligence,1995,11(2):227-232
[3]YAHIAM,MAHMODRR,SULAIMANNN.Roughneuralexpertsystems[J].ExpertsystemwithApplications,2002,18:87-99
[4]ALVATOREG,BENTTOM,ROMANS.Roughsettheoryformulticriteriadecisionanalysis[J].EuropeanJournalofOperational
Research,2001,129:1-47
[5]PADMINIS,DONALDH.Vocabularyminingforinformationretrieval:roughsetsandfuzzysets[J].InformationProcessingandMan2agement,2002(37):15-38
模糊粗糙集理论
第6期 代春艳:粗糙集理论及其应用发展综述579
[6]GOLANR,ZIARKOW.Methodologyforstockmarketanalysisutilizingroughsettheory[J].Proc.ofIEEE/IAFEConferenceon
ComputationalIntelligenceforFinancialEngineering,NewJersey,1995,22:32-40
[7]TSUMOTOS.Automateddiscoveryofmedicalexpertsystemrulesfromclinicaldatabasesbasedonroughset[J].Proc.ofSecondInter2
nationalConf.onKnowledgediscoveryanddataMining,USA.1996,32:63-72
[8]ERBERTA.ScientificDiscoveryandSimplicityofMethod[J].ArtificialIntelligence,1997,91(2):177-181
[9]STIEFKIM,SMOLIARS.WhatComputersStillCan’tDo:fivereviewsandaresponse[J].ArtificialIntelligence,1996,81(1):95
-97
[10]ROGERP.TheEmperor’sNewMind:ConcerningComputer’sMindsandTheLawsofPhysics[J].OxfordUniversityPress,1989
(1):65-70
[11]DONNAC.ArtificialInteragencyResearchinJapan[J].ArtificialIntelligence,1997,91(1):122-129
[12]王珏,苗夺谦,周育键.关于RoughSet理论与应用的综述[J].-344
[13]陈关荣.控制非线性动力系统的混沌现象[J].控制理论与应用,14(1:1-[14]赵卫东,李旗号.粗集在数据开采中的应用[J].(4[15]赵卫东,陈国华.粗集与神经网络的集成技术研究,24(10):103-107
[16]胡丹,莫智文.(自然科学版),2002,25(1):36-38
[17]黄金杰,李士勇,.[J].计算机工程与应用,2003(9):84-87
onroughsettheoryanditsapplication
DAIChun-yan1,2
(1.CollegeofComputerScienceandInformationEngineering,ChongqingTechnology
andBusinessUniversity,Chongqing400067,China;
2.CollegeofEconomyBusinessAdministration,ChongqingUniversity,Chongqing400044,China)
Abstract:Thepaperintroducesthebasicconceptsofroughsetsanditsresearchobjects.Asurveyonitsappli2cationandrelationshipwithotherfieldssuchasvague-sets,neuralnetwork,knowledgeproject,GeneticAlgorithmandautocontroletc.arealsogiven.
Keywords:roughsets;uncertainty;dataanalysis;roughcontrolling
责任编辑:代晓红
正在阅读:
粗糙集理论及其应用发展综述08-12
乡村的傍晚作文300字07-16
波那小学四年级下册数学试题及答案06-01
平等主题班会01-17
框架混凝土结构设计计算书 - 图文04-12
金色的童年是一首歌 教学设计01-27
(低压部分)修订版05-03
- 奶牛焦虫病的诊断与防治 - 医学期刊频道--首席医学网
- 外包工程发包流程
- 管理信息系统(路晓丽版)课后题答案(1-12章全)
- 小学语文课题研究方案
- 企业内部培训师管理制度
- 《史记》拓展阅读设计
- 入口广场铺装施工方案
- 附录B塔式起重机安装验收记录表
- 云南省昆明三中2014-2015学年高二下学期期中考试物理试卷 (Word版含答案)
- 郑州大学毕业设计附件
- 民俗学视野下的中国百年歌谣研究
- 巩固练2020统编版(2019)高二选择性必修上册第一单元阶段复习 第一单元仿真模拟训练
- 量化研究学习书单
- 给尾注编号加方括号超级简单方法
- 第1课《放大镜》
- 定价的步骤及新产品定价策略(1)
- 八年级英语下册第六单元基础知识
- 全省地方志工作会议综述
- An Investigation of Tightly Coupled Time Synchronous Speech Language Interfaces Using a Uni
- 新目标英语八年级(上)单元测试题(Units6-7)
- 粗糙
- 综述
- 及其
- 理论
- 应用
- 发展