基于知识网格的数据挖掘

更新时间:2023-08-16 08:00:01 阅读量: 教学研究 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

工业、科学、商务等领域的数据通常分布在不同的地方,需要在不同的地点对其进行分布式维护。只有使用计算功能超强的分布式、并行处理系统才能分析这些领域所产生的超大规模数据集。网格为分布式知识发现应用中的计算提供了有效支持。为了在网格上进行数据挖掘的开发,本文提供了一个称之为知识网格的系统,讨论如何应用知识网格设计实施数据挖掘应用,并说明如何搜索网格资源、

维普资讯

计算机科学 2 0 V 13 N . 0 6 o. 3 Q 6

基于知识网格的数据挖掘 )魏定国彭宏 (华南理工大学计算机学院广州 5 04 ) ( 16 1 广东商学院广州 50 2 ) 1 30摘要工业、学、科商务等领域的数据通常分布在不同的地方,需要在不同的地点对其进行分布式维护。只有使用计

算功能超强的分布式、并行处理系统才能分析这些领域所产生的超大规模数据集。网格为分布式知识发现应用中的

计算提供了有效支持。为了网格上进行数据挖掘的开发,在零文提供了一个称之为知识网格的系统,讨论如何应用知识网格设计实施数据挖掘应用,并说明如何搜索网格资源、制软件和数据组件,编以及数据挖掘应用在网格上的执行过程。

关键词

数据挖掘,知识网格,网格计算,网格调度Da a M i i g Ba e n Kn wl g - i t n n s d o o e e Grd dW EIDig Gu n - o PENG n ̄ Ho g( a g o gCo me c le e.Gu n z o 1 4。 Gu n d n m reCo lg a g h u 5 06 0)

(o t i S u h ChnaUnie st fTe h oo y.Gu n h u 51 6 0) v r i o c n lg y a gz o 0 4

Ab ta t S n et a ai u hfed sid sr src ic hed t ns c ilsa n u ty。s in ea d c mme c r s al itiue ndfe e tpa e,a d ce c n o reaeu u l dsrb td i i rn lc s n y fds r ue itn n ei ed d f rt e i i ee tsts h u e r es aed t esp o u e h s ilsc n iti td man e a c n e e o h m df rn i,t es p rl g -c l aas t rd cd i t e efed a b S n f e a n b n lz d b ny u ig t eds rb tda d p r l lp o e sn y tmst a a eas p rsr n o p t u cir ea y e yo l sn h iti ue n a al rc s igs se h th v u e to g c m ui f n t ̄ a e g

n o

Th r fesefcies p o tf rt ec mp t g i h itiu e n wld ed so ey a p iain .Fo h e e— eg i o fr fe t u p r o h o u i n t ed sr tdk o e g ic v r p l t s d v n b c o rt ed v l o me to a amiiga p iain o rd,t i atcep o ie y tm ald k o e g rd n ic s e o t p n fd t nn p l t ng is hs ril r vd sas se c l n wld eg i,a d dsu s sh w o c o e d sg n pe e td t iig a piain y u ig t e k o e g r . Th sa t l l sr ts i ealh w O e ina di lm n a am nn p l t sb sn h n wld e g i m c o d i ri ei u tae n d ti o t c l s a c o rdr s u c s o o es fwaea d d t o p n n s n h r c s h tt emiig a p iain x c t e rh frg i eo re,c mp s o t r n aacm o e t,a d tep o e st a h nn p l t se e u e c oo rd . n g is

Ke wod Daamiig,Kn wld eg i y rs t nn o e g r d,Grd c mp t g i o u i,Grd s h d l g n i c e ui n

1引言 网格计算是一个被广泛关注的新颖的计算模型。它与传统的分布式计算模型不同,主要着眼于需要大规模资源共享领域的应用。当然,同样适合高性能计算方面的应用。现在网 格已经成为高性能计算和分布式处理的一个有效基础。网格是用户能够用简单的接 V对其进行访问的、 1由异构型机器组

大数量的数据时遵循同样的方法以获得决策支持。因此。数

据网格是使用知识网格l提供的工具和模型对网格上的数据 9 j资源进行基于知识的分布式挖掘与析取,自己不断发展进使化。

知识网格是一个并行、分布式的、集数据挖掘技术和网格技术于一体的软件体系结构。在知识网格的体系结构中,数据挖掘1具集成了数据网格的所有机制与服务。因此使用知二 识网格能

够对网格上的巨大数据集进行数据挖掘,以实现科学发现。改进工业流程和组织模型。揭示有价值的商业信息。 本文的工作主要是基于这些相关的研究基础,论述分将布式高性能知识发现的应用环境的设计与实施,讨论基于并知识网格的数据挖掘应用的设计与执行过程。

成的分布式分析计算体系结构。因此,网格通过由公共和个体的共享资源所组成的虚拟组织提供资源访问技术和操作服务

现在,实施网格应用的工具包和软件环境 ( G o u[、如 lb s Le i n go[、

C n o ̄和 Uncr ̄], odr钉 i e” )已经可以投入商业使用 o

了,特别是 F se和 K sl n的 Glb s工具包已经广泛应 ot r es ma ou

用于科学和数据密集型的网格应用的中间件,已经变成了一个实施网格系统的事实上的标准了。工具包主要解决了安

2知识网格知识网格体系结构使用基本的网格机制。网格工具箱在和网格服务基础上建立具体的知识发现服务系统。我们能够应用可用的网格环境以不同的方式开发这些服务系统。当今

全、发现、和数据的管理、信息资源通信、错误检测和可移动等问题,它通过由服务袋组成的机制来执行网格中的操作。现在。 o u和其他网格工具已经广泛应用于各种工程项目。 Glb s 尽管这些工程大多数还是科学与技术方面的分析与计算。但网格在教育、工业和商务中的应用也在迅速增长。

的实施方法是基于 Gl u o s的工具箱。与 Glb s一样。识 b ou知

网格以局部服务的协作和联合为基础提供全局的服务。们我设计的知识网格的体系结构使得很多专门化的数据挖掘工具

数据网格中间件主要集中于网格上的数据移动和复制管理。在很多的科学和商业领域使用工具和软件环境中,可对利用的数据进行分析、推理和发现是非常必要的。科学家与工程师能够应用这些环境进行虚拟科学实验,能够在挖掘巨

能够在低级的网格机制和数据网格服务上兼容。使用该方法就能够充分利用各种可用的“准”标网格服务资源,证能够保拥有一个开放式的并行、分布式的知识发现体系结构,能够在网格中间件级别上以简单的方式进行配置。教授。士后。博主要研究方向为

*本文的工作受广东科技攻关项

目(o4 OOO 1和广州市科攻关项目(04 2 o9)资助。魏定固 ) 2OAl22O ) 2oZ~ o 1的 D计算机网络技术、数据库和电子商务,彭

宏教授,士生导师,博主要研究方向为智能网络技术、智能商务与数据挖掘、人工智能应用技术。

20 1

本文来源:https://www.bwwdw.com/article/elwj.html

Top