计算机人工智能论文
更新时间:2023-12-10 18:18:01 阅读量: 论文大全 文档下载
篇一:人工智能选修课论文
人工智能选修课论文
学院:海南师范大学物电学院班级:10电子1班 姓名:陈增桂
摘要:随着科技发展越来越迅速,很多东西的都发展到智能时代。电视是智能的,电网也是智能的,手机也是智能。我们生活的世界也越来越智能,所以学习一些人工智能的知识也很重要。通过长达16周对人工智能的学习,我们有了对人工智能的初步了解。本文主要分两部分,第一是:是这个学期人工智能学习的知识点的总结;第二是:人工智能在电子信息科学与技术当中的应用。 关键字:人工智能电子信息科学与技术 应用
第一部分:人工智能知识的总结。
概念:人工智能是计算机科学的一个重要分支,也是一门正在发展中的综合
性前沿学科,它是由计算机科学、控制论、信息论、神经生理学、哲学、语言学等多种学科相互渗透而发展起来的,目前正处于发展阶段尚未形成完整体系。
发展过程中经历的阶段有:
第一阶段(40年代中~50年代末)神经元网络时代
第二阶段(50年代中~60年代中)通用方法时代
第三阶段(60年代中~80年代初)知识工程时代
第四阶段(80年代中~90年代初)新的神经元网络时代
第五阶段(90年代初~现在) 海量信息处理与网络时代 研究的基本内容:搜索技术、知识表示、规划方法、机器学习、认知科学、自然语言理解与机器翻译、专家系统与知识工程、定理证明、博弈、机器人、数据挖掘与知识发现、多Agent系统、复杂系统、足球机器人、人机交互技术等。
研究领域:(1)问题求解; (2)逻辑推理与定理证明; (3)自然语言理解; (4)自动程序设计; (5)专家系统; (6)机器学习; (7)神经网络; (8)机器人学; (9)模式识别; (10)机器视觉; (11); 智能控制; (12)智能检索; (13)智能调度与指挥; (14)分布式人工智能与Agent;(15)计算智能与进化计算;(16)数据挖掘与知识发现; (17)人工生命; (18)系统与语言工具
知识与知识表示:
一、谓词表示法:首先定义谓词,指出每个谓词的确切含义,然后再用连接词把有关的谓词连接起来,形成一个谓词公式表达一个完整的意义。
二、产生式表示法:产生式系统由3个基本部分组成:规则库、综合数据库、控制系统。
三、框架表示法:框架通常由指定事物各个方面的槽组成,每个槽拥有若干个侧面,而每个侧面又可拥有若干个值。
四、语义网络表示法:语义网络由节点和弧线或链线组成,节点用于表示物体、概念和状态,弧线用于表示节点间的关系。
推理:所谓推理就是按某种策略由已知判断推出另一判断的思维过程。
一、经典逻辑推理:
? 自然演绎推理:从一组已知为真的事实出发,直接运用经典逻
辑的推理规则推出结论的过程,称为自然演绎推理。其中,基
本的推理规则是P规则、T规则、假言推理、拒取式推理等。
? 归结演绎推理:归结演绎推理的理论基础是海伯伦理论及鲁滨
逊归结原理,它是通过把公式化为子句集并运用归结规则实现
对定理的证明的。归结原理的基本思想是:若欲证明子句集S
是否可满足,则检验S中是否包含矛盾,或能否从S中导出矛
盾来。如果有矛盾或者能导出矛盾,则称S是不可满足的。
? 与/或形演绎推理:归结演绎推理要求把有关问题的知识及目标
的否定都化成子句形式,然后通过归结进行演绎推理,其推理
规则只有一条,即归结规则;与/或形演绎推理不再把有关知识
转化成子句集,而把领域知识及已知事实分别用蕴含式及与/或
形表示出来,然后通过运用蕴含式进行演绎推理,从而证明某
个目标公式。
二、不确定与非单调推理:不确定性匹配是指两个知识模式不完全致,但是它们的相似程度又在规定的限度内。推出的结论不是单调增加。 搜索策略:依靠经验,利用已有知识,根据问题的实际情况,不断寻找可利用知识,从而构造一条代价最小的推理路线,使问题得以解决的过程称为搜索
一、 状态空间搜索策略:先把问题的初始状态作为当前扩展节点对其进
行扩展,生成一组子节点,然后检查问题的目标状态是否出现在这
些子节点中。若出现,则搜索成功,找到了问题的解;若没出现,
则再按照某种搜索策略从已生成的子节点中选择一个节点作为当前
扩展节点。重复上述过程,直到目标状态出现在子节点中或者没有
可供操作的节点为止。所谓对一个节点进行“扩展”是指对该节点用某个可用操作进行作用,生成该节点的一组子节点。
1) 盲目搜索
? 广度优先搜索:从初始节点S0开始逐层向下扩展,在第n层
节点还没有全部搜索完之前,不进入第n+1层节点的搜索。
Open表中的节点总是按进入的先后排序,先进入的节点排在
前面,后进入的节点排在后面。
? 深度优先搜索 :从初始节点S0开始,在其子节点中选择一个
最新生成的节点进行考察,如果该子节点不是目标节点且可
以扩展,则扩展该子节点,然后再在此子节点的子节点中选
择一个最新生成的节点进行考察,依此向下搜索,直到某个
子节点既不是目标节点,又不能继续扩展时,才选择其兄弟
节点进行考察。
? 有界深度优先搜索
? 代价树的广度优先搜索:在代价树中,可以用g(n)表示从初始节点S0到节点n的代价,用c(n1, n2)表示从父节点n1到其
子节点n2的代价。这样,对节点n2的代价有:
g(n2)=g(n1)+c(n1, n2)。代价树搜索的目的是为了找到最佳
解,即找到一条代价最小的解路径。
? 代价树的深度优先搜索:
(1) 把初始节点S0放入Open表中,置S0的代价g(S0)=0;
(2) 如果Open表为空,则问题无解 ,失败退出;
(3) 把Open表的第一个节点取出放入Closed表,并记该节点为n;
(4) 考察节点n是否为目标节点。若是,则找到了问题的
解,成功退出;
(5) 若节点n不可扩展,则转第(2)步;(6) 扩展节点n,生成其子节点ni(i=1, 2, …),将这些子节点按边代价由小到
大放入Open表的首部,并为每一个子节点设置指向父节点的指针。然后转第(2)步。
2) 启发式搜索
? 局部择优搜索
? 全局择优搜索
? A*算法
二、 与/或树搜索策略:与/或树的搜索过程实际上是一个不断寻找解树
的过程。其一般搜索过程如下:
(1) 把原始问题作为初始节点S0,并把它作为当前节点;
(2) 应用分解或等价变换操作对当前节点进行扩展;
(3) 为每个子节点设置指向父节点的指针;
(4) 选择合适的子节点作为当前节点,反复执行第(2)步和第(3)步,在此期间需要多次调用可解标记过程或不可解标记过程,直到初始节点被标记为可解节点或不可解节点为止。
1) 盲目搜索
? 广度优先搜索
? 深度及有界深度优先搜索
2) 有序搜索
(特殊情况)----》博弈问题:极大极小分析法:计算出端节点的估值,再推算出父节点的得分。推算的方法是:对“或”节点,选其子节点中一个最大的得分作为父节点的得分,这是为了使自己在可供选择的方案中选一个对自己最有利的方案;对“与”节点,选其子节点中一个最小的得分作为父节点的得分,这是为了立足于最坏的情况。这样计算出的父节点的得分称为倒推值。
(提高搜索效率的方法)-----》α-β剪枝技术:对于一个“与”节点来说,它取当前子节点中的最小倒推值作为它倒推值的上界,称此值为β值。对于一个“或”节点来说,它取当前子节点中的最大倒推值作为它倒推值的下界,称此值为α值。其一般规律为:(1)任何“或”节点x的α值如果不能降低其父节点的β值,则对节点x以下的分枝可停止搜索,并使x的倒推值为α。这种剪枝成为β剪枝。(2)任何“与”节点x的β值如果不能升高其父节点的α值,则对节点x以下的分枝可停止搜索,并使x的倒推值为β。这种剪枝成为α剪枝。
第二部分:人工智能在电子信息科学与技术当中的应用 人工智能与电子信息科学之间的关系:在实现人工智能的过程中,需要用到很多功能强大且独特的电子专用设备。而电科的一些研究成果则需要通过人工智能中的虚拟与仿真技术才能比较简单清晰的呈现在人们面前。
电子设计EDA软件中应用:EDA是电子设计自动化(Electronic
Design Automation)以计算机为工作平台,融合了应用电子技术、计算机技术、信息处理及智能化技术的最新成果,进行电子产品的自动设计。
利用EDA工具,电子设计师可以从概念、算法、协议等开始设计电子系统,大量工作可以通过计算机完成,并可以将电子产品从电路设计、性能分析到设计出IC版图或PCB版图的整个过程的计算机上自动处理完成。在电子设计当中现在越来越依赖与运用人工智能设计出来的软件。运用其可以帮助我们电子设计者可以在没有的设备的时候就可以进行验证电路和对电路进行调试,减小成本,缩短开发周期。一下是一些常用EDA软件。
(1) Altium Designer: Altium Designer 提供了唯一一款统一
的应用方案,其综合电子产品一体化开发所需的所有必须技
术和功能。Altium Designer 在单一设计环境中集成板级和FPGA系统设计、基于FPGA和分立处理器的嵌入式软件开发
以及PCB版图设计、编辑和制造。并集成了现代设计数据管
理功能,使得Altium Designer成为电子产品开发的完整解
决方案-一个既满足当前,也满足未来开发需求的解决方
案。
(2) Proteus 在电子设计初期当中的仿真是非常强大的,
Proteus是世界上著名的EDA工具(仿真软件),从原理图布
图、代码调试到单片机与外围电路协同仿真,一键切换到
PCB设计,真正实现了从概念到产品的完整设计。是目前世
界上唯一将电路仿真软件、PCB设计软件和虚拟模型仿真软
件三合一的设计平台,其处理器模型支持8051、PIC10、
AVR、ARM、8086和MSP430等,2010年又增加了Cortex和
DSP系列处理器,并持续增加其他系列处理器模型。在编译
方面,它也支持IAR、Keil和MPLAB等多种编译器。
(3) MATLAB:它的一大特性是有众多的面向具体应用的工具箱和
仿真块,包含了完整的函数集用来对图像信号处理、控制系
统设计、神经网络等特殊应用进行分析和设计。它具有数据
采集、报告生成和MATLAB语言编程产生独立C/C++代码等功能。MATLAB产品族具有下列功能:数据分析;数值和符号计算、工程与科学绘图;控制系统设计;数字图像信号处理;
财务工程;建模、仿真、原型开发;应用开发;图形用户界
面设计等。MATLAB产品族被广泛应用于信号与图像处理、控制系统设计、通讯系统仿真等诸多领域。
物联网中应用: 物联网是指通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。它是在互联网基础上延伸和扩展的网络。而物联网需要人工智能的研究成功如问题求解,逻辑推理证明、专家系统、数据挖掘、模式识别、自动推理、机器学习、智能控制等技术。通过这些技术的应用使物联网有人工机器的特
篇二:人工智能论文
浅谈人工神经网络学习
1、简介
作为动态系统辨识、建模和控制的一种新的、令人感兴趣的工具,人工神经网络(Artificial Neural Networks,ANN )提供了一种普遍而且实用的方法从样例中学习值为实数、离散值或向量的函数。像反向传播(BACKPROPAGATION)这样的算法,使用梯度下降下来调节网络参数以最佳拟合由输入—输出对组成的训练集合。ANN学习对于训练数据中的错误健壮性很好,且已被成功的应用到很多领域,例如视觉场景分析、语音识别以及机器人控制等。
神经网络学习方法对于逼近实数值、离散值或向量的目标函数提供的一种健壮性很强的方法。对于某些类型的问题,如学习解释复杂的现实世界中的传感器数据,人工神经网络是目前知道的最有效的学习方法。例如,反向传播算法已在很多问题中取得了惊人的成功,比如学习识别手写字符、学习识别口语、学习识别人脸等。
1.1人工神经网络学习发展简史:
对人工神经网络的研究可以追溯到计算机科学的早期。McCulloch & Pitts(1943)提出了一个相当于感知器的神经元模型,20世纪60年代他们的大量工作探索了这个模型的很多变体。20世纪60年代早期Widrow & Hoff(1960)探索了感知器网络(他们称为“adelines”)和delta法则。Rosenblatt(1962)证明了感知器训练法则的收敛性。然而,直到20世纪60年代晚期,人们才开始清楚单层的感知器网络的表现能力很有限,而且找不到训练多层网络的有效方法。Minsky & Papert(1969)说明即使是像XOR这样简单的函数也不能用单层的感知器网络表示或学习,在整个20世纪70年代ANN的研究衰退了。
在20世纪80年代中期ANN的研究经历了一次复兴,主要是因为训练多层网络的反向传播算法的发明(Rumelhart & McClelland 1986;Parker 1985)。这些思想可以被追溯到有关的早期研究(例如,Werbos 1975)。自从20世纪80年代,反向传播算法就成为应用最广泛的学习方法,而且人们也积极探索出了很多其他的ANN方法。在同一时期,计算机变得不在贵重,这允许人们试验那些在20世纪60年代不可能被完全探索的计算密集型的算法。
2、人工神经网络学习的国内外研究状况
随着人工神经网络20世纪80年代在世界范围内的复苏,国内也逐步掀起了研究热潮。l989年10月和11月分别在北京和广州召开了神经网络及其应用讨论会和第一届全国信号处理—神经网络学术会议;l990年2月由国内八个学会(中国电子学会、人工智能学会、自动化学会、通信学会、物理学会、生物物理学会和心理学会)联合在北京召开“中国神经网络首届学术会议”。这次大会以“八学会联盟,探智能奥秘为主题收到了300多篇学术论文,开创了中国人工神经网络及神经计算机方面科学研究的新纪元。经过十几年的发展,中国学术界 和工程界在人工神经网络的理论研究和应用方面取得了丰硕成果,学术论文、应用成果和研究人员逐年增加.
在国际上,1987年,在美国加洲召开了第一届国际神经网络学会.此后每年召开两次国际联合神经网络大会(IJCNN).不久,该学会创办了刊物Journal Neural Networks,另有十几种国际著名的神经网络学术刊物相继问世,至此,神
经网络理论研究在国际学术领域获得了其应有的地位。
作为人工神经网络学习的典型算法反向传播(BP)算法,近年来国内外学者对这一算法提出了一些改进。其中,由宋绍云、仲涛提出的BP人工神经网络网络的新算法【1】解决了传统算法的局部极小及收敛速度慢的问题。该算法是在BP神经网络现有的基础上提出的一种新的算法,该算法的基本原理是任选一组自由权,通过解线性方程组求得隐层权,将选定的自由权与求得的权合在一起,就得到所需的学习权值。而BP人工神经网络自适应学习算法的建立则解决了BP神经网络结构参数、学习速率与初始权值的选取问题,并对传统的BP算法进行了改进,提出了BP神经网络自适应学习算法【2】,又将其编制成计算机程序,使得输入节点、隐层节点和学习速率的选取全部动态实现,减少了人为因素的干预,改善了学习速率和网络的适应能力。计算结果表明:BP神经网络自适应学习算法较传统的方法优越,训练后的神经网络模型不仅能准确地拟合训练值,而且能较精确的预测未来趋势。基于遗传算法的人工神经网络学习【3】避免了BP算法易陷入局部极小值、训练速度慢、误差函数必须可导、受网络结构的限制等缺陷。
人工神经网络的研究同样在实践中也有所发展。比如,基于人工神经网络的并行强化学习自适应路径规划【4】,可以很好的应用于机器人蔽障系统。BP算法在雷达目标识别中的应用以及在超声检测中的应用等都是在BP算法改进的基础上实现的。
3、所选专题的研究意义与研究方法
从1946年第一台电子数字计算机问世以来直到现在,大多数信息处理都采用程序式计算方式。这种方式解题需要设计算法或规则,并正确的编制成软件,然后才能进行问题求解。这种解题方式必须考虑3个因素:
① 问题的形式化;
② 可进行计算的算法;
③ 计算的复杂性。
比较计算机和人的处理能力,其差别是惊人的。一方面,一个人能很容易识别面孔理解语言,而一台巨型机却很难识别出一棵树来。另一方面,用计算机进行计算,可以很快的得到答案,其计算能力大大超过了人。那么数字计算和辨识物体之间究竟有哪些差别呢?
辨识物体是不能简单明确的加以定义的。要识别一棵树,就必须给出树的全部定义。做出这样一种定义,等于要描述树的每一个可以想到的变量。这类问题构成了随机问题。所谓随机问题,就是那些需要具备某一系统的实际上每种可能状态的知识才能解答的问题。因此,为解决一个随机问题,就要求记忆所有可能的解答,当给定输入数据时,从所有可能的解答的集合中迅速的选出最合适的答案。而像数学一类的计算问题,其解答通常可以用一种算法简洁地表示出来,也就是说,可以用一个精确的指令系列来表示,该指令系列规定了如何处理输入数据以得到答案。
信息处理的一种新方法并不需要开发算法和规则,极大的减少了软件的工作量,这种方法称为神经网络。神经网络是一门崭新的信息处理学科,它从神经生理学和认知科学研究成果出发,应用数学方法研究并行分布的、非程序的、适应性的、大脑风格的信息处理的本质和能力。神经网络中主要的信息处理结构是人工神经网络。
神经信息处理是介于常规处理形式和人脑处理形式的中间处理形式。一方面,神经网络企图模仿人脑的功能,而另一方面许多实现技术又是常规的。表1-1给出了这3种信息处理范型的主要特点。神经信息处理许多特性与人脑相似,诸如联想、概括、并行搜索、学习和灵活性。
表1-1 3种信息处理范型
人脑处理信息的特点如下:
① 大规模并行处理。人脑神经元之间传递神经冲动是以毫秒计的,比普通的电子计算机慢得多。但人们通常能在1ms内对外界事物作出判断和决策。这对传统的计算机或人工智能是做不到的。由此可知,人脑的“计算”必定是建立在大规模并行处理的基础上。人善于在复杂环境下作出判断,从整体上识别事物。神经网络的大规模并行处理与多处理机构成的并行系统是不同的。
② 具有很强的容错性,善于联想、概括、类比和推广。每天有大量神经细胞正常死亡,但不影响大脑正常的功能;大脑局部损伤会引起某些功能衰退,但不是功能突然丧失。在计算机中,元器件的局部损坏,或者程序中的微小错误都可能引起严重的后果,即表现出极大的脆弱性。人脑与计算机信息处理的巨大差别在于对信息的记忆和处理方式不同。计算机的模式是信息局部储存,按程序提取有关的信息,送到运算器处理。大脑中信息的记忆,特别是长期记忆是通过改变突触的效能实现的,即信息存储在神经元间连接强度的分布上,信息的记忆和处理是合二为一的。这一点,神经网络与大脑信息处理方式及其相似。
③ 具有很强的自适应能力。人脑功能受先天因素制约,但后天因素,如经历、训练、学习等也起重要作用。这表明人脑具有很强的自适应性和自组织性。神经网络与符号处理不同,前者强调系统的自适应或学习过程,同一网络因学习方法及内容不同,可具有不同的功能;符号处理强调程序编写,系统的功能取决于编写者的知识和能力。
由上可知,脑是最复杂、最完美、最有效的一种信息处理装置,人们正以极大的兴趣研究它的结构和机理。这种研究与20世纪初的物理学和20世纪50年代的分子生物学一样,正酝酿着重大的突破,而这一突破将给整个科学的发展带来巨大而深远的影响。人们对大大脑的认识已深入到探索脑的核心问题,鉴定出
了一系列涉及脑工作的重要分子,在感知、行为、学习和记忆方面都取得了重要进展。这表明人们将有可能最终揭开大脑这个人体最复杂系统的奥秘,为现代科技发展寻找新的道路。借助大脑工作原理,有可能使信息处理获得新的突破。
正因为如此,神经科学受到世界各发达国家的高度重视。美国国会通过决议将1990年1月5日开始的10年定为“脑的十年”。国际脑研究组织号召它的成员国将“脑的十年”变为全球行动。美国国防部高级研究计划局(DARPA)制定的8年研究计划中,神经网络是重要的方向。1986年日本政府提出了“人类前沿科学计划”(HFSP)研究计划,1992年提出“真实世界计算”(RWC)研究计划。德国人从1988年开始执行“神经信息论”的研究计划。
脑科学、神经生理学、病理学主要研究神经网络的生理机理,如神经元、突触、化学递质、脑组织等的构成和工作过程。而认知科学、计算机科学主要探索人脑信息处理的微结构理论,寻求新的途径,解决当前计算机和传统人工智能难以处理的问题。以此为背景,以人工神经网络为基础,形成了神经网络的新学科。
目前,对大脑思维的过程了解仍然很肤浅,人工神经网络模拟的研究还很不充分,人们面临的是一个充满未知的新领域。神经网络将在基本原理方面进行更深刻的探索。
神经网络的发展与神经科学、认知科学、计算机科学、人工智能、信息科学 机器人学、微电子学、光计算、分子生物学等有关,是一门新兴的边缘交叉学科。神经网络研究的主要目的如下:
① 理解脑系统为何具有智能。这些计算与符号表示的形式操作处理不同,人脑是如何组织和实施这些计算的。
② 研究各种强调“计算能力”的神经网络模型,并不着重于这些模型的生物学保真程度
③ 研究大规模并行自适应处理机理。
④ 研究神经计算机的体系结构和实现技术。
4、适合神经网络学习的问题
人工神经网络学习非常适合于这样的问题:训练集合为含有噪声的复杂传感器数据,例如来自摄像机和麦克风的数据。它也适用于需要较多符号表示的问题,例如决策树学习任务。这种情况下ANN和决策树学习经常产生精度大体相当的结果。反向传播算法是最常用的ANN学习技术。它适合具有以下特征的问题:
(1) 实例是用很多“属性-值”对表示的:要学习的目标函数是定义在可以用向量描述的实例之上的,向量由由预先定义的特征组成。这些输入属性之间可以高度相关,也可以相互独立。输入值可以是任何实数。
目标函数的输出可能是离散值、实数值或者由若干实数属性或离散属性组成的向量:例如在ALVINN(Pomerleau(1993)的ALVINN系统是ANN学习的一个典型实例,这个系统使用一个学习到的ANN以正常的速度在高速公路上驾驶汽车。)
(2) 系统中输出的是30属性向量,每一个分量对应一个建议的驾驶方向。每个输出值是0和1之间的某个实数,对应于在预测相应驾驶方向时的置信度。我们也可以训练一个单一网络,同时输出行驶方向和建议的加速度,这只要简单的把编码这两种输出预测的向量连接在一起就可以了。
(3)训练数据可能包含错误:ANN学习算法对于训练数据中的有非常好的健壮性。
(4) 可容忍长时间的训练:网络训练算法通常比像决策树学习这样的算法需
要更长的训练时间。训练时间可能从几秒到几小时,这要看网络中权值的数量、要考虑的训练实例的数量以及不同学习算法参数的设置等因素
(5)可能需要快速求出目标函数值:尽管ANN的学习时间相对较长,但对学习到的网络求值以便把网络应用到后续的实例通常是非常快速的。例如,Alvinn在车辆向前行驶时,每秒应用它的神经网络若干次,以不断的更新驾驶方向。
(6) 人类能否理解学到的目标函数是不重要的:神经网络学习方法学习到得权值经常是人类难以解释的。学到的神经网络比学到的规则难以传达给人类。
5、我对人工神经网络学习研究的认识及观点
5.1 人工神经网络学习的几种算法
1.有监督Hebb算法
2.单层感知器
3.梯度(LMS)算法
4.BP算法
这几种算法中,BP算法应用最为广泛。
5.2基于反向传播网络的学习
反向传播算法是一种计算单个权值变化引起网络性能变化值得较为简单的方法。由于BP算法过程包含从输出节点开始,反向地向第一隐含层(即最接近输入层的隐含层)传播由总误差引起的权值修正,所以称为“反向传播”。
5.2.1反向传播网络的结构
鲁梅尔哈特(Rumelhart)和麦克莱兰(Meclelland)于1985年发展了BP网络学习算法,实现了明基斯的多层网络设想。BP网络不仅含有输入节点和输出节点,而且还含有一层或多层隐(层)节点,如图5.1所示输入信号首先向前传递到隐节点,经过作用后,再把隐节点的输出信息传递到输出节点,最后给出输出结果。节点的激发函数一般选用S型函数。
BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理后,传至输出层。每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望输出,那么就转为反向传播,把误差信号沿原连接路径返回,并通过修改各层神经元的权值,使误差信号最小。
图5.1 BP网络
5.2.2反向传播学习算法
(1) 选取比率参数r。
篇三:人工智能课程论文
目录
1.项目简介 .................................................................................................. 2
2.人工智能标记语言AIML ............................................................................. 2
2.1 AIML语法构成要素 .......................................................................... 2
2.2 AIML知识库的结构 .......................................................................... 3
3.ALICE内部推理机制 .................................................................................. 3
3.1 ALICE系统工作流程 ......................................................................... 3
3.2 ALICE推理机制 ................................................................................ 4
3.3 基本原理 ......................................................................................... 5
4. ALICE在中文处理上的问题 ........................................................................ 6
4.1分词和词性标注 ............................................................................... 6
4.2同义句处理 ...................................................................................... 7
4.3句式变换 ......................................................................................... 7
5. ALICE支持中文的实现(我组自主实现部分) ............................................. 7
5.1项目结构总览 ................................................................................... 7
5.2代码实现 ......................................................................................... 8
5.3界面设计 ....................................................................................... 11
5.4标签的使用与测试 .......................................................................... 11
5.5学习能力的实现 ............................................................................. 20
5.6还需改进的地方 ............................................................................. 22
6.参考文献 ................................................................................................ 22
1.项目简介
ALICE是由美国宾西尼亚州Lehigh大学的Richard S.Wallace博士开发的一个基于经验的人工智能聊天机器人,它以AIML作为知识描述语言,目前存储了四万多条知识分类。早期的版本是由java语言实现的,近年来又出现了一系列用其它各种语言实现的AIML解析器,ALICE目前可以支持英语、德语以及法语对话,但是由于汉语与西方语言差别很大,要想ALICE进行中文对话,还必须深入剖析它的运行机理,针对汉语的特点,做出进一步的改进。我组本次人工智能的项目是在智能聊天机器人Alice上加以改进完成的,使其能够进行中文对话,并具有学习的能力。本文主要介绍机器人小爱的知识组织结构、内部推理机制以及我组实现的改进部分的工作。
2.人工智能标记语言AIML
ALICE采用AIML作为它的知识描述语言。AIML是利用XML标准定义的一种服务于人工智能领域需要的特定语言,设计AIML的最初意图就是为了能够用最简单的方式来创建人工智能聊天机器人,而且在语法上能与大家所熟悉的HIML语法接近。AIML在整个聊天系统中的作用至关重要,ALICE的各种版本的核心实现也无非是围绕怎样方便、有效、快捷地组织和检索AIML知识分类这个问题进行的。
2.1 AIML语法构成要素
在AIML中,基本的知识单元是由分类(category)构成的,而每一个分类又是由用户输入的问题、ALICE输出的答案和可选上下文环境所组成,一个简单的分类如下所示: <category>
<pattern>HELLO</pattern>
<template>Hi,there!</template>
</category>
其中,模式<pattern>部分代表用户输入的问话,模板<template>部分则代表用户输入这一问话后,系统应该给出的答案。AIML还有其它许多重要标记,如递归调用标记<srai>,随机选择输出标记<random>等。这一部分还会在后面详细介绍。
2.2 AIML知识库的结构
AIML知识库由多个以AIML为后缀名的文件组成,每个AIML文件可以代表一个相似领域的可能话题,如关于时间方面的知识条目,我们就可以把它组织到time.aiml文件中,以便于整体知识的分类管理。一个简单的AIML文件内容如下所示:
<?xml version=”1.0” encoding=”ISO-8859-1”?>
<aiml version=”1.0”>
<category>
<pattern>HOW MANY DAYS * WEEK </pattern>
<template> 7 days per week </template>
</category>
…….
<category>
<pattern>HOW MANY SECONDS * YEAR</pattern>
<template>Approximately 3.14 times 10 to the seventh.
</template>
</category>
</aiml>
……..
上面这个例子中,主要的话题可能就是时间。类似的,我们还可以新增的文件,以天气、运动、爱好等为主题。
可以看出AIML就如同一个关于问题和答案的简单数据库,其中模式部分与SQL查询语言相似,但还要简单,由于模板中可能还包含递归调用标记,因此最最输出并不仅仅依赖于死一个匹配上的分类,还与递归调用标记中的内容有关。
3.ALICE内部推理机制
3.1 ALICE系统工作流程
ALICE系统在启动时,首先根据配置文件进行系统的初始化操作,并把AIML文件内容以树的结构形式加载到内存当中,形成内存知识树,这样当系统在响应用户输入的问句时,可以直接在内存树中进行推理,提高了响应速度,加载完毕之后,等待用户输入问句。
接收用户输入时进行问句规范化处理,然后将规范化处理后的问句与内存知识树中的模式进行匹配,寻求最佳结果,找到之后读出该匹配模式对应的模板信息,进行模板处理,处理完后返回用户结果,等待用户输入新问句。系统工作流程图如下:
3.2 ALICE推理机制
ALICE的核心推理部分成为Graphmaster,它由一系列称为Nodemapper的节点集组成。每一个Nodemapper都有若干个从该节点出来的分支,这些分支可能是一个单词,也可能是一个通配符。每一个分支代表一个模式的第一个单词,第二级分支节点的
Nodemapper是模式句子中的第二个单词,它们的子分支指向紧跟在其后的第三个单词或者通配符这样依次类推,直至子节点的分支到了模式句子的为止。此时,把分类中该模式对应的模板内容存入该节点,这样Graphmaster就构成了一颗内存树,树的叶子节点存有模板信息,叶子节点的数目正好与知识库模式的数目相等。根据用户的输入查找对应模式的过程就是ALICE的推理过程,假设用户输入的问句以单词X开头,那么首先拿X与Graphmaster中的第一级节点的内容逐个比较。
如下这个例子中,是以“你”开始,可以分支出“好”,再往下继续可以分出“可”和“本”,其中“你好笨”这一分支就此结束;另一分支继续又出现两条“爱”和“怜”,到此为止,这个例子就结束了,共有三条分支:“你好笨”“你好可爱”“你好可怜”。由此可见,这棵树的扩充性很大,可根据不同需求插入所需节点构成新的分支语句。
3.3 基本原理
语料库中的pattern 是模式的意思, 可理解为问题,而相应的 template 可理解为回答(而这一对问答被包裹在了 category 标签里面) 。假如你的语料库像上面的 xml 文件这样简单,那么当你输入“你是谁” ,机器人就会在内存中去一个一个的匹配 pattern,最后匹配到了, 就会回答 “我是小龙” , 而你输入其他任何语句,机器人就无从匹配了, 程序会出现匹配不到的错误,那么怎样避免程序出错呢?我们修改语料库如下:
正在阅读:
计算机人工智能论文12-10
布林线 BOLL08-11
2012年海南高考文综试卷(含答案)08-25
九三学社入社登记表填写手册05-18
企业会计准则第1号——存货准则04-15
1998年06月大学英语六级(CET-6)真题试卷(含答案)05-10
爱是一种信仰!02-14
- 主题教育党建工作专题调研情况的报告
- 浅议基层投资审计转型存在的问题及对策交流材料
- 高校党建模式探讨
- 基层审计机关如何有效防范审计风险经验交流
- 研究工商行政管理改革的实效性
- 浅论电分析化学在生命科学中的应用
- 电力企业法律事务管理中存在的问题分析
- 水利水电工程相关测量技术研究
- 探析德师风建设中存在的问题及对策
- 物联网背景下智能机器人行业发展前景展望
- 浅议加强水利水电工程施工阶段质量管理的意义
- 水利水电工程项目风险管理探究
- 分析建筑施工企业法律事务管理现状
- 油田法律事务工作的重要作用分析
- 预拌混凝土裂缝的类型及原因分析
- 研究高校党建工作在师德师风建设中作用
- 浅论兴趣教学法在初中体育教学中的作用
- 我国高校师德师风建设的新途径和新方法
- 医院档案管理的不足并提出改进策略
- 浅谈知识服务型智能机器人的发展趋势
- 人工智能
- 计算机
- 论文