基于人工神经网络的预测研究

更新时间:2024-04-19 12:19:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

目 录 1.引言.............................................................. 1

1.1 研究背景及意义 .............................................. 1 1.2 研究现状 .................................................... 2 1.3 主要研究方向 ............................................... 5 2.人工神经网络...................................................... 5

2.1人工神经网络的基本内容 ..................................... 5 2.2人工神经网络的基本特征 ..................................... 7 2.3人工神经网络的工作原理 ...................................... 8 2.4人工神经网络的分析方法 ..................................... 13 3. 人工神经网络BP模型............................................. 14

3.1 BP神经网络的概念 ......................................... 15 3.2 BP网络模型的类型 ......................................... 15 3.3 BP学习算法................................................. 17 3.4 BP神经网络的应用及不足 ................................... 19 4.人工神经网络RBF模型 ........................................... 19

4.1 RBF神经网络的概念 ........................................ 19 4.2 径向基函数(RBF)网络结构和模型 .............................. 20 4.3 RBF的网络学习算法.......................................... 21 4.4 RBF网络模型的优点和缺点.................................... 23 5.基于人工神经网络的空调系统故障预测............................... 24

5.1 用BP网络对空调系统故障进行预测 ............................ 24 5.2 空调系统故障诊断的RBF网络建立 ............................. 28 5.3 小结 ....................................................... 29 6. 结论............................................................ 30

6.1 结论 ....................................................... 30 6.2注意事项 ................................................... 31 6.3 人工神经网络的局限性 ..................................... 32 参考文献........................................................... 32

基于人工神经网络的预测研究

摘要:随着多媒体和网络技术的飞速发展及广泛应用,人工神经网络已被广泛运用于各种领域,本文首先介绍了人工神经网络的基本原理以及概念,然后详细介绍了反向传播算法(BP)和径向基算法(RBF)简介以及应用 ,BP是误差反传误差反向传播算法,RBF网络是一种具有3层单向传播的前馈网络。最后通过举出空调系统的故障的例子,通过建立空调系统故障的BP模型和RBF模型,网络输入输出向量及参数的选取,网络结构及训练样本的选取,网络的训练与检验,计算总结空调故障从而预测出空调故障。并对实验的结果进行了分析,得出相同的样本数和精度要求下, RBF神经网络的隐层神经元数要大大多于BP网络, 这体现在网络的复杂度要高于BP网络。最后一个部分对论文进行了总结,阐述了人工神经网络的预测的前景。

关键词:人工神经网络;BP模型;RBF模型;故障预测

1.引言

1.1 研究背景及意义

现代计算机构成单元的速度是人脑中神经元速度的几百万倍,对于那些特征明确,推理或运算规则清楚地可编程问题,可以高速有效地求解,在数值运算和逻辑运算方面的精确与高速极大地拓展了人脑的能力,从而在信息处理和控制决策等方面为人们提供了实现智能化和自动化的先进手段。但由于现有计算机是按照冯·诺依曼原理,基于程序存取进行工作的,历经半个多世纪的发展,其结构模式与运行机制仍然没有跳出传统的逻辑运算规则,因而在很多方面的功能还远不能达到认得智能水平。随着现代信息科学与技术的飞速发展,这方面的问题日趋尖锐,促使科学和技术专家们寻找解决问题的新出路。当人们的思想转向研究大自然造就的精妙的人脑结构模式和信息处理机制时,推动了脑科学的深入发展以及人工神经网络和闹模型的研究。随着对生物闹的深入了解,人工神经网络获得长足发展。在经历了漫长的初创期和低潮期后,人工神经网络终于以其不容忽视的潜力与活力进入了发展高潮。这么多年来,它的结构与功能逐步改善,运行机制渐趋成熟,应用领域日益扩大,在解决各行各业的难题中显示出巨大的潜力,取得了丰硕的成果[1]。

[1]朱大奇,人工神经网络研究现状及其展望[N].江南大学学报2004 (3):103~108.

1

目前,关于神经网络的定义尚不统一,按美国神经网络学家Hecht Nielsen的观点,神经网络的定义是:“神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算机系统,该系统靠其状态对外部输入信息的动态响应来处理信息的”。综合神经网络的来源、特点和各种解释,它可简单地表述为:人工神经网络是一种旨在模仿人脑结构及其功能的信息处理系统[2]。

正是由于人工神经网络是一门新兴的学科,它在理论、模型、算法、应用和时限等方面都还有很多空白点需要努力探索、研究、开拓和开发。因此,许多国家的政府和企业都投入了大量的资金,组织大量的科学和技术专家对人工神经网络的广泛问题立项研究。从人工神经网络的模拟程序和专用芯片的不断推出、论文的大量发表以及各种应用的报道可以看到,在这个领域里一个百家争鸣的局面已经形成。

在进行神经网络的理论研究时,人们可以将自己的神经网络模型或算法在通用的串行或并行计算机编程实现,但这只是研究的手段而绝非目的,在构造实际的神经网络应用系统时,必然要考虑到硬件实现问题,特定应用下的高性能专用神经网络硬件是神经网络研究的最终目标。

人工智能的方法和技术已经用于解决很多领域的问题,并取得了一定的成就。人工神经网络是人工智能领域的重要分支,而神经网络的硬件实现是神经网路研究的基本问题之一。从对神经网络进行理论探讨的角度,可以通过计算机仿真途径来模拟实现特定的神经网络模型或算法,但在构造神经网络的实际应用系统时,必然要研究和解决其硬件实现问题。神经网络专用硬件可提供高速度,并具有比通用串、并行高得多的性价比,所以特定应用下的高性能专用神经网路硬件是神经网络研究的最终目标。

1.2 研究现状

神经网络的硬件实现可追溯到60年代,当时有几家公司和研究机构试图用硬件来实现神经元,最为著名的便是感知机和ADALINE神经网络模型的实现。当时CornellAeronautical实验室(现在名为CALSPAN Corporation)的Rosenblatt 从理论上和实现上描述了感知机。ADALINE神经网络则是由斯坦福人学的

[2]董军,胡上序,混沌神经网络研究进展和展望[J].信息与控制,1997 (5):360~368.

2

Widrow提出的。感知机和ADALINE均为单个神经元模型,他们均能接受多路输入,并能自适应地修改与这些输入相对应的突触强度(互连权值),然而他们实现上有所不同。感知机中,其突触强度通过一种电子机械的方法来改变(通过一个电动马达的转动来改变突触强度),这种实现有许多缺点,如体积大,价格高,运行不可靠等。Widrow的ADALINE实现中则用电阻的方法来表示突触强度。

1965年至1980年,除Adaptronics Corp(现为Division of Flow General Crop)之外,其它一些研究尸体在神经网络实现上没有做更多的工作。Adaptronics的Louis Gilstrap和Roger Barron在1947年开发了第一块神经元芯片。这种很一般 的芯片只包含一个神经元,具有多个输入端且其互连强度可以自适应的改变。要构造具有多个神经元的网络,只需将许多这种芯片在插件板上排列并互连起来就可以了。将许多这种插件构建在一起便可满足神经网络在商业和军事上的许多应用目的。

随着人工神经网络的20世纪80年代在世界范围内的复苏,国内也逐步掀起了研究热潮,1989年10月和11月分别在北京和广州召开了神经网络及其应用讨论会和第一届全国型号处理——神经网络学术会议;1990年2月由国内八个学会(中国电子学会、人工智能学会、自动化学会、通信学会、物理学会、生物物理学会和心理学会)联合在北京召开“中国神经网络首届学术会议”,这次大会以“八学会联盟,探只能奥秘为主题,收到了300多篇学术论文”,开创了中国人工神经网络及神经计算机方面科学研究的新纪元,经过十几年的发展,中国学术界和工程界在人工神经网络的理论研究和应用方面取得了丰硕成果,学术论文、应用成果和研究人员逐年增加。在国际上,1987年,在美国加洲召开第一届国际神经网络学会,此后每年召开两次国际联合神经网络大会(UCNN),不久,改学会创办了刊物Journal Neural Networks,另有十几种国际著名的神经网络学术刊物相继问世。至此,神经网络理论研究在国际学术领域获得了其应有的地位。

经过多年的发展,目前已有上百种的神经网络模型被提出,下表列出了神经网络发展过程中起过重要作用的几种著名神经网络,他也是神经网络发展史的一个缩影。

3

表1-1 有重要影响神经网络

网络名称 自适应线性单元(Adaline) 发明者 Bernard Widrow(斯坦福大学 误差反转网络BP(Back Propagation) Werbs P.(哈佛D.(斯坦福大学)Mcclelland(斯坦福大学) 盒中脑BSB网络James (Brain State in a Anderson(布朗Box) 大学 1977 1974-19时间 1960-1962 特点 学习能力较强,较早开始商业应用 多层前馈网络,采用最小均方差学习方局限性 要求输入-输出之间 是线性关系 需要大量数据,训练大))Rumelhart 85 典型应用领域 雷达天线控制、自适应回波抵消等 语音识别、模式识别输入-输出 过程控制、式是目前应用时间长,易 等 最广泛的网络 陷入局部极小 具有最小均方差的单层自联想网络,类似于双向联想记忆,可对片段输入补全 只能作一解释概念次性决策, 形成,分类无重复性和知识处共振 理 双向联想记忆网BAM(Bi-directional Associative Memory) 双向传播网CPN(Cunter Propaation) Bart Kosko(南加州大学) 1985-1988 双向联想式单层网络,有学存储的密内容寻址度低,数据 的联想记忆 神经网络计算机,图像处理和统计分析 习功能,简单 必须能编易学 码 Robert Hechtnielsen(美国) 1986 一种在功能上作为统计最优化和概率密度函数分析的网络 需要大量处理单元和连接,要高度准确 现在人工神经网络广泛运用到了各个领域,它的更多用法也在不断被开发中,用它来预测事物的发展也是其中之一,而现在人工神经网络预测模型可通过几个问题就能确定答题者是否感染艾滋病,以往判定出入境人员是否感染艾滋病,必须要进行特异性血清学诊断和病原体检测,不仅花费时间,还需要被检测者支付一定的费用,因而工作比较难以开展。使用人工神经网络预测技术使得在没有特异性血清学诊断和病原体检测的条件下,有望在口岸疾病监测和现场卫生检疫工作中及时发现性病、艾滋病高危人群,尽早切断传播途径,最大限度地保障口岸安全。据了解,用这个模型研究者随机抽取了15例梅毒患者和15例非性病患者进行测试,结果该模型准确地识别出15例梅毒病例,准确率达100%。这就

4

是人工神经网络预测的意义,通过问题建模用反向传播算法来计算出答案,直接缩短了原本检查需要的实验时间。

1.3 主要研究方向

神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。目前,主要的研究工作集中在以下几个方面:

(1)生物原型研究。从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。

(2)建立理论模型。根据生物原型的研究,建立神经元、神经网络的理论模型。其中包括概念模型、知识模型、物理化学模型、数学模型等。

(3)网络模型。与算法研究。在理论模型研究的基础上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研究。

(4)人工神经网络应用系统。在网络模型与算法研究的基础上,利用人工神经网络组成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器人等等。

纵观当代新兴科学技术的发展历史,人类在征服宇宙空间、基本粒子,生命起源等科学技术领域的进程中历经了崎岖不平的道路。我们也会看到,探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。

2.人工神经网络

2.1人工神经网络的基本内容

2.1.1人工神经网络的模型

神经元是人工神经网络的基本处理单元,它一般是一个多输入/单输出的非线性元件[3]。神经元输出除受输入信号的影响外,同时也受到神经元内部因素的影响,所以在人工神经元的建模中,常常还加有一个额外输入信号,称为偏差,有时也称为阈值或门限值。

[3]韩力群,人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002.

5

人工神经网络模型主要考虑网络连接的拓扑结构、神经元的特征、学习规则等。目前,已有近40种神经网络模型,其中有反传网络、感知器、自组织映射、Hopfield网络、波耳兹曼机、适应谐振理论等。根据连接的拓扑结构,神经网络模型可以分为:

(1)前向网络 网络中各个神经元接受前一级的输入,并输出到下一级,网络中没有反馈,可以用一个有向无环路图表示。这种网络实现信号从输入空间到输出空间的变换,它的信息处理能力来自于简单非线性函数的多次复合。网络结构简单,易于实现。反传网络是一种典型的前向网络。

(2)反馈网络 网络内神经元间有反馈,可以用一个无向的完备图表示。这种神经网络的信息处理是状态的变换,可以用动力学系统理论处理。系统的稳定性与联想记忆功能有密切关系。Hopfield网络、波耳兹曼机均属于这种类型。

2.1.2 人工神经网络的概念

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权值,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。

输入 加权求和 阈值 传递函数 输出 ... ?

...

图2-1 人工神经元的一般模型

? f(x)

6

yi?f(xi)?f??wipjj?1ni??i?

由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理[4]。

2.2人工神经网络的基本特征

人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。人工神经网络具有四个基本特征:

(1)非线性 非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性可以提高容错性和存储容量。

(2)非局限性 一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。

(3)非常定性 人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。

(4)非凸性 一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。

人工神经网络中,神经元处理单元可表示不同的对象,例如特征、字母、概念,或者一些有意义的抽象模式。网络中处理单元的类型分为三类:输入单元、

[4]马锐,人工神经网路原理[M].北京:机械工业出版社.2010.

7

输出单元和隐单元。输入单元接受外部世界的信号与数据;输出单元实现系统处理结果的输出;隐单元是处在输入和输出单元之间,不能由系统外部观察的单元。神经元间的连接权值反映了单元间的连接强度,信息的表示和处理体现在网络处理单元的连接关系中。人工神经网络是一种非程序化、适应性、大脑风格的信息处理,其本质是通过网络的变换和动力学行为得到一种并行分布式的信息处理功能,并在不同程度和层次上模仿人脑神经系统的信息处理功能。它是涉及神经科学、思维科学、人工智能、计算机科学等多个领域的交叉学科。

输入层 隐层 输出层

X Y 阈值 隐层单元 权值 图2-2 基础人工神经网络示意图

人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点。

2.3人工神经网络的工作原理

人工神经网络是对人类神经系统的一种模拟。尽管人类神经系统规模宏大、结构复杂、功能神奇,但其最基本的处理单元却只有神经元。人工神经系统的功能实际上是通过大量神经元的广泛互连,以规模宏伟的并行运算来实现的。

基于对人类生物系统的这一认识,人们也试图通过对人工神经元的广泛互连

8

来模拟生物神经系统的结构和功能。人工神经元之间通过互连形成的网络称为人工神经网络。在人工神经网络中,神经元之间互连的方式称为连接模式或连接模型。它不仅决定了神经元网络的互连结构,同时也决定了神经网络的信号处理方式。

2.3.1 生物神经元结构与功能

人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。神经元也和其他类型的细胞一样,包括有细胞膜、细胞质和细胞核。但是神经细胞的形态比较特殊,具有许多突起,因此又分为细胞体、轴突和树突三部分。细胞体内有细胞核突起的作用是传递信息。

兴奋神经元 抑制神经元 来自其他神经元的信息 阈值 膜电位 细胞膜 图2-1生物神经元的信息传递与处理示意图

细胞体由细胞核、细胞质和细胞膜等组成,其直径大约为0.5--100μm,大小不等。细胞体是神经元的主体,用于处理由树突接受的其它神经元传来的信号。

9

(1)细胞体 (2)树突 (3)轴突 (4)突触

图2-2简单神经元网络图

轴突是由细胞体向外延伸出的所有纤维中最长的一条分枝,用来向外传递神经元产生的输出电信号。每个神经元都有一条轴突,其最大长度可达1m以上。在轴突的末端形成了许多很细的分枝,这些分支叫神经末梢。每一条神经末梢可以与其它神经元形成功能性接触,该接触部位称为突触。所谓功能性接触,是指非永久性的接触,这正是神经元之间传递信息的奥秘之处。

树突是指由细胞体向外延伸的除轴突以外的其它所有分支。树突的长度一般较短,但数量很多,它是神经元的输入端,用于接受从其它神经元的突触传来的信号。

神经元中的细胞体相当于一个初等处理器,它对来自其它各个神经元的信号进行总体求和,并产生一个神经输出信号。

突触可分为兴奋性与抑制性两种类型,它相应于神经元之间耦合的极性。每个神经元的突触数目正常,最高可达10个。各神经元之间的连接强度和极性有所不同,并且都可调整、基于这一特性,人脑具有存储信息的功能。利用大量神经元相互联接组成人工神经网络可显示出人的大脑的某些特征。

细胞膜内外的电位之差被称为膜电位。在无信号输入时的膜电位称为静止膜电位。当一个神经元的所有输入总效应达到某个阈值电位时,该细胞变为活性细胞。

(1) 时空整合功能

神经元对不同时间通过同一突触传入的神经冲动,具有时间整合功能。对于

10

同一时间通过不同突触传入的神经冲动,具有空间整合功能。两种功能相互结合,使生物神经元对由突触传入的神经冲动具有时空整合的功能。

(2) 兴奋与抑制状态

神经元具有兴奋和抑制两种常规的工作状态。当传入冲动的时空整合结果使细胞膜电位升高,超过动作电位的阈值时,细胞进入兴奋状态,产生神经冲动。相反,当传入冲动的时空整合结果使细胞膜电位低于动作电位的阈值时,细胞进入抑制状态,无神经冲动输出。 (3) 脉冲与电位转换

突触界面具有脉冲/电位信号转化功能。沿神经纤维传递的信号为离散的电脉冲信号,而细胞膜电位的变化为连续的电位信号。这种在突触接口处进行的“数/模”转换,是通过神经介质以量子化学方式实现的如下过程:

电脉冲----神经化学物质----膜电位 (4)神经纤维传导速率

神经冲动沿神经纤维传导的速度在1---150m/s之间。其速度差异与纤维的粗细、髓鞘的有无有关。一般来说,有髓鞘的纤维,其传导速度在100m/s以上,无髓鞘的纤维,其传导速度可低至每秒数米。

(5)突触延时和不应期

突触对相邻两次神经冲动的响应需要有一定的时间间隔,在这个时间间隔内不响应激励,也不传递神经冲动,这个时间间隔称为不应期。 2.3.2人脑神经系统的结构与特征

神经生理学的研究结果表明,人脑的神经系统是一个由大量生物神经元并行互连所形成的一个网络系统。每个人的大脑大约有1011---1012个神经元,每个神经元大约有103---104个突触,即与其它103---104个神经元相连。

(1) 记忆和存储功能

人脑神经系统的记忆和处理功能是有机的结合在一起的。神经元既有存储功能,又有处理功能,它在进行回忆时不仅不需要先找到存储地址再调出所存内容,而且还可以由一部分内容恢复全部内容。尤其是当一部分神经元受到损坏(例如脑部受伤等)时,它只会丢失损坏最严重部分的那些信息,而不会丢失全部存储信息。

11

(2) 高度并行性

提供了非常巨大的存储容量和并行度。例如,人可以非常迅速地识别出一幅十分复杂的图像。

(3) 分布式功能

人们通过对脑损坏病人所做的神经心理学研究,没有发现大脑中的哪一部分可以决定其余所有各部分的活动,也没有发现在大脑中存在有用于驱动和管理整个智能处理过程的任何中央控制部分。人类大脑的各个部分是协同工作、相互影响的,并没有哪一部分神经元能对智能活动的整个过程负有特别重要的责任。可见,在大脑中,不仅知识的存储是分散的,而且其控制和决策也是分散的。因此,大脑是一种分布式系统。

(4) 容错功能

容错性是指根据不完全的、有错误的信息仍能做出正确、完整结论的能力。大脑的容错性是非常强的。例如,我们往往能够仅由某个人的一双眼睛、一个背影、一个动作或一句话的音调,就能辨认出来这个人是谁。

(5) 联想功能

人脑不仅具有很强的容错功能,还有联想功能。善于将不同领域的知识结合起来灵活运用,善于概括、类比和推理。例如,一个人能很快认出多年不见、面貌变化较大的老朋友。

(6) 自组织和自学习功能

人脑能够通过内部自组织、自学习能力不断适应外界环境,从而可以有效地处理各种模拟的、模糊的或随机的问题。

在人工神经网络中,改变信息处理及能力的过程,就是修改网络权值的过程。 人工神经元之间通过互相联接形成网络,称为人工神经网络,人工神经元的主要结构单元是信号的输入、综合处理和输出,输出信号强度大小反映了该神经元对相邻神经元影响的强弱,神经元之间相互联接的方式称为联接模式,相互之间的联接强度由联接权值体现。

人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为

12

却是极其丰富多彩的。

人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。

所以网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。

如果输出为“0”(即结果错误),则把网络连接权值朝着减小综合输入加权值的方向调整,其目的在于使网络下次再遇到“A”模式输入时,减小犯同样错误的可能性。如此操作调整,当给网络轮番输入若干个手写字母“A”、“B”后,经过网络按以上学习方法进行若干次学习后,网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功,它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时,能够作出迅速、准确的判断和识别。一般说来,网络中所含的神经元个数越多,则它能记忆、识别的模式也就越多。

拓扑结构的单隐层前馈网络,一般称为三层前馈网或三层感知器,即:输入层、中间层(也称隐层)和输出层。它的特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络。

2.4人工神经网络的分析方法

研究神经网络的非线性动力学性质,主要采用动力学系统理论、非线性规划理论和统计理论,来分析神经网络的演化过程和吸引子的性质,探

13

索神经网络的协同行为和集体计算功能,了解神经信息处理机制。为了探讨神经网络在整体性和模糊性方面处理信息的可能,混沌理论的概念和方法将会发挥作用。混沌是一个相当难以精确定义的数学概念。一般而言,“混沌”是指由确定性方程描述的动力学系统中表现出的非确定性行为,或称之为确定的随机性。“确定性”是因为它由内在的原因而不是外来的噪声或干扰所产生,而“随机性”是指其不规则的、不能预测的行为,只可能用统计的方法描述。混沌动力学系统的主要特征是其状态对初始条件的灵敏依赖性,混沌反映其内在的随机性。混沌理论是指描述具有混沌行为的非线性动力学系统的基本理论、概念、方法,它把动力学系统的复杂行为理解为其自身与其在同外界进行物质、能量和信息交换过程中内在的有结构的行为,而不是外来的和偶然的行为,混沌状态是一种定态。混沌动力学系统的定态包括:静止、平稳量、周期性、准同期性和混沌解。混沌轨线是整体上稳定与局部不稳定相结合的结果,称之为奇异吸引子。一个奇异吸引子有如下一些特征:

(1)奇异吸引子是一个吸引子,但它既不是不动点,也不是周期解; (2)奇异吸引子是不可分割的,即不能分为两个以及两个以上的吸引子;

(3)它对初始值十分敏感,不同的初始值会导致极不相同的行为。

3. 人工神经网络BP模型

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络[5],是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。

[5]胡守仁,余少波,戴葵,神经网络导[M].长沙:国防科技大学出版社,1992.

14

输出层 输出神经元

隐含层 隐含神经元

输入层 输入神经元

图3-1 典型的神经网络结构

3.1 BP神经网络的概念

在人工神经网络发展历史中,很长一段时间里没有找到隐层的连接权值调整问题的有效算法。直到误差反向传播算法(BP算法)的提出,成功地解决了求解非线性连续函数的多层前馈神经网络权重调整问题。

BP神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

3.2 BP网络模型的类型

BP神经网络模型BP网络模型包括其输入输出模型、作用函数模型、

15

误差计算模型和自学习模型。 (1) 节点输出模型 隐节点输出模型: Oj?f(?Wij?Xi?qi) (1) 输出节点输出模型:Yk?f(?Tjk?Oj?qk)(2) f-非线形作用函数;q -神经单元阈值。 输入层 隐含层 输出层 图3-2典型BP网络结构模型 (2) 作用函数模型 作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,一般取为(0,1)内连续取值Sigmoid函数: f(x)?1 (3) 误差计算模型 误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数: Ep?1/2??(1?e) (t?o)pipi2 tpi- i节点的期望输出值;Opi-i节点计算输出值。 16

(4) 自学习模型

神经网络的学习过程,即连接下层节点和上层节点之间的权重拒阵Wij的设定和误差修正过程。BP网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。自学习模型为

?Wij(n?1)?h??i?Oj?a??Wij(n)

h -学习因子;?i-输出节点i的计算误差;Oj-输出节点j的计算输出;

a-动量因子。

3.3 BP学习算法

BP 算法因其简单、易行、计算量小、并行性强等优点,是目前神经网络训练采用最多也是最成熟的训练算法之一[6]。BP 算法的实质是求解误差函数的最小值问题,由于它采用非线性规划中的梯度下降法( Gradient Descent) ,按误差函数的负梯度方向修正权值。其主要思路是求出训练网络的指标函数误差:

E???(Yk?Ct)/2tk?1t?1mq2

一般的BP 算法称为标准误差逆传播算法,也就是对应每一次输入都校正一次权值。这种算法不是全局误差意义上的梯度下降计算。对各个神经元的输出求偏导数,那么就可以算出误差EP 对所有联结权值的偏导数,从而可以利用梯度下降法来修改各个联结权值。真正的全局误差意义上的梯度下降算法是在全部训练模式都学习完后才校正联结权和阈值。

其计算流程如下图3-3所示

[6]胡金滨,唐旭清.人工神经网络的BP算法及其应用[J].信息技术,2004 (4):1~4.

17

开始 网络初始化 给定输入量和目标输出 完成 Yes,进入工作状态 学习 NO 求隐含层和输出层各单元输出 计算目标与实际输出 值的偏差E Yes 所有单元的e Yes 求输 E满足要求? 满足 要求? 出向量

No 计算隐含层单元误差 No 调整学习效率 给出结果 调整中间层到输出层的联结权值和输 出层单元的阈值 调整输出层到中间层的联接权值和中 间层单元的阈值 学习完成 图3-3 BP 算法流程图

18

3.4 BP神经网络的应用及不足

神经网络可以用作分类、聚类、预测等。神经网络需要有一定量的历史数据,通过历史数据的训练,网络可以学习到数据中隐含的知识。在你的问题中,首先要找到某些问题的一些特征,以及对应的评价数据,用这些数据来训练神经网络。

虽然BP网络得到了广泛的应用,但自身也存在一些缺陷和不足,主要包括以下几个方面的问题。

首先,由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。对于一些复杂问题,BP算法需要的训练时间可能非常长,这主要是由于学习速率太小造成的,可采用变化的学习速率或自适应的学习速率加以改进。

其次,BP算法可以使权值收敛到某个值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,可以采用附加动量法来解决。

再次,网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据经验或者通过反复实验确定。因此,网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。

最后,网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚类做的比较好的权值保存。

4.人工神经网络RBF模型

4.1 RBF神经网络的概念

RBF神经网络是一种具有拓扑结构的前向神经网络.由输入层、隐含层、输出层构。

RBF神经网络以径向基函数(RBF)作为隐层单元的基,构成隐含层空间,隐含层对输入矢量进行变换将低维的模式输入数据变换到高维空间内, 使得在低维空间内的线性不可分问题在高维空间内线性可分。

19

4.2 径向基函数(RBF)网络结构和模型

径向基函数是20世纪80年代末由J.Moody和C.Darken提出的网络模型,它模拟了人脑中局部调整、相互覆盖感受野( receptive field),因此是一种局部逼近网络,科学界已经证明它能以任意精度逼近任意函数。

输出 输出层

… ?i(x) 隐藏层 … 输入 输出层

图4-1 RBF网络结构图

径向基函数(RBF)神经网络,是具有单隐层的三层前馈网络,结构见图4-1。由于它模拟了人脑中局部调整、相互覆盖接收域的神经网络结构,因此,是一种局部逼近网络,已证明它能以任意精度逼近任一连续函数。

U … y … …

图4-3 RBF神经网络结构模型

RBF网络的神经元模型是改进了感知器神经元模型得到的。 输入层: wij?1,f(x)?x

20

隐层: f(net)?e??(net??)22?2 一维

f(X)?(xi??i)2T(xi??i)e?j2 二维

输出层: f(x)?kx u1 w1 ... x y u2 ?

... un wn

? f(x)

图4-4 RBF神经元结构模型

径向基神经网络与BP网络在结构上基本相同,区别在于RBF网络隐含层节点传输函数为径向基函数,即隐含层节点对输入产生局部响应,此RBF常被称为局部感受野网络。径向基函数表现为多种形式,常见的为高斯函数。

4.3 RBF的网络学习算法

RBF网络的学习算法,由两部分组成;无导师学习、有导师学习。

根据学习时是否需要外部指导信息,通常将神经网络的学习分为二种类型: 有导师学习:必须预先知道学习的期望结果——教师信息,并依此按照某一学习规则来修正权值。

无导师学习:不需要教师信息或强化信号,只要给定输入信息,网络通过自组织调整,自学习并给出一定意义下的输出相应。 4.3.1 无导师学习

对所有输入样本进行聚类,求得各隐层节点的RBF的中心。介绍用k--均值聚类算法调整中心。

21

(1) 聚类

聚类分析符合“物以类聚,人以群分”的原则,把相似性大的样本聚集为一个类型,在特征空间里占据着一个局部区域。类型越多,这样的具备区域就越多。每个局部区域都形成一个聚合中心,往往以聚合中心代表相应的类型。

聚类分析算法可以自动地确定类型的数目K,不必以预知K为前提条件。当然,也可以给定K作为算法终止的条件。如果没有给定K,如何在聚类过程中自动的确定K,是聚类分析中的一个关键性的问题。

(2) 相似性度量

如何衡量样本相似性,对聚类有直接影响。通常使用距离相似性度量和角度相似性度量。

距离相似性度量:一个模式样本,在它的特征空间里是一个点。如果模式的特征是适当选择的,即各维特征对于分类来说都是等效的,那么,同一类的模式样本就密集的分布在一个区域里,不同类的模式样本就会远离。因此,点间距离远近反映了相应模式样本所属类型有无差异,可以作为样本相似性度量。点间距离近,则样本相似性大,它们属于同一个类型;否则,它们属于不同的类型。

在聚类分析中,最经常使用的就是距离相似性。 欧式(Euclidean)距离

欧式距离又称为距离,模式样本向量x和y之间的欧式距离定义为:

defD(x,y)?x?y??x?yii?1d2i

其中d为特征空间的维数。显然,若样本x和y位于同一个类型区域里,欧式距离是比较小的;若它们位于不同类型的区域里,则是比较大的。

马氏(Mahalanobis)距离

我们已经知道马氏距离的定义,可以表达为:

r2?(x??)?T?1(x??)

明氏(Minkowsky)距离:

D(x,y)def?x?yii?1d?i

4.3.2 有导师学习

22

当ci确定后,训练由隐层至输出层间的权系值,它是线性方程组,则求权系值成为线性优化问题,可利用各种线性优化算法求得,如:LMS算法、最小二乘递推法、镜像映射最小二乘法等。

(1) LMS算法

wki(t?1)?wki(t)??ek(t)qip2LMS算法即规则,对于本网络权值调整算法:

qp?:常值,0???2。当 J(t)??,算法结束。

(2) 最小二乘递推法(RLS)。 (3) 镜像映射最小二乘法。

4.4 RBF网络模型的优点和缺点

4.4.1 RBF网络的优点

(1)它具有唯一最佳逼近的特性,且无局部极小问题存在;

(2)RBF神经网络具有较强的输入和输出映射功能,并且理论证明在前向网络中RBF网络是完成映射功能的最优网络; (3)网络连接权值与输出呈线性关系; (4)分类能力好;

(5)学习过程收敛速度快。 4.4.2 RBF网络的缺点

(1)最严重的问题是没能力来解释自己的推理过程和推理依据;

(2)不能向用户提出必要的询问,而且当数据不充分的时候,神经网络就无法进行工作;

(3)把一切问题的特征都变为数字,把一切推理都变为数值计算,其结果势必是丢失信息;

(4)理论和学习算法还有待于进一步完善和提高。

RBF神经网络的非线性映射能力体现在隐层基函数上, 而基函数的特性主要由基函数的中心确定,从数据点中任意选取中心构造出来的RBF 神经网络的性能显然是不能令人满意的目的;

(5)RBF神经网络用于非线性系统建模需要解决的关键问题是样本数据的选

23

择L 在实际工业过程中, 系统的信息往往只能从系统运行的操作数据中分析得到, 因此如何从系统运行的操作数据中提取系统运行状况信息, 以降低网络对训练样本的依赖, 在实际应用中具有重要的价值。

5.基于人工神经网络的空调系统故障预测

5.1 用BP网络对空调系统故障进行预测

5.1.1 空调系统故障诊断的BP网络建立

空调系统故障模式及故障机制分析[7][8],如下表所示:

表5-1 空调系统故障模式及故障机制分析

表示符号 x1 房间温度均偏高 y4 y5 y6 x2 x3 相对湿度均偏低 系统实测风量大于设计风量 x4 房间气流速度超过允许流速 y7 y8 y9 y10 y11 y12 故障模式 表示符号 y1 y2 y3 故障原因 1. 冷冻机产冷量不足 2. 喷水堵塞 3. 通过空气处理设备的风量过大, 热交换不良 4. 回风量大于送风量 5. 送风量不足(可能空气过滤气堵塞) 6. 表冷器结霜,造成堵塞 7. 室外空气未经加湿处理 8. 系统的实际阻力小于设计阻力 9. 设计时选用风机容量偏大 10. 送风口速度过大 11. 总送风量过大 12. 送风口的型式不适合

5.1.2 网络输入输出向量及参数的选取

以故障模式X = ( x 1 , x 2 , x 3 , x4) 作为输入,故障原因Y = ( y1 , y2 , y3 ?y12 ) 作为输出, 以不同的故障原因导致的故障模式为训练样本进行学习,从而建立故障模式与故障原因之间的映射关系。x 1 , x 2 , x3 , x4 分别代表故障房间温度均偏高、

[7]余江海.一种制冷系统故障诊断方法[C].上海交通大学硕士论文,2001.

[8]中国机械工程学会设备维修分会,机械设备维修问答丛书,编委会空调制冷设备维修问答[M].北京:机械

工业出版社.1988.

24

相对湿度均偏低、系统实测风量大于设计风量和房间气流速度超过允许流速的4 种故障现象; y1 , y2 ,?, y12分别代表冷冻机产冷量不足;喷水堵塞??送风口的型式不适合等故障原因。

5.1.3 网络结构及训练样本的选取

空调系统故障诊断的神经网络模型分为3 层,分别为输入层、隐含层和输出层。输入层节点个数为4 ,对应于4 个故障现象,输出层节点个数为12 ,对应于12 个故障原因。输出节点值的大小反映了故障出现的可能性。隐含层节点的个数可参照公式初步选取[9]:

A?M?N??,

其中M 为输出节点数, N 为输入节点数, ?为1 至10 的常数,在此,选取16 个隐含层节点。

输入单元数为4 个, 输出单元数为12 个。隐含层单元个数凭经验选取, 一般取4~5 个隐含节点对应一个输入节点, 这里选4 个, 则隐含层节点为4 ×4 = 16 个,网络共32 个节点。各单元的输入与输出的特征函数采用Sigmoid 函数,即隐含层第j 个神经元的输入为netj?Qj?1??Wjixi, 输出Oj 为:

1e?(netj?θj)/θo

式中θj 表示阈值,θ0 的作用是调节Sigmoid 函数的形状。 取4 个训练样本,具体如表5-2 所示。

( x 1 ,x 2 ,x3 , x4) = (1 , 0 , 0 , 0) 表示房间温度均偏高的故障模式;

( y1 , y2 , y3 ?y12 ) = ( 1 , 1 , 1 , 1 , 1 , 1 , 0 , 0 ,??) 表示房间温度均偏高的故障原因。

[9]宋桂荣.改进BP算法在故障诊断中的应用[N].沈阳工业大学学报,2001 (3):252~254.

25

表5-2 BP 网络的训练样本表

样本序号 1 2 3 4

故障模式 故障原因 x 1 x 2 x 3 x 4 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 1 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 1 5.1.4 网络的训练与检验

我们以给定模式作为网络的输入,要求网络通过调节所有的联结权系数和各神经元的阈值,使得在输出层神经元上得到理想的结果;然后再给出另一个模式,要求网络继续完成对这对模式的学习。当系统的平均误差E 满足下式即可完成训练:

mqE???(Yk?1t?1k/2??

t?Ct)2

式中:Yt是对应于第k 个样本、第t 个输出节点的期望输出值Ct 是第t 个输出节点的实际输出值。根据程序框图及BP 算法,运用神经网络工具箱进行样本训练。

计算程序如下:

P = [1 0 0 0 ;0 1 0 0 ;

0 0 1 0 ;0 0 0 1 ] ;

T = [1 0 0 0;1 0 0 0 ;

1 0 0 0;1 0 0 0 ; 1 0 0 0;1 0 0 0 ; 0 1 0 0;0 0 1 0 ; 0 0 1 0;0 0 0 1 ; 0 0 0 1;0 0 0 1]

net =newff (minmax (P) ,[ 16 ,12 ] ,

26

k{‘tansig’‘, purelin’}‘, t raingda’);

net. trainParam.show = 200; net. trainParam. lr= 0.05 ; net. trainParam.epochs = 2000; net.trainParam. goal = 1e-5 ;

[ net ,t r ] =train(net ,P ,T)

计算结束后,网络达到收敛,其训练收敛过程,如图5-2 所示:

图5-2 BP网络梯度下降法收敛图

最后用非训练样本测试网络的判断能力,测试结果如表5-3所示:

27

表5-3 测试结果1

样本序号 故障模式 x1 x2 x3 x4 故障原因 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12

1 2 3 4 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0.9997 -0.0000 -0.0003 0.0002 1.0026 0.0058 0.0022 -0.0069 1.0006 0.0013 0.0011 -0.0018 1.0005 0.0018 0.0016 -0.0021 0.9973 -0.0055 -0.0018 0.0067 -0.9992 -0.0019 -0.0012 0.0023 -0.0001 -0.9985 -0.0016 0.0016 -0.0007 -0.0018 1.0000 0.0020 0.0007 0.0025 1.0015 -0.0026 0.0009 0.0041 0.0029 0.9950 0.0037 0.0074 0.0023 0.9908 -0.0000 0.0028 0.0025 0.9973 5.2 空调系统故障诊断的RBF网络建立

5.2.1空调系统故障诊断的RBF网络建立

空调系统故障模式及故障机制分析如表5-1所示

RBF网络主要包含隐含层和输出层,其中隐含层的传递函数为radas,输出层的传递函数为纯线性函数purelin。RBF网络的隐含层有S1个神经元,输出层有S2个神经元.

5.2.2 RBF网络的向量参数的选取与训练

其完成如下非线性映射:

nfn(X)?w0??w?(ii?1X?ci)

其中, x?Rn是输入矢量,?(?)是一个R??R的非线性函数, 一般取高

斯型函数 ?(X?ci)?exp(?X?c2i?2i)

RBF神经网络中待定的参数有两类: 一类是基函数的中心ci 和宽度?i 以及中心数目n, RBF神经网络的非线性映射能力体现在隐层基函数上, 其特性主

28

要由基函数的中心确定;另一类为输出层与隐层之间的连接权重。当基函数中心ci 和宽度?以及数目n 确定之后, 网络输出对输出层权参数是线性的, 可以采用最小二乘法求得。因此ci , ?i , n 的确定是建立RBF 神经网络的关键。 经过计算,得到:

表5-4 测试结果2

样本序号 故障模式 x1 x2 x3 x4 故障原因 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 1 2 3 4 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0.9999 -0.0000 -0.0002 0.0002 1.0026 0.0058 0.0012 -0.0069 1.0006 0.0013 0.0011 -0.0018 1.0005 0.0018 0.0016 -0.0021 0.9973 -0.0055 -0.0018 0.0067 -0.9992 -0.0019 -0.0011 0.0023 -0.0001 -0.9985 -0.0016 0.0016 -0.0008 -0.0018 1.0000 0.0020 0.0007 0.0025 1.0014 -0.0026 0.0009 0.0040 0.0029 0.9950 0.0037 0.0074 0.0023 0.9901 -0.0000 0.0027 0.0024 0.9977 5.3 小结

由此可见,与相同的样本数和精度要求下, RBF神经网络的隐层神经元数要大大多于BP网络, 这体现在网络的复杂度要高于BP网络。传统的信息处理方法不同,人工神经网络是自适应和可以被训练的,它有自修改能力,同时有对信息并行处理及并行推理的能力,从原理上就比传统的方法要快得多,并且具有高度的非线性、模拟并行性、高度容错性、鲁棒性、自联想自学习和自适应等许多特点。因此,把人工神经网络对故障预测技术引入,只需建立神经网络模型统计一些东西就可以轻松预测出空调故障的位置,大大缩短了空调维修的时间。

在理论上.RBF网络和BP网络一样能以任意精度逼近任何非线性函数。但由于它们使用的激励函数不同,其逼近性能也不相同。Poggio和Girosi已经证明,RBF网络是连续函数的最佳逼近,而BP网络不是。BP网络使用的Sigmoid

29

函数具有全局特性,它在输入值的很大范围内每个节点都对输出值产生影响,并且激励函数在输入值的很大范围内相互重叠,因而相互影响,因此BP网络训练过程很长。此外,由于BP算法的固有特性,BP网络容易陷入局部极小的问题不可能从根本上避免,并且BP网络隐层节点数目的确定依赖于经验和试凑,很难得到最优网络。采用局部激励函数的RBF网络在很大程度上克服了上述缺点,RBF不仅有良好的泛化能力,而且对于每个输入值,只有很少几个节点具有非零激励值,因此只需很少部分节点及权值改变。学习速度可以比通常的BP算法提高上千倍,容易适应新数据,其隐层节点的数目也在训练过程中确定,并且其收敛性也较BP网络易于保证,因此可以得到最优解[10][11]。

从上面所示的结果来看,主要有一下几方面的不同:

(1)由于学习速率是固定的,因此BP网络的训练过程较长,当需要处理较复杂的问题时,需要的时间很长。而RBF网络的建网过程即是训练过程此外,训练时间较少.精度也比较高。

(2)在处理同一问题时,通常情况BP网络所需的神经元个数比RBF网络要少。 (3)BP网络的输出和初始的权值有关,而RBF网络的输出与初始的权值无关。 (4)RBP网络隐含层的层数和单元数的选择要凭借经验反复验证,因此网络的冗余性比较大。RBF隐层节点的数目也在训练过程中确定。但是要确定径向基函数的分布密度。

隐层基函数的中心是在输入样本集中选取的, 这在许多情况下难以反映出系统真正的输入输出关系, 并且初始中心点数太多; 另外优选过程会出现数据病态现象。

6. 结论

6.1 结论

人工神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。可以通过神经网络对事物进行预测从而用简单的方法完成复杂的问题。

[10]智会强,牛坤,田亮等.BP网络和RBF网络在函数逼近领域内的比较研究[J].科技通报,2005 (2).

[11]刘永,张立毅.BP网络与RFB神经网络的实现及其性能比较[J].电子测量技术研究设计,2007(4):77~

80.

30

神经网络可以很容易的解决具有上百个参数的问题(当然实际生物体中存在的神经网络要比我们这里所说的程序模拟的神经网络要复杂的多)。神经网络常用于两类问题:分类和回归。在结构上,可以把一个神经网络划分为输入层、输出层和隐含层。输入层的每个节点对应一个个的预测变量。输出层的节点对应目标变量,可有多个。在输入层和输出层之间是隐含层,隐含层的层数和每层节点的个数决定了神经网络的复杂度。

人工神经网络的构筑理念是受到生物(人或其他动物)神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法(Learning Method)得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势。

6.2注意事项

在使用神经网络时有几点需要注意:

第一,神经网络很难解释,目前还没有能对神经网络做出显而易见解释的方法学。

第二,神经网络会学习过度,在训练神经网络时一定要恰当的使用一些能严格衡量神经网络的方法,如前面提到的测试集方法和交叉验证法等。这主要是由于神经网络太灵活、可变参数太多,如果给足够的时间,他几乎可以“记住”任何事情。

第三,除非问题非常简单,训练一个神经网络可能需要相当可观的时间才能完成。当然,一旦神经网络建立好了,在用它做预测时运行时还是很快得。

第四,建立神经网络需要做的数据准备工作量很大。一个很有误导性的神话就是不管用什么数据神经网络都能很好的工作并做出准确的预测。这是不确切的,要想得到准确度高的模型必须认真的进行数据清洗、整理、转换、选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这

31

一点。比如神经网络要求所有的输入变量都必须是0~1(或-1~-+1)之间的实数,因此像“地区”之类文本数据必须先做必要的处理之后才能用作神经网络的输入。

6.3 人工神经网络的局限性

人工神经网络是一个新兴学科,因此还存在许多问题。其主要表现有: (1) 受到脑科学研究的限制:由于生理实验的困难性,因此目前人类对思维和记忆机制的认识还很肤浅,还有很多问题需要解决; (2) 还没有完整成熟的理论体系; (3) 还带有浓厚的策略和经验色彩; (4) 与传统技术的接口不成熟。

上述问题的存在,制约了人工神经网络研究的发展。

相信只要能客服这些局限性,人工神经网络的发展将不可限量。

参考文献

[1] 朱大奇.人工神经网络研究现状及其展望[N].江南大学学报,2004:103~108. [2] 董军,胡上序.混沌神经网络研究进展和展望[J].信息与控制,1997 (5):360~368. [3] 韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002. [4] 马锐.人工神经网络原理[M].北京:机械工业出版社.2010. [5] 胡守仁,余少波,戴葵.神经网络导[M].长沙:国防科技大学出版社,1992. [6 ]胡金滨,唐旭清.人工神经网络的BP算法及其应用[J].信息技术,2004 (4):1~4. [7] 余江海.一种制冷系统故障诊断方法[C].上海交通大学硕士论文,2001.

[8] 中国机械工程学会设备维修分会,机械设备维修问答丛书,编委会空调制冷设备维修问答[M].北京:机

械工业出版社.1988.

[9] 宋桂荣.改进BP算法在故障诊断中的应用[N].沈阳工业大学学报,2001 (3):252~254.

[10] 智会强,牛坤,田亮等.BP网络和RBF网络在函数逼近领域内的比较研究[J].科技通报,2005 (2). [11] 刘永.张立毅.BP网络与RFB神经网络的实现及其性能比较[J].电子测量技术研究设计,2007 (4):77~

80.

Prediction Based on Artificial Neural Network

Abstract: With the great development and the wide application of internet, the artificial neural network had been using widely by more kinds of fields. This paper introduces the basic principle and the concept of artificial neural network, then detail introduces the back-propagation algorithm and RBF algorithm introduction and Application. BP is the error back propagation BP algorithm, RBF network is

32

feed forward network propagation .Finally, the paper cites the failure example of the air-conditioning system. The paper built the air-conditioning system fault in the BP and RBF model and conduct the network input/output , parameters selection, the network structure ,the selection of training samples and the network training and testing. Finally the application of BP algorithm and RBF algorithm in fault diagnosis of the air - conditioning system is researched.Drawn from the same sample size and accuracy requirement, neural network hidden layer neuron number to significantly more than BP network. And the paper analyzs the result of experimental. The last, the paper has a summary of paper to elaborate the future of the artificial neural network.

Key Words: ANN, PB, RBF, Fault diagnosis.

33

本文来源:https://www.bwwdw.com/article/mc2p.html

Top