EMD信号分析方法端点效应分析

更新时间：2024-05-10 15:22:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

emd信号分解推荐度：
相关推荐

西南交通大学本科毕业设计（论文）

EMD信号分析方法端点效应分析

年级:2005级学号:20051198 姓名:郭云喜

专业:测控技术与仪器指导老师:宁静

2009年6月

西南交通大学本科生毕业设计（论文）第I页

院系机械工程学院专业测控技术与仪器年级 2005级姓名郭云喜

题目 EMD信号分析方法端点效应分析

指导教师

评语

指导教师 (签章)

评阅人

评语

评阅人 (签章)

成绩

答辩委员会主任 (签章)

年月日

西南交通大学本科毕业设计(论文) 第II页

毕业设计（论文）任务书

班级测控二班学生姓名郭云喜学号 20051198 发题日期： 2009 年4月27日完成日期： 6月15日

题目 EMD信号分析方法端点效应分析 1、本论文的目的、意义经验模态分解（EMD）是一种新的信号分析方法，运用EMD方法对信号进行分析，把复杂的信号分解成若干个IMF分量之和。使用BP神经网络对信号进行训练、延拓，以抑制端点效应对信号EMD分解的影响，然后同样进行EMD分析，再同之前未经过训练、延拓的信号进行对比，以验证BP神

经网络延拓对抑制端点效应的可行性和有效性。 2、学生应完成的任务（1）查阅资料了解希尔伯特黄变换以及EMD方法。

（2）熟悉MATLAB编程语言，能使用它进行信号分析。

（3）选择信号处理方案，了解神经网络。

（4）用选择的方案编程，对信号进行相关的分析处理。 3、论文各部分内容及时间分配：（共 12 周）

第一部分查阅希尔伯特黄变换和EMD方法的相关资料，从总体上了解毕业设计的主要要求。（2周）

第二部分熟悉需要用到的相关软件的使用。（3周）第三部分编写和调试设计中的各种程序。（4周）

西南交通大学本科毕业设计(论文) 第III页

第四部分针对毕业设计系统里面的出现问题进行修改和完成毕业论文的撰写。（2周）评阅及答辩

指导教师：宁静 2009年 4月 27日毕业论文答辩和论文的后续修改。（1周）

审批人：

年月日

西南交通大学本科毕业设计(论文) 第IV页

摘要

经验模态分解(EMD)是一种新的处理非线性、非平稳的数据分析方法，在应用经验模态分解（EMD）处理数据的时候，端点效应成为影响该方法精度的主要因素，即在“筛分”的过程中上下包络在数据序列的两端会出现发散现象。端点效应会增加一些虚假成分，信号的总能量也随之增加。对于解决该问题，目前已经提出了多种方法。例如直接以数据端点作为极值点、多项式拟合算法、神经网络延拓算法、极值点与对称延拓相结合等多种算法。本文就神经网络中的BP神经网络对数据延拓进行分析。

首先，论文阐述了EMD、端点效应、端点延拓以及神经网络的基本概念，研究了EMD的分解原理与算法，分析了端点效应对信号分析产生的影响，并对EMD分解中应注意的问题进行了分析研究。

其次，重点阐述神经网络中的BP神经网络。相比于其他神经网络，如径向基神经网络，Elman神经网络，Hopfield神经网络等等，BP神经网络在应用上有哪些优点以及还存在有哪些不足之处，需要进行改进的。

最后，对一个仿真信号作EMD分析，用BP神经网络对该仿真信号端点延拓后再进行EMD分析，对前后分析的结果进行比较，验证了BP神经网络延拓抑制端点效应的可行性和有效性。在此基础上，对试验数据作EMD分析，同样用BP神经网络端点延拓后再进行EMD分析，再进行比较。

关键词：经验模态分解端点效应数据延拓

西南交通大学本科毕业设计(论文) 第3页希尔伯特-黄变换(HHT)是上世纪末Huang等人首次提出的一种新的信号分析理论。它的主要创新是固有模态(IMF)概念的提出和经验筛法(EMD)的引入。通过EMD，将信号分解成IMF(一般为有限数目)的和，对每个IMF进行Hilbert变换就可以获得有意义的瞬时频率，从而给出频率变化的精确表达。信号最终可以被表示为时频平面上的能量分布，称为Hilbert谱。进而还可以得到信号的边际谱。HHT是基于信号局部特征的和自适应的，因而是高效的。它特别适用于分析大量频率随时间变化的非线性、非平稳信号。变化的频率是现实生活中人们经常直观感觉到的现象，HHT的根本目的就是描述和揭示这种时变频率现象及其规律，即求信号的瞬时频率。但为了获得信号某一时刻的瞬时频率值，HHT自适应地利用了信号在该时刻的局部信息。这种表现为瞬时值，实际上自适应地隐含了信号局部信息的量称为局瞬量，将这种获得局瞬量的信号分析理论称为局瞬信号分析。为了体现这一特点，将HHT进一步称为希尔波特-黄变换局瞬信号分析(HHT-LISA)。 HHT-LISA具有重要的理论价值和广阔的应用前景，已在一些实际工程领域中获得了有效的应用。但HHT的第一篇公开文献直到1998年才发表，因而这一理论出现的时间还很短暂，其完善和发展还有诸多工作要做。HHT-LISA是现阶段一个全新的研究课题。对变化频率的研究虽然很早就已经开始，但后来的工作大都转向通过对信号的时频联合分析间接揭示这一现象，且都采用积分方法，它们的最终理论依据都基于傅里叶分析。傅里叶分析是发展最早和最成熟的信号分析理论，也是首先采用频谱分析信号的方法。但傅里叶分析中的频率是用全局的正弦波定义的，与时间无关。用傅里叶变换分析时变频率的信号会出现虚假信号和假频等缺陷。用基于傅里叶分析理论的时频联合分析也必然遭受同样的局限。并且，由于受Heise erg不确定原理的限制，时频分析不能达到精确描述频率随时间变化的目的。HHT-LISA直接研究瞬时频率和对其规律进行精确地描述，且采用微分方法，因而其应用价值大为提高。

1.3.1 希尔伯特变换

希尔伯持(Hilbert)变换是信号分析中的一种重要工具，它在研究信号的瞬时特性(瞬时振幅、瞬时相位、瞬时频率)、对已调信号进行检波、降低信号的抽样速率以及在分析非线性与非平稳信号等方面有其应用。对于一个复时间信号z(t)

＝2(t)+jx(t)，若它在t0及相邻区间内处处可导，那么称复时间信号z(t)在t0处解析。如果z(t)在区间D内每点解析，则称z(t)是D区间内的解析信号。若复时间信号z(t)为时域因果信号，则z(t)的博里叶变换z(w)为频域解析信号；若复时间信号z(t)为时域解析信号，则z(t)的傅里叶变换Z(w)为频域因果信号。希尔伯特变换理论是根据解析信号的解析性与因果性的对应关系而建立起来的。

西南交通大学本科毕业设计(论文) 第4页 1.3.1.1 连续时间信号的希尔伯特变换

设x(t)为实信号，由它构成的时域解析信号z(t)表示为

z(t)?x(t)?jx(t) （1.1）

?而z(t)傅里叶变换为

Z(?)?X(?)?jX(?) （1.2）

?由于时域解析信号z(t)与频域因果信号Z(w)的对应关系可知，X(?)应为

X(?)??jX(?) （1.3）

??将式（1.2）代入式（1.3）得

Z(?)?2X(?)，??0

Z(?)?0,??0

?为了得到时域信号x(t)的计算式，将上式表示的频域因果信号Z(?)写为如下形式

Z(?)?2X(?)U(?) （1.4）

对U(?)作奇、偶分解，得

（1.5） U(?)?12[1?sgn(?)]将式(1.5)代入式（1.4），得

Z(?)?X(?)?X(?)sgn(?) （1.6）

将式（1.6）代入式（1.5），可得频域信号X(?)的计算式为

X(?)??jX(?)sgn(?)

??若将H(?)??jsgn(?)看成系统函数，X(?)和X(?)分别看成式系统的输入、输出信号，则式（1.6）可改写为如下形式

X(?)?X(?)H(?)

?? 系统函数H(?)对输入信号X(?)所起到的作用，可以由系统函数的振幅谱和相位谱的特点看出。

H(?)??jsgn(?)??j,??0 （1.7）

H(?)??jsgn(?)??j,??0若将系统记为H(?)?H(?)ej?(?)，那么系统函数的振幅谱和相位谱可分别表示为

H(?)?1 ?(?)???22,??0 (1.8)

??(?)??,??0说明希尔伯特变换不改变X(?)的幅频特性，只改变X(?)的相频特性，即

西南交通大学本科毕业设计(论文) 第5页 90°相移。

对式（1.6）中的X(?)和H(?)分别求傅里叶反变换为

X(?)?x(t) 1H(?)??jsgn(?)??h(t)?t并根据时域褶积定理，可得希尔伯特变换的时域褶积式为

11x(?)x(t)?x(t)*??d? （1.9）

?t???t????? 将式（1.6）写成如下形式

X(?)??jX(?)sgn(?)?jX(?)sgn(??)

?并将上式两端乘以?jsgn(??)，得

?) X(?)??jX(?)sgn?(（1.10）对式（1.10）中的X(?)和?jsgn(??)分别求傅里叶反变换为

?jsgn(??)???tX(?)?x(t)???由时域褶积定理，可得希尔伯特反变换的时域褶积式为 x(t)?x(t)*??11???t???x(t)d? （1.11） ?t?????称式（1.9）和式（1.11）为连续时间信号的希尔伯特变换对，说明解析信号z(t)的实部x(t)与虚部x互为希尔伯特变换关系。 1.3.1.2 离散时间信号的希尔伯特变换

设x(n)的希尔伯特变换为x(n)，h(n)为连续时间希尔伯特变换单位冲激响应h(t)的理想抽样结果。由于抽样信号的频率响应是周期为2?的周期信号，即频域变量?在一个周期内的取值为-?～?，因此h(n)对应的离散时间傅里叶变换为

H(?)??j,0???? (1.12)

H(?)??j,?????0??求式（1.12）的离散时间傅里叶反变换，得离散时间希尔伯特变换的单位抽样相应为

西南交通大学本科毕业设计(论文) 第6页

1h(n)?2?0???jej?n1d??2???0jej?nd??1[2?e?j?n?ej?n]2?n111?(?1)n?[2?cos(n?)]?[1?cos(n?)]??2(n?),n为奇数2?n?nn? （1.13） 0?111j?nj?n?j?nj?nh(n)?jed??jed??[2?e?e]??2???2?02?n111?(?1)n?[2?cos(n?)]?[1?cos(n?)]??0，n为偶数2?n?nn?于是，离散时间信号x(n)的希尔伯特变换为 x(n)?x(n)*h(n)???x(n?2m?1) （1.14） ??mxn??(2m?1)2??由x(n)和x(n)构成的解析信号为

z(n)?x(n)?jx(n) （1.15）

?1.4 本文的主要研究内容

本文通过对某一非平稳信号在延拓前后再进行EMD时频分析，从得到的EMD分析结果中找出信号的端点效应在EMD分析过程中所产生的影响，在此基础上，并从中找到消除端点效应的方法。具体而言，本文主要的研究工作如下：

（1）阐述希尔伯特变换的基本概念及原理，连续信号与离散信号的希尔伯特变换过程以及差异，FFT的原理和概念。

（2）阐述了EMD时频分析方法的基本概念，研究了EMD的分解算法及其在分解中应注意的问题。

（3）在分析EMD原理的基础上分析了影响EMD分解精度的原因。针对EMD分解中存在的端点效应，给出利用数据序列延拓技术抑制端点效应的方法，着重分析了BP神经网络延拓法的算法实现以及存在的不足。进行仿真试验，验证了用BP神经网络延拓抑制端点效应的可行性，然后对实际数据进行延拓和EMD分析。

西南交通大学本科毕业设计(论文) 第7页

第二章 EMD时频分析方法的基本理论

2.1引言

本章首先阐述了瞬时频率的基本概念，通过对其物理意义的分析引出本征模函数的定义；然后，研究了经验模态分解(EMD)的原理，并对其分解的完备性及正交性进行了探讨，在此基础上研究了EMD分解算法的具体步骤和流程图；接着，对EMD分解所得的各个IMF分量进行Hilbert变换，得到信号的Hilbert/Huang时频谱与边际谱，并阐述了它们的物理意义；最后，对其算法及其在分解中应注意的问题进行了分析。

2.2 EMD方法的基本概念

基于EMD的时频分析主要由两个步骤组成：(1)对时间序列进行EMD分解，分解成本征模函数组；(2)对每个本征模函数进行希尔伯特变换再组合成时频谱图进行分析。

有必要先了解两个基本概念，这是掌握EMD时频分析方法的基础： (1)瞬时频率：Norden E.Huang等人分析认为，瞬时频率只对本征模函数分量才具有物理意义；

(2)本征模函数：任一信号都是由若干本征模函数(IMF)组成，EMD分解的目的就是获取各个IMF分量，为希尔伯特变换作准备。

2.2.1瞬时频率

在传统的傅立叶分析中，频率被定义为在整个数据长度中具有恒定幅度的正弦或余弦函数。作为这一定义的扩展，瞬时频率的概念也必须与正弦或余弦函数相关。根据这个逻辑，少于一个波长的长度将无法给出频率定义，而且这样的定义对于频率时刻变化的非平稳信号也将没有意义。因此提出了瞬时频率的概念。概念上，瞬时频率可以解释为一个正弦波局部最佳逼近被分析信号频率值；物理上，它仅仅对单分量信号有效，单分量信号可以理解为仅仅含有一个频率成分或者一个随时间变化的窄带分布频谱，对于多分量信号将不能保证瞬时频率随时间变化的单值性，因此把多分量信号分解成单分量信号的组合对瞬时频率的计算是必不可少的步骤。瞬时频率的比较直观的定义是解析信号相位的导数，但以往这一定义会产生一些错误的结果，导致基于瞬时频率的时频分析方法和理论始终未真正建立和发展起来。

对于给定函数x (t)，其Hilbert变换可以定义为函数x (t)与1?t的卷积

西南交通大学本科毕业设计(论文) 第8页

H[x(t)]?式中，p—积分的主值。

1?p?x(?)d? （2-1） t????~?? 令H[x(t)]?x(t)，构成解析信号Z(t)?x(t)?jx(t)，则Z(t)可表示成

Z(t)?x(t)?jx(t)?a(t)ej?(t) （2-2）其中

x(t) a(t)?x2(t)?x(t),?(t)?arctan （2-3）

x(t)~2~~~显然，a(t)和θ(t)分别表示解析信号z(t)的瞬时包络和相位。Hilbert变换定义为函数x(t)与1/πt的卷积，因而，经过Hilbert变换得到的解析信号z(t)强调了原始信号x(t)的局部特性；而其极坐标表达式进一步地表明了其局部特性，即它表示幅值与相位随时间变化的三角函数对x(t)的最佳局部拟合。将瞬时频率定义为

?(t)?d?(t) （2-4） dt由式(2-4)可知，瞬时频率是时间t的单值函数，在任意时刻，只有唯一的瞬时频率，这促使Cohen在1995年提出了“单组分函数”的概念，即式(2-4)只能表示一个单组分信号的频率。然而，没有一个明确的定义来描述“单组分”信号。由于缺乏“单组分”信号的定义，为了使瞬时频率有意义，便采用了“窄带”的要求来约束信号。

对于带宽有两种定义。第一种一般用于研究信号和波形的概率特性，其中假设信号具有稳态高斯特性。这样，带宽能定义成信号频谱矩的函数。

单位时间内，信号过零点数目可表达为

11m N0?(2)2 （2-5）

?m0单位时间内，极值点数目可表达为

1m N1?(4)2 （2-6）

?m2式中，mi——频谱的第i阶矩。带宽参数?可定义为

21m4m0?m212 N?N?2?? （2-7） 2?m2m0?221201上式给出了带宽的一个标准测量方法，对一个v=0的窄带信号，则意味着极

西南交通大学本科毕业设计(论文) 第9页值点的数目与过零点的数目相等。

Huang等人分析认为，式(2-7)是在全局意义上定义的带宽，这种定义过于严格却缺乏精确性。由于带宽的限制，通过希尔伯特变换求取解析信号相位的导数来获得有意义的瞬时频率的方法没有严格地建立起来。例如，Melville(1983)曾成功地从数据中滤出满足带宽定义限制条件的信号，但仍得到了很多没有物理意义的负的频率分量。虽然，为了得到有意义的瞬时频率，Gabor(1963)，Boashash(1992)对数据提出了限定条件：即任何一个函数要得到有意义的瞬时频率，其傅立叶变换的实部必须只有正的频率分量，Tichmarsh(1948)已在数学上证明了这个限制条件，但仍是一个全局性的定义。对于实际的数据分析，必须把这个约束条件转换成直观的、物理上可实现的步骤，为此必须把这些基于信号全局性的限定条件转化为局部的限定条件。为了探索局部的限定条件，Huang等人分析了一个简单的例子。对于正弦信号叠加一个直流分量

t?a （2-8） x(t)?sin在a=0，01三种情况下，分析其解析信号的瞬时相位及瞬时频率的变化，得出当a=0时，瞬时频率为预期常数；01时，瞬时频率出现了无意义的负值分量。

Huang等人根据这个例子说明，信号只有在它关于零均值局部对称条件下才能定义瞬时频率。对一般信号而言，任何一个叠加波局部等同于a>1的情况；任何一个非对称波局部等同于a<1(但a≠0)的情况。为了获得有意义的瞬时频率，应该用这些局部限制代替先前分析的全局要求。上述的局部限制就启示一种方法，即把信号分解为使瞬时频率有意义的各个组分，定义为本征模函数，基于这类函数的局部特性，使之在函数的任意一点瞬时频率都有意义，此即为本文所要论述的经验模态分解(EMD)方法。EMD分解方法的最大贡献是使信号符合Cohen所说的“单组分”要求，进而使式(2-4)定义的瞬时频率有物理意义。

2.2.2 特征尺度参数

描述信号特征的基本参数式时间和频率，频率能够反映信号的本质特征，但不直观。有时直接从时域观察信号的变化过程同样可以获得类似频率的信号特征，这就是特征尺度。尺度与频率式密切相关的，小的尺度对应于大的频率，大的尺度对应于小的频率，通过小波变换可以得到信号的时间-尺度谱，而不是直接的时间-频率谱。通过对信号的观察，很容易得到信号在特定要求的点之间的时间跨度，它被成为时间尺度参数。在傅里叶变换中，基函数的时间尺度参数与频率具有定量的关系，表明了谐波函数的周期长度。而对于非平稳信号，时间尺度参数是基于信号特征点的特征参数，虽然与傅里叶频谱没有定量的关系，但更

西南交通大学本科毕业设计(论文) 第10页能反映非平稳信号的特征。

时间尺度参数定义为信号在特定要求的点之间的时间跨度，数学上对于任何信号x(t)，时间尺度参数可由零点获得，信号的过零点位置为满足式（2.1）的t值，即

x(t)?0 （2.1）在两个相邻的零点之间的时间跨度就被定义为过零尺度参数。

如果通过信号的极值点定义，可以得到极值尺度参数的定义，信号的极值点位置为满足式（2.2）的t值，即

dx(t)?0 （2.2） dt尺度参数如果定义为两个相邻点的极值点之间的时间跨度，被称为极值尺度参数。

对满足线性和正态分辨的平稳信号，过零尺度参数和极值尺度参数是一致的，而对非线性、非平稳信号，采取不同的定义将会得到不同的结果。但是，无论采用哪一种尺度参数，时间跨度都只与相邻的两个特征点有关，因此反映了信号随时间变化的局部特征。在大多数情况下，采用极值尺度参数，因为对基于过零点的时间跨度测量比较困难，对一些信号有可能在两个过零点之间存在多个极值点，同时对一些没有过零点的信号将无法定义它的时间尺度参数。而基于极值点的时间跨度测量方法，不管信号是否存在过零点，都能有效的找出信号的所有模态，从某一极大值（或极小值），定义了信号的局部波动特征，这个时间跨度被称为特征尺度参数，它反映了信号不同模态的特征。

2.2.3 内禀模态函数

在Hilbert-Huang变换中，为了计算瞬时频率，定义了内禀模态函数，它是满足单分量信号物理解释的一类信号。直观上，内禀模态函数具有相同的极值点和过零点数目，其波形与一个标准正弦信号通过调幅和调频得到的新信号相似，其正式定义如下。

一个内禀模态函数必须满足下面两个条件：（1）（2）

在整个数据段内，极值点的个数和过零点的个数必须相等或相差最多不在任意时刻，由局部极大值点形成的上包络线和由局部极小值点形成的

能超过一个；

下包络线的平均值为零，即上、下包络线相对于时间轴局部对称。

第一个条件类似于高斯正态平稳过程的传统窄带要求，而第二个条件是为了保证由内禀模态函数求出的瞬时频率有意义。基于这个定义，内禀模态函数反

西南交通大学本科毕业设计(论文) 第11页映了信号内部固有的波动性，在它的每一个周期上，仅仅包含一个波动模态，不存在多个波动模态混淆的现象。

2.3 EMD方法的基本原理和算法

从上节可知，本征模函数经过希尔伯特变换能使信号的瞬时频率有意义。但是，几乎所有要分析的数据都不是本征模函数，在任意时间点上，数据可能包含多个波动模式，这就是Long等人所报道的简单的希尔伯特变换不能完全表征一般数据的频率特性的原因[50,51]。为了能把一般数据分解成本征模函数，Norden E.Huang等人基于对信号局部均值和特征时间尺度与瞬时频率关系的研究，引入了将一个复合信号分解成IMF分量的方法—经验模态分解(Empirical Mode Decomposition，简称EMD)或经验筛法。

2.3.1 EMD方法-“筛分”过程

对于内禀模态函数，可以用Hilbert变换构造解析信号，然后求出瞬时频率。而对于一般的不满足内禀模态函数条件的复杂信号，先要采用EMD方法将其分解。EMD方法将一个复杂的信号分解为若干个内禀模态函数之和，它基于一个基本的假设：任何复杂的信号都是由一些不同的内禀模态函数组成，每一内禀模态函数不论是现象或是非线性、非平稳的，都具有相同数量的极值点和过零点，在相邻的两个过零点之间只有一个极值点，而且上、下包络线关于时间轴局部对称，任何两个模态之间是相互独立的；任何时候，一个信号都可以包含许多内禀模态函数，如果模态函数相互重叠，便形成复杂信号。在此基础上，可以采用EMD方法通过下面的步骤对任何信号x(t)进行分解：

（1）确定信号所有的局部极值点，然后用三次样条线将所有的局部极大值点连

接起来形成包络线。

（2）再用三次样条线将所有的局部极小值点连接起来形成下包络线，上、下包

络线应该包络所有的数据点。（3）上、下包络线的平均值记为m1，求出

x(t)?m1?h1 （2.5）理想地，如果h1是一个IMF，那么h1就是x(t)的第一个IMF分量。（4）如果h1不满足IMF的条件，把h1作为原始数据，重复步骤（1）～（3），

得到上、下包络线的平均值m11，再判断h11?h1?m11是否满足IMF的条件，如不满足，则重循环k次，得到h1(k?1)?m1k?h1k，使得h1k满足IMF的条件。记c1?h1k，则c1为信号x(t)的第一个满足IMF条件的分量。

西南交通大学本科毕业设计(论文) 第12页（5）将c1从x(t)中分离出来，得到

r1?x(t)?c1 （2.6）

将r1作为原始数据重复步骤（1）～（4），得到x(t)的第二个满足IMF条件的分离c2，重复循环n次，得到信号x(t)的n个满足IMF条件的分量。这样就有

r1?c2?r2 ? （2.7）

rn?1?cn?rn

西南交通大学本科毕业设计(论文) 第23页到极大的限制，因此神经网络系统不可能完成高度集成化、智能化的计算任务。同时，神经网络系统理论本身也有很多不完善的地方。所以，神经网络系统理论与应用研究工作进展缓慢。另一方面，这一时期正是数字计算机发展的全盛时期，无论在硬件、软件还是技术应用到商品巾场方面都取得了突飞猛进的发展，使得大批有才华的科学家的注意力都转移到数值计算机方画了。

从20世纪80年代开始，是神经网络系统理论发展的黄金时期。这个时期最具标志性的人物是美国加州丁学院的物理学家John Hopfield。他于]982=年和1984年在美国科学院院刊上发表了两篇文章，提出了模仿人脑的神经网络模型，即著名的Hopfield模型。Hopfield网络足—个互连的非线性动力学网络，它解决问题的方法是—种反复运算的动态过程，这是符号逻辑处理方法所不具备的性质。

20世纪80年代，关于智能计算机发展道路的问题日趋迫切地提到日程上来。由于计算机的集成度日趋极限状态，但数值计算的智能水平与人脑相比，仍有较大的差距，因此，就需要从新的角度来思考智能计算机的发展道路问题。这样一来，神经网络系统理论重新受到审视。所以，20世纪80年代后期到90年代初，神纤网络系统理论形成了发展的热点，多种模型，算法和应用问题被提山，研究经费重新变得充足，使得研究者们完成了很多有意义的工作。目前，神经网络系统理论与技术的发展大体分一下3个方面进行。

首先在硬件技术方面，—些发达国家，如美国和日本均实现了规模超过1000个神经元的网络系统，这样的系统具有极高的运算速度，而且已经在股票数据分析中得到了应用。神经网络系统理论的研究方画，主要的进展有Boltzmann机理论的研究、细胞网络的提出和性能指标的分析等。神经网络系统的应用研究主要集中在模式识别(语音和图像识别)、经济管理和优化控制等方面，它和数学、统计中的多个学习有着密切的联系，如线性和非线性规划问题、数值逼近、统计计算等。另外，在其他信息处理问题中也有很多应用，如数据压缩、编码和股市分析等领域，应用内容十分丰富。

3.2 神经网络的研究内容

神经网络的研究内容相当广泛，反映了多学科交叉技术领域的特点。目前，主要的研究工作集中在以下四方面。

? 生物原型研究：从生理学、心理学、解剖学、脑科学、病理学等生物科学方

面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。 ? 建立理论模型：根据生物原型的研究，建立神经元、神经网络的理论模型，

其中包括概念模型、知识模型、物理化学模型、数学模型。

西南交通大学本科毕业设计(论文) 第24页 ? 网络模型与算法研究：在理论模型研究的基础上构成具体的神经网络模型，

以实现计算机模拟或准备制作硬件，包括网络学习算法的研究。这方面的工作也称为技术模型研究。

? 神经网络应用系统：在网络模型与算法研究的基础上，利用神经网络组成实

际的应用系统，例如，完成某种信号处理或模式识别的功能、构建专家系统、制成机器人等等。

3.3神经网络模型

神经网络的基本组成单元式神经元。数学上的神经元模型和生物学上的神经细胞相对应，或者说，神经网络理论是用神经元这种抽象的数学模型来描述客观世界的生物细胞的。

很明显，生物的神经细胞是神经网络理论诞生和形成的物质基础和源泉。这样，神经元的数学描述就必须以生物神经细胞的客观行为特性为依据。因此，了解生物神经细胞的行为特性就是一件十分重要且必须的事了。

神经网络的延拓结构也是以生物学解剖中神经细胞互连的方式为依据的，对神经细胞相互作用情况的揭示也是十分重要的。

3.3.1 生物神经元模型

神经元是神经网络的基本元素，只有了解神经元才能认识神经网络的本质。在人体内，神经元的结构形式是完全相同的。但是，无论结构形式如何，神经元都是由一些基本的成分组成的，神经元的生物学解剖如图3-1所示。

西南交通大学本科毕业设计(论文) 第25页

图3-1 神经元的生物学解剖

从图中可以看出，神经元由细胞体、树突和轴突三部分组成。其中突触是神经元之间的连接，其结构如图3-2所示

图3-2 突触结构

目前，神经网络的研究只是处于初级阶段，后边还有大量的工作等人们去探讨和研究。神经网络的研究已经向人们展示了其美好的美景，只要按阶段不断取得进展，神经元和突触是完全可以实现人工模拟的。

西南交通大学本科毕业设计(论文) 第26页

3.3.2 神经元模型

从神经元的特性和功能可以知道，神经元是一个多输入单输出的信息处理单元，而且，它对信息的处理是非线性的。根据神经元的特性和功能，可以把神经元抽象为一个简单的数学模型。工程上的神经元模型如图3-3所示。

图3-3 神经网络的数学模型

在图3-3中，x1,x2?xn是神经网络的输入，既是来自前级n个神经元的轴突的信息；vi是i神经元的阀值；?1i,?1i??ni分别是i神经元对x1,x2?xn的权值连接，即突触的传递效率；yi是i神经元的输出；f是传递函数，决定i神经元受到输入x1,x2?xn的共同作用达到阀值时以何种方式输出。

3.4 BP神经网络

Minsky和Papert的论点曾使许多人对神经网络的研究失去了信心，但仍有许多的学者坚持这方面的研究。Rumelhart、McClelland和他们的同事洞察到神经网络信息处理的重要性，于1982年成立了一个PDP小组，研究并行分布信息处理方法。1985年发展了BP网络学习算法，实现了Minsky的多层网络设想。BP网络是一种多层前馈型神经网络，其神经元的传递函数是S型函数，输出量为0到1之间的连续量，它可以实现从输入到输出的任意非线性映射。由于权值的调整采用反向传播（Back Propagation）学习算法，因此也常称其为BP网络。目前，在人工神经网络的实际应用中，绝大部分的神经网络模型都采用BP网络及其变化形式。它也是前向网络的核心部分，体现了人工神经网络的精华。 BP网络主要应用于以下四个方面。

? 函数逼近：用输入矢量和相应的输出矢量训练一个网络以逼近一个函数。

西南交通大学本科毕业设计(论文) 第27页 ? 模式识别：用一个待定的输出矢量将它与输入矢量联系起来。 ? 分类：把输入矢量所定义的合适方式进行分类。 ? 数据压缩：减少输出矢量维数以便于传输或存储。

3.4.1 BP神经元

图3-5给出了一个基本的BP神经元模型，它具有R个输入，每个输入都通过一个适当的权值?和下一层相连，网络输出可表示为：

a?f(?*p?b)

f就是表示输入/输出关系的传递函数。

BP网络中隐层神经元的传递函数通常用log-sigmoid型函数logsig()、tansigmoid型函数tansig()以及纯线性函数purelin().其传递函数如图3-5所示。

如果BP网络的最后一层是sigmoid性神经元，那么整个网络的输出就限制在一个较小的范围内；如果BP网络的最后一层是purelin型线性神经元，那么整个网络的输出可以取任意值。

BP网络所采用的传递函数均是可微的单调递增函数。在BP网络的训练过程中，计算函数logsig()、tansig()、purelin()的导数非常重要，神经网络工具箱提供了这些求导函数依次为dlogsig()、dtansig()、dpurelin()。在工作空间输入缀有‘deriv’的指令就可以找到相应传递函数的导数函数。例如： tansig(‘deriv’) ans=dtansig

这些函数都是设计BP网络时要经常用到的。如果用户在实际应用中需要用到其他的函数，可以自行定义。

西南交通大学本科毕业设计(论文) 第28页

图3-5 BP神经元模型

3.4.2 BP网络模型

BP网络的结构如图3—18所示。由图可见，DP网络是一种具有三层或三层以上神经元的神经网络，包括输入层、中间层(隐层)和输出层。上下层之间实现全连接，而每层神经元之间无连播。当一对学习样本提供给网络后，神经元的激活值从输入层经各中间层向输出层传播，在输出层的各神经元获得网络的输入响应。接下来，按照减少目标输出与实际输出之间误差的方向，从输出层反向经过各中间层回到输入层，从而各层修正各连接权值，这种算法称为“误差反向传播算法”，即BP算法。随着这种误差逆向的传播修正不断进行，网络对输入模式响应的正确率也不断上升。

图3-6 神经网络连接模型

与感知器模型不同的是，由于误差反向传播中合对传递函数进行求导计算，BP网络的传递函数要求必须是可微的，所以不能值用感知器网络中的硬阀值传

西南交通大学本科毕业设计(论文) 第29页递函数，常用的有Sigmoid型的对数、正切函数或线性函数。由于传递函数是处处可微的，所以对于BP网络来说，一方面，所划分的区域不再是一个线性划分，而是由一个非线性超平面组成的区域，它是比较平滑的曲而，因而它的分类比线性划分更加精确，容错性也比线性划分更好；另一方面，网络可以严格采用梯度下降法进行学习，权值修正的解析式十分明确。

3.4.3 BP网络学习规则

这里不讨论学习规则的数学推导过程，只给出学习过程及步骤，以供设计与分析DP网络时作为参考。我们以一个三层BP网络为例，介绍BP网络的学习过程及步骤。

在介绍之前，首先对各符号的形式及意义进行说明。网络输入向量Pk?(a1,a2,?,an)；网络目标向量Tk?(y1,y2,?,yq)；

中间层单元输入向量Sk?(s1,s2,?,sp)，输出向量Bk?(b1,b2,?,bp)；输出层单元输入向量Lk?(l1,l2,?,lq)，输出向量Ck?(c1,c2,?,cq)；输出层至中间层的连接权wij,i?1,2,?,n,j?1,2,?,p；中间层至输出层的连接权vjt,j?1,2,?,p,t?1,2,?,p；中间层各单元的输出阀值?j,j?1,2,?,p；输出层各单元的输出阀值?j,j?1,2,?,p；参数k?1,2,?,m。

（1）初始化。给每个连接权值wij、vjt、阀值?j与?t赋予区间（-1，1）内的随机值。

kkk（2）随机选取一组输入和目标样本Pk?(a1k,a2,?,an)、Tk?(s1k,s2,?,skp)提供给网络。

kk（3）用输入样本Pk?(a1k,a2,?,an)、连接权wij和阀值?j计算中间层各单

元的输入sj，然后用sj通过传递函数计算中间层各单元的输出bj。

sj??wijai??j j?1,2,?,p

nbj?f(sj) j?1,2,?,p

（4）利用中间层的输出bj、连接权vjt和阀值?t计算输出层各单元的输出Lt，然后通过传递函数计算输出层各单元的响应Ct。

i?1Lt??vjtbj??t t?1,2,?,q

pCt?f(Lt) t?1,2,?,q

kk（5）利用网络目标向量Tk?(y1k,y2,?,yq)，网络的实际输出Ct，计算输出

j?1层的各单元一般化误差dtk。

西南交通大学本科毕业设计(论文) 第30页

dtk?(ytk?Ct)*Ct(1?Ct) t?1,2,?,q

（6）利用连接权vjt、输出层的一般化误差dt和中间层的输出bj计算中间层各单元的一般化误差ekj。

kje?[?dt*vjt]bj(1?bj)

（7）利用输出层各单元的一般化误差dtk与中间层各单元的输出bj来修正连接权vjt和阀值?t。

t?1qvjt(N?1)?vjt(N)?a*d1k*bj

?t(N?1)??t(N)?a*dtk

t?1,2,?,q j?1,2,?,p,0?a?1

(8)利用中间层各单元的一般化误差ekj，输入层各单元的输入

Pk?(a1,a2,?,an)来修正连接权wij和阀值?j。

kwij(N?1)?wij(N)??ekjai

?j(N?1)??j(N)??ekj

i?1,2,?,n,j?1,2,?,p,0???1

(9)随机选取下一个学习样本向量提供给网络，返回到步骤(3)，直到m个训练样本训练完毕。

(10)重新从M个学习样本中随机选取一组输入和目标样本，返回步骤(3)，直到网络全局误差E小于预先设定的一个极小值，即网络收敛。如果学习次数大于预先设定的值，网络就无法收敛。 (11)学习结束。

可以看出，在以上学习步骤中，(7)(10)步则用于完成训练和收敛过程。(8)步为网络误差的“逆传播过程”，

通常，经过训练的网络还应该进行性能测试。测试的方法就是选择测试样本向量，将其提供给网络，检验网络对其分类的正确性。测试样本向量中应该包含今后网络应用过程中可能遇到的主要典型模式。这些样本可以通过直接测取得到，也可以通过仿真得到，在样本数据较少或者较难得到时，也可以通过对学习样本加上适当的噪声或按照一定规则插值得到。为了更好地验证网络的泛化能力，一个良好的测试样本集中不应该包含和学习样本完全相同的模式。

3.4.4 BP网络设计技巧

1)输入和输出层的设计

输入的神经元可以根据需要求解的问题和数据表示方式确定。如果输入的是根拟信号波形，那么输入层可以根据波形的采样点数目决定输入单元的维数，也可以用一个单元输入，这时输入样本为采样的时间序列；如果输入为图像，则输

西南交通大学本科毕业设计(论文) 第31页入单元可以为图像的像素，也可以是经过处理的图像特征。

输出层的维数可根据使用者的要求确定。如果将BP网络用做分类器，有m个，那么输出层神经元的个数为m或log2m。 2)隐层的设计

对于BP网络，有一个非常重要的定理。即对于任何在闭区间内的一个连续函数都可以用单隐层的BP网络迫近，因而一个三层BP网络就可以完成任意的M维到闭经的映射。

隐层的神经元数目选择是一个十分复杂的问题，往往需要根据设计者的经验和多次实验来确定，因而不存在一个理想的解析式来表示。隐单元的数目与问题的要求、输入助出单元的数目都有着直接关系。隐单元数目太多会导致学习时间过长、误差不一定最佳，也会导数容错性差、不能识别以前没有看到的样本，因此一定存在一个最佳的隐单元数。以下3个公式可用于选得最佳隐单元数时的参考公式。

i(1)?Cn?k，其中，k为样本数，n1为隐单元数，n为输入单元数。如果ini?n1,C?0。

(2)n1?n?m?a，其中，m为输出神经元数，n为输入单元数，a为[1,10]之间的常数。

(3)n1?log2n，其中，n为输入单元数。

还有一种途径可用于确定隐单元的数目。首先使隐单元的数目可变，或者放入足够多的隐单元，通过学习将那些不起作用的隐单元剔除，直到不可收缩为止。同样，也可以在开始时放入比较少的神经元，学习到一定次数后，如果不成功则再增加隐单元的数目，直到达到比较合理的隐单元数目为止。

(4)初始值的选取

由于系统是非线性的，初始值对于学习能否达到局部最小和是否能够收敛的结果关系很大。一个重要的要求是：初始权值在输入累加时使每个神经元的状态值接近于零，权值一般取随机数，数值要比较小。输入样本也同样希望进行归一他处理，使那些比较大的输入仍范在传递函数梯度大的地方。

ii?0ni3.4.5．BP网络的不足及改进

在人工神经网络的应用中，绝大部分的神经网络模型采用了BP网络及其变化形式，但这并不说明BP网络是尽善尽美的，其各种算法依然存在一定的局限性。BP神经网络的不足和改进主要有以下几个方面：

（1）

由于学习速率是固定的，因此，网络的收敛速度慢，需要较长的训练时间。对于一些复杂的问题，BP算法需要的训练时间可能会

西南交通大学本科毕业设计(论文) 第32页

非常长。这主要是由于学习速率太小造成的，对于这个问题，可采用的改进方法有：附加动量项、变化的学习速率或自适应的学习速率。