HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用
更新时间:2023-04-30 18:02:01 阅读量: 综合文库 文档下载
- 模式识别最新研究动态推荐度:
- 相关推荐
浙江大学
博士学位论文
HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用
姓名:冯长建
申请学位级别:博士
专业:机械制造及其自动化
指导教师:吴昭同;丁启全
20021101
塑坚查兰堡主堂堡堡塞—————————————』!—星
摘要
本文以国家自然科学基金项目“基于隐Markov模型的旋转机械故障诊断新方法的研究”f编号:50075079)为基础,提出的博士学位论文题目为“HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用”。本文以大型旋转机械为研究对象,研究了HMM动态模式识别理论与方法在旋转机械故障诊断中的应用,开辟了旋转机械计算机辅助故障诊断的新途径。全文主要研究内容如下:
第一章:介绍了旋转机械振动监测和诊断的概况;综述了多变量动态模式识别理论的发展和研究现状;结合国家自然科学基金提出了本文的研究内容;最后,给出了本文的总体框架和创新之处。
第二章:介绍了Markov链基本理论,并通过一个简单的实例把它扩展到了隐Markov模型(HMM):然后重点介绍离散HMM的基本理论、算法以及在实际应用中的改进措施。
第三章:根据离散HMM(DHMM)的基本理论,提出了旋转机械振动幅值谱矢量的标量量化方法,并在此基础上提出了基于DHMM的故障诊断方法;利用转子升速过程的振动模式验证了DHMM故障诊断方法的有效性。
第四章:在连续隐Markov模型(CHMM)的基本理论基础上,提出了直接利用振动信号AR系数特征矢量序列建立混合密度CHMM的故障诊断新方法,并对转予升速过程的振动模式进行了成功的识别;对DHMM和CHMM故障诊断方法进行了对比分析,指出DHMM方法具有算法稳定、计算速度快、识别精度高等特点,对于CHMM方法只要通过合理选择特征参数也能得到高的识别精度。
第五章:利用SOM神经网络对多传感器的振动信息特征进行降维、压缩与编码,首次提出了基于多通道振动信息融合的HMM故障诊断方法,拓展了监测对象的观测范围,从而能够对旋转机械的整体运行状态做出综合识别,并对提出的方法进行了实验研究。
第六章:首次把AR系数矢量弓i入到Kalman滤波器和HMM中,得到了两种自适应描述非平稳动态时间序列的在线模型一Kalmn.AR和HMM—AR模型:描述连续状态变化的Kalman.AR滤波模型为描述离散状态变化的HMM.AR模型提供了一个良好的初始化方法和给出过程状态转移点的先验信息,从而使HMM-AR模型能够对非平稳过程进行状态分割和分类;仿真和实验结果表明,提出的该旋转机械运行状态在线监测方法,能够实现对旋转机械运行的状态进行成功地分割和分类。
第七章:基于多变量动态模式识别的理论和方法,在混合编程环境下开发了HMM
浙江大学博士学位论文摘要
的旋转机械故障诊断应用软件:介绍了软件系统的开发环境、丌发工具以及Matlab和“+混合编程的接口实现方法;介绍了整个软件系统的基本组成和功能。
第八章:给出了全文研究内容的总结;并对HMM理论在旋转机械故障诊断方面的进一步应用提出了展望。
关键词:旋转机械,故障诊断,振动分析,模式识别,隐Markov模型fHMM),自组织特征映射(soM),神经网络,特征提取,矢量量化,标量量化,数据聚类,多传感器信息融合.
Ⅱ
塑垩查堂堡主堂垡堡茎垒!!!坠!!
ABSTRACT
Basedonthe‘‘ApplicationonFaultsDiagnosisofRotatingMachineinHiddenMarkovModels”(NationalNatureScienceFundProject,No:50075079),theHiddenMarkovModels
(HMMs)dynamicpaRemrecognitiontheoriesandmethodsarestudied,thenproposedthe
HMMmethodsanddevelopedtheapplicationsinfaultsdiagnosisofrotatingmachineby
faultsdiagnosissoftwarebasedonHMM.Thedetailsarestudiedasfollows:
Chapteronebrieflyintroducesthegeneralsituationofvibrationmonitoringandfaultsdiagnosisoftherotatingmachine.ThedevelopingandthecurrentsituationsofthemultivariatedynamicpaUemrecognitiontheoriesaresummarized.AtIast,thebackground,maincontents,generalstructureschemeandinnovationpointsofthisdissertationarepresent.ChaptertwointroducesthebasicideasofMarkovChaintheoriesbriefly.andthenextendsittoHiddenMarkovModelsthroughasimpleexample.AtlastthetheoriesandalgorithmsofHiddenMarkovMedelsarestudied.ThemodificationalgorithmsofHMMareproposed.Thereforethebasictheoriesofthisdissertationareestablished.
Chapterthreeproposesthebasicconceptofdynamicalpaaernrecognitionandintroducestheimplementationtheoriesbasedonprobabilitystatistics.BasedonthetheoryoftheDiscreteHiddenMarkovModels(DHMM),thescalarquantizationmethodofvibrationspectrumvectorofrotatingmachineisproposed,andthenthefaultdiagnosismethodbasedonDHMMisdesigned.Theexperimentofrun—upprocessofrotormachineismadetoverifytheeffectofthenewfaultsdiagnosismethod.
ChapterfourintroducesthebasictheoriesofContinueHiddenMarkovModels(CHMMlthenewmethodoffaultsdiagnosisbasedmixturedensityCHMMsdirectlybythevibration
ARcoefficientsvectorsofrotatingmachineisproposed,andthenthedynamic
patterns
presentedinrun‘upprocessofrotormachinearesuccessfullyrecognized.Atlastcompares
thetwofaultsdiagnosismethodsofDHMMandCHMM,andpointsouttheadvantagesanddisadvantagesofthetwomethods.
Chapterfivestudiesthenewmethodforfaultsdiagnosisofrotatingmachinebasedon
SOMandHMMthroughtheintegratedinformationofmulti.sensor.Firstself
organization
clusteringmethodforhighdimensiondataisproposed.andthenDHMMforfaultsdiagnosisisdesignedbythelowdimensionfeatures.ExperimentsverifiedthatthemethodiseffectiveChaptersixproposeausefulmethodbasedonHMM.ARformodellingthedynamic
nI
浙江火学博_L学位论文ABSTRACTtimeseriesofrotatingmachinerunningprocess.Itisverifiedthroughsimulatingdataandexperimentsdata.
ChaptersevenbuildstheHMMfaultsdiagnosissoftwareforrotatingmachineThedevelopingenvironments,toolsandimplementationmethodsofinterfacebetweenMatlabandC++mixtureprogramminglanguagesonthissotb,vareareintroducedAtlastthebasiccomponentsandfunctionsofthesoftwarealeillustrated,
Atlast,intheeighthchapter,aIIoftheworkinthisdissertationissummedup,andthefutureresearchesonapplicationsofHMMsaleprospected.
Keywords:Rotatingmachine,Faultsdiagnosis,Vibrationanalysis,Paaernrecognition,HiddenMarkovModel(HMM),Selforganizationfeaturemap(SOM),Neuralnetwork,Featureextraction,Vectorquantization,Scalarquantization,Dataclustering,Multi.sensorinforlnationfusion
lV
苎二主堕堡
第一章绪论
内容提要
本章介绍了旋转机械故障诊断的研究现状;综述了动态模式识别理论的发展和技术现状;结合国家自然科学基金提出了本文的研究内容,给出了论文的总体框架和创新之处。
1.1引言
机器的振动总是伴随着机器的运转而产生的。即使机器在最佳的运行状态,由于很小的缺陷,也将产生某些振动。例如,飞机在飞行时机翼的振动,火车在铁轨上行驶时产生的振动和噪声,机床在切削是刀具产生的振动等。同样,旋转机械,包括蒸气机、燃气透平机、水力透平机、压缩机、鼓风机、离心机、发电机、泵以及各种齿轮减速(增速)器等在运转时也必然会产生振动和噪声【I,2’3】。
这里所指的旋转机械的主要构成部分是指转子、支撑转子的轴承、定子或机器壳体、联轴节,此外还有齿轮的传动、叶轮、叶片以及密封等。转速范围一般为几千rpm(r/min)到上万rpm,另外还由于这些机组结构复杂、功率大,所以通常这些机械又称为大型高速旋转机械【ll。本文故障诊断的研究对象正是以这些旋转机械为基础的。
由于转子、轴承、壳体、联轴节、密封和基础等部分的结构以及加工和安装方面的缺陷,使机器在运行时引起振动,过大的振动往往是机器破坏的主要原因,所以对旋转机械的振动测量、监视和分析是非常重要的。又由于振动比其它状态参数,例如润滑油或内部流体的温度、压力、流量或电机的电流等更能直接、快速准确地反映机组的运行状态,即,正常状态和异常状态,所以一般把振动信号作为对旋转机械进行状态监测和诊断的主要依据”^“。
旋转机械是生产实践中的关键设备,开展旋转机械的监测和故障诊断系统具有重要的现实意义。
1.2旋转机械故障诊断研究现状
近几十年来各国都在大力开展有关设备故障诊断技术的研究,并已取得了显著的成效,获得了巨大的经济效益。
设备故障诊断技术的发展,大致可分为四个阶段‘1m。
浙江大学博上学位论文:HMM动态模式识别理论、方法以及在旋转机械故障中的应用
第一个阶段是在19世纪,当时机器设备本身的技术水平和复杂程度都很低,因此采用事后维修方式,诊断结果在很大程度上取决于领域专家的感官和专业经验,对诊断信息只作简单的数据处理。
第二个阶段是进入20世纪后,随着大生产的发展,机器设备本身的技术复杂程度也有了提高,设各故障或事故对生产的影响显著增加,在这种情况下,出现了定期预防维修方式。这时期,设备故障诊断技术处于孕育时期。
第三阶段是从60年代开始,特别是70年代以来,设备诊断技术随着现代计算机技术、数据处理技术等的发展,出现了更科学的按设备状态维修的方式,主要是以传感器技术和动态测试技术为手段,以信号处理技术和建模技术为基础的现代诊断技术,并在工程中得到了广泛的应用。
第四阶段是进入80年代以后。人工智能技术和专家系统、神经网络等开始发展,并在实际工程中应用,使设备维修技术达到了智能化高度。虽然,这一阶段发展历史并不长,但已有研究成果表明,设备智能诊断具有十分广泛的应用前景。
近30年来,设备故障诊断技术不断吸取现代科学技术发展的新成果,从理论到实际应用都有迅速的发展,至今已发展成为集数学、物理、力学、化学、电子技术、计算机技术、信息处理、人工智能等各种现代科学技术于一体的新兴交叉学科。其研究内容主要反映在以下几个方面:
(1)故障机理的研究:
(2)特征提取技术研究:
(3)人工智能专家系统与神经网络的研究
(4)故障诊断装置的开发与研究。
(5)模式识别技术研究。
下面将分别对这几方面的问题进行阐述。
1.2.1故障机理研究
该项研究的目的是为了掌握故障形成和发展过程,了解设备故障内在本质及其特征,建立合理的故障模式。其研究方法是依赖于相关的基础学科,建立相应的物理或数学模型,进行计算机仿真计算,它是设备状态监测与故障诊断的基础。
在旋转机械方面,美国Sohre?J?s18】于l968年发表的论文“高速涡轮机械运行问题(故障)的起因和治理”对旋转机械的典型故障征兆和原因进行了全面的描述和归
纳。他把典型故障归纳为9类37种。该项研究成果已被广泛应用于高速旋转机械故障诊断中㈣。
2
第一章绪论
L_l本的白木万博自60、70年代以来,发表了大量的故障诊断方面的文章,总结了丰富的现场故障处理经验并进行了理论分析…。
美国Bentlv公司的转子动力学研究所对转子和轴承系统典型故障机理进行了大量试验研究1…J。
近几年,我国在故障诊断机理研究方面也做了大量工作,如辽阳石油化纤公司高金吉博士在他的博士论文中结合多年来的实践经验,对高速旋转机械的故障机理及识别特征进行研究,提出了一次原因及主导频率的科学分类方法,归纳、总结了诊断lo类58种故障的识别特征”…。
在旋转机械的机理研究已经不局限于线性系统的研究,例如汪慰军的博士论文…1研究了大型旋转机械的分岔和混沌特性。曾复的博士论文【l“对转子裂纹的非线性机理进行了理论和实验研究。
“八五”期间,我国一些高校、研究所结合重大科技攻关项目“大型旋转机械状态监测、分析及故障诊断技术研究”在故障机理研究方面进行了全面、深入的研究。其中,在机械故障机理研究中,提出了应用轴线标高变化识别轴系稳定性的方法,提出了非线性油膜力作用下最佳轴承参数优化方法;在机电耦合动态分析研究中,对多机AC/DC联合电力系统进行次同步谐振与轴系扭振研究,在对流体诱发振动研究中,应用振荡流体力学理论,对叶片失速流、尾迹流、气封间隙流等进行了研究与计算,在对各种热力状态诱发故障机理研究中,对各种热参数变化引起的故障进行了分析、研究。这些研究成果使我国在旋转机械机理研究方面提高到一个新的水平【14/。
1.2.2特征提取技术的研究
故障信息处理技术对正确诊断故障有十分重要作用。故障信息处理技术包括故障信号的检测和分析处理两部分。检测的信号通常有振动、噪声、温度、压力、流量、电流、电压等,分析处理就是对这些信号进行加工变换,提取出对诊断有用的征兆。
故障诊断信息处理技术研究主要包括,信号处理。信号处理研究的主要内容是统计分析、频谱分析、相关分析、相干分析、传递函数分析、细化谱分析、时间序列分析、倒谱分析、包络分析和模态分析等,其理论基础是数理统计和随机过程”】。
当设备出现故障或负荷、转速发生变化时,必须从时问和频率两方面来进行分析。常用的时间频率分析方法有,Wigner-Ville分布(WVD)、短时富氏变换(STFT)、小、和小波变换fwT)和高阶统计量分析等。
(1)Wigner-Ville分布,其表达式为:
彬(f,_厂)=Ex(f+专Ⅸ‘(t--4‘)g。柳如(1-1)
3
浙江大学博士学位论文:HMM动态模式识别理论、方法以及在旋转塑啦故障中的应用
其中Z’是信号工(f)的复共扼。这个方法对瞬态频率、群延时等有很好的描述,但它有频率干扰现象.很难把有多个成分组成的信号表示清楚。
(2)短时富氏变换这是在时一频率分析中应用很普遍的一种方法,也称窗口富氏变换。这时,信号z(f)通过窗^(f)被部分观察到。其表达式为:
s。(f,厂)=广x(r)h’(卜f)P‘俐dr(1.2)若要提高时问分辨率,可使用短窗口,若要提高频率分辨率,则使用长窗口。
(3)小波变换作为一种新的信号处理方法,小波变换已在很多工程领域中得到成功的应用,如图像分析、数据压缩、计算机编码、语音信号处理等,近几年在故障诊断中的应用也开始起步。小波变换定义为:
吸(f,口)=]苦亡x(r)h+(三i)df(1-3)
、/㈦一4
这里,h(t)是振荡衰减的函数,a为尺度因子,t为平移因子,尺度因子的选取与频率成反比,因此小波变换是时间一尺度分析法。与STFT有相似之处,但它巧妙地解决了STFT分辨率的不足,可根据不同情况,选择不同的频率分辨率。
利用二进小波分解或小波包分解的多分辨分析思想,把信g-分解到不同频带内进行处理,这对处理不连续、突变和非平稳的信号具有很多优点,预示着在故障诊断领域中将获得广泛的应用。
(4)高阶统计量分析在信号处理中,常常假设信号服从高斯分布,利用二阶统计量提取信号信息,而事实上,系统常常是非线性的,即便输入是高斯信号,输出也可能是非高斯的信号,这就需要用高阶统计量分析来反映信号的更多信息。高阶统计量分析特别是三阶统计量分析已经广泛用于非因果、非最小相位系统、非线性系统辨识,抑制高斯或非高斯分布的白色噪声,提取多种信号特征等领域。高阶统计量分析近年来已经成为现代信号处理领域中一个十分活跃的研究方向。
信号的特征提取工作是故障诊断的基础,较好地提取信号特征对于成功识别机组状况有着非常重要的意义。更精确、更全面地提取信号特征是信号处理工作者一直以来的追求。
1.2.3人工智能专家系统与神经网络研究
(1)人工智能专家系统‘31
人工智能主要研究如何利用计算机模拟人的智能,它的目的是使计算机去做j{有人才能做的智能任务,如推理、理解、决策、学习等。专家系统是人工智能的一个分支,它是一个智能计算机程序,它利用知识和推理过程来解决那些需要大量人类专家
4
第一章绪论
知识才能解决的复杂问题。人工智能诊断技术是目前设备故障诊断的发展方向。早期的诊断专家系统研究是在医学领域进行的,以后逐渐发展到其它领域。可以说诊断专家系统的发展为人们提供了一种能够利用领域专家的经验知识,基于多种技术来解决复杂系统故障诊断问题的强有力的工具,是机械设备诊断技术发展的一个里程碑。
1985年Stuart【l”根据shore【l”给出的故障征兆与起因关系表,研制成功了第一个透平机械故障诊断专家系统。以后,相继又有多个专家系统出现mJ。1987年美国西屋公司与卡内基一杨隆大学合作开发了透平机械、发电机和水化学处理的三个专家系统TurbinAID、GenAID及ChemAIDIl…,这个专家系统据称有一万多条规则。各电站机组监测信号数据经压缩处理后,通过电话线传送到几百公里外的渗断运行中一L,(DOC),利用专家系统进行昼夜监视、分析、诊断。
我国自80年代以来,也开始自行研制旋转机械专家诊断系统。其中如哈尔滨T业大学的3MDES-1与ETHYLE(1988年),华中理工大学的KBTGMD(1993年1,郑州工学院的MMMDS(1989年),西安交通大学的RMMD及其它专家系统[191。
专家系统的核心是知识。大量事实表明知识获取是建造专家系统的“瓶颈”问题。一个诊断系统在其运行过程中所获取的诊断信息(知识)越丰富,其诊断结果可靠性越高,因而,专家系统的性能水平主要取决于它所拥有的知识数量和质量‘”。
(21神经网络的研究11,3]
近年来发展起来的人工神经网络以其全新的信息表达方式、高度并行分布处理、联想、自学习及自组织等能力和极强的非线性映射能力使它渗透到科学技术的各个领域。它为人工智能的专家系统研究开辟了一条新的途径,它改进了专家系统中知识获取、知识表达和并行处理等问题。
它由大量简单的非线性处理单元(类似于人脑的神经元)高度并联、互联而成。它作为一种新的模式识别技术或知识处理方法,在设备故障诊断领域里显示出了极大的应用潜力。
脑的神经元高度并联、互联而成,它作为一种新的模式识别技术或知识处理方法,在设备故障诊断领城里占有一席之地。它的知识获取过程是由一种称之为反向传播算法(BP算法)的学习训练过程来实现。这种BP算法由于其收敛速度慢,易陷入局部极小点,尚需进一步研究、改进。目前将故障诊断专家系统与神经网络方法相结合,相互取长补短,不失为一种有效方法。
虽然,目前在人工智能故障诊断专家系统及神经网络研究中取得了很大的进展,但在旋转机械故障诊断领域中仍存在着不少问题急待解决,如领域专家缺乏定量的诊断经验,故障与征兆之间的复杂对应关系尚需进一步了解,大量知识的获取尚不能自
5
塑坚查堂竖主兰垡笙塞:型坚垫查竖些望型矍堡:查鎏型墨垄鉴堑塑塑垫堕!塑窒旦
动进行,如何寻找更有效的学习算法等,这些问题需要在今后的研究工作中逐步得到解决。
1.2.4故障诊断装置的开发和研究
设备故障诊断离不开实际的手段。目前在这方面的发展主要在以下两个方向进行,即便携式的振动监测、诊断仪(包括数据采集器)及在线监测与诊断装置。
(1)便携式的监测诊断仪器
该仪器主要采用单片机,其功能主要是对机组振动情号进行测试并对所测信号进行简易分析与诊断。一般这类仪器还配有现场动平衡的功能。
(21在线监测与诊断装置
这类装置配有传感器系统、数据预处理系统、采样控制系统、计算机系统及打印输出系统,并配有丰富的监测与论断软件,它可存储大量运行数据,以备分析诊断使用。这类装置一般采用上下位机工作方式,下位机进行数据的采集与监测,上位机对采集的数据进行分析、诊断。
最近几年国内各高校、研究所相继开发了各种类型的在线诊断装置用于电厂大型发电机组及石化系统的压缩机组,与国外产品相比,可以说软件功能相当,但装置可靠性方面应进一步提高。国内开发的最大优点是,软件功能可进一步完善,采用汉字显示便于现场应用,价格较国外产品大为下降。
目前这类在线系统己向网络化方向发展,应用较为普遍的是由美xeRox公司开发的以太网(Etheme0.其通讯速率为10Mbps,可连接为数众多的工作站,这样可构成不同规模的网络化的监测与诊断系统,便于进行集中管理。其信号传输可利用电话线、光缆或无线通讯方式。
纵观这类装置的发展,从80年代单机巡检与监测到今天以网络为基础的分布式结构,其发展速度十分迅速。可以预见,今后在国内将会有更多的机组应用这类系统,以提高机组运行的安全性。
1.2.5模式识别技术
故障诊断另外~个重要研究方向就是模式识别技术,主要研究内容是参数估计、系统辨识等,其理论基础是系统论、信息论和控制论。故障诊断的许多问题都归结为模式识别问题。因此模式识别技术的研究在故障渗断领域中占据重要的地位,它也是人工智能研究领域中的一个重要研究方向。
模式识别技术主要包括统计模式识别、句法模式识别和模糊理论等,它们在旋转机械故障诊断中有着广泛持久的应用。
6
第一章绪论
Bayes决策理论是统计模式识别中的一个经典方法,它根据条件概率和先验概率来推断后验概率,这种概率逐步求精的方式已得到了广泛的应用。
在句法模式识别领域中,数学语言技术被用于识别和分类。一个模式被看作是一个句子,分类过程描述为对句子的分析,判断是否满足某一文法,以此来确定归属为哪一类别。句法模式识别在上下文无关的句法结构分类上取得了很大的成功,但它的缺陷是这种信息处理的本身是串行的,而不是象人类的并行处理方式。
模糊集是一个比较活跃的研究领域,它为某些难以求得概率分布的问题提供了一种非常有意义的解释。有关模糊集理论已有大量的文献论述与应用。
1.3动态模式识别技术现状
状态监测的任务是使机器系统不偏离正常功能,并预防功能失败,在监测的基础上进行诊断:当系统一旦偏离正常功能,则必须进一步分析故障产生的原因。如果事先已经对机器可能发生的故障模式进行了分类,那么诊断问题就转换为把机器的现行工作状态归入哪一类的问题。因此,故障诊断实质上一类模式分类和识别问题『32,”】。关注模式识别领域的发展,无疑会为旋转机械的故障诊断带来新的生命力,开辟新的诊断途径。传统模式识别方法大都是处理静态模式分类问题。事实上,旋转机械的故障行为往往表现为一个动态变化的行为,比如,机座松动、转子裂纹等[26,27]。在这些故障发生的模式中,时间往往扮演着一个第二重要的角色12“,也就是说系统的特征空间参数沿着时间轴分布,这类问题称为动态模式识别问题口6,2”。所谓动态模式,是指描述系统的特征参数随着时间的变化而改变∞]。在旋转机械故障诊断中,往往是观测到一系列与时间有关的谱矢量,充分利用这些信息进行故障诊断无疑是更加可靠的,这些矢量序列形成了一种与时间有关的多变量动态模式。本文试图通过HMM多变量动态模式识别理论和方法来研究旋转机械中的动态故障模式识别或诊断问题在机器学习领域最活跃的一个方向就是有导师分类口”。然而在大多数的算法和技术中,很大程度上都忽略了实时应用的一个重要方面一时间,也就是说,现存的学习内容都是对静态的属性集合进行处理的;例如,对由叶片大小、花瓣颜色和花瓣数量所描述的花进行分类。这些属性的值都假定是不改变的一比如这些花,既不会生长也不会丢失叶片062”。
然而,许多实际的数据集合都不是“静态的”,不能明显地用一些固定不变的属性集合来描述。更恰当地说,描述实例的特征是时变的,恰恰这些时变的特征本身构成了分类的依据。考虑一个简单的手势识别的例子,手的暂态特征描述可以用手的位置、手指的弯曲等来描述。如果考虑某~时间点的手的位置并不能对手势进行成功的分类;只有考虑手的位置的改变的情况下,才有可能正确的分类口q。
7
浙江大学博士学位论文:HMM动态模式识别理论、方法以及在旋转机械故障中的应用
无疑,这些问题将改变传统的模式分类任务,即这些模式必须考虑更多的属性在时问上的变化规律。近年来,提出了几种多变量时间序列模式有导师分类的技术,比如,递归神经网络法、动态时问规整法、隐Markov模型等‘27。33I。下面简要的介绍这些技术的发展概况。
1.3.1递归神经网络(RNN)
神经网络是一个高度复杂的非线性动力学系统,其动力学过程有两个:一个为神经网络的学习过程;另一个神经网络的计算过程。各个神经元之间有一所谓权值的加权系数,它起着生物神经系统中神经元突触强度作用,神经网络通过权值的连接来反映外部模式。网络中调整权值的规则称为学习算法,几乎所有神经网络的学习算法都可以看作是Hebb学习规则的变形。Hebb学习规则的基本息想是:如果神经元站.接收到来自另一神经元“,的输入,则两个神经元都引起兴奋,那么从U,到“,的权值w,便得到加强。神经网络通过大量样本学习使权值收敛稳定,学习后的网络可以对输入进行快速运算,对外界模式做出判断[3,23,24l。
递归神经网络是对传统神经网络的改进类型,它允许对变信号进行分类,它的基本结构如图1.1所示口61。
输ItI
输^
图11递归神经嘲络的结构
这种网络结构与传统的网络结构相比,多了一个上下文层,它表达了观测变量之问的时间信息。在每一个时间步,新的输入反馈到递归神经网络中,隐含层先前的内容传递到上下文层,然后上下文层再把这些信息反馈回隐含层。这种算法类似于后向传播算法,又称为通过时问的后向传J'i§(BPTT),隐含层和上下文层的权值都进行调整。为了完成分类任务,需要对输出进行后处理,比如,当设置的门限落在某一节点的输出对,则对该节点注册为一个特定的类别。
8
第一章绪论
递归神经网络方法虽然在动态模式识别领域中有着成功的应用,但它也存在着下列明显的不足[3,,24,26】:
(1)嘲络具有许多参数。这些参数包括隐含层的神经元个数、合适的结构、正确的参数调节算法、学习速率、编码等,这些参数在网络设计的时候往往都难以确定。不同的参数导致不同的训练结构。
(2)学习长期序列的效果值得怀疑。试图学习长期事件序列,例如,文献【261提到的语音识别中,训练样本持续数百个采样,但并没有得到良好的分类效果。这种网络一般地能过对短序列进行较好的处理(10帧左右),常用用于处理音素分类,而不能用于整个词的分类。
(3)从普通的前馈神经网络中抽取能够解释的意义已经是很困难的事了,从递归神经网络的训练中抽取意义就更加困难。
1.3.2动态时间规整法toTw)
动态时间规整是一种古老的分类动态时间序列的方法。它首先要有一个模板流的集合,每一个模板都标签为一个类。当给定一个没有标签的输入流时,通过计算数据流和各个模板流之间的距离,根据距离最近的原则对未知输入流进行分类【2“。
动态时间弯析法的灵活性来源于数据流和模板流之间的距离计算,而不是简单地对t时刻的模板流和t时刻的输入流的数值进行比较。该算法是对输入流到输出流之间的映射空间进行寻优的算法,所以整个距离是最小的。通常该映射不是线性的,通常会发现输入流的时间^相应于模板流的时间‘+5,然而输入流中的厶却相应于模板流中的时间f2—3。寻优空间收到一个合理的边界所限制,比如,从输入流的时间到模板流的时间之间的映射函数必须是单调不减的[26,29]。
模板时间序列输入和模板之间
映射的最小距离
输入时间序图1.2动态时间规整法
图1.2是动态时间规整法用于时问序列分类的原理图。图中水平轴表示输入流时问序列,纵轴表示模板流输入时间序列。图中实线路径表示输入流和模板流之间具有最小
9
塑垩查兰堕主兰竺鲨壅!!型塑垫查堡茎望型望堡:查婆坠丝垒塑茎塑塑垫堕主塑生旦一
距离的结果。阴影区域表示输入时间到模板时问之间映射函数的寻优空间。在寻找最短路径时,空问中的任何单调不减的路径都可以选择考虑。对于寻优问题t可以用动态编程的方法来实现。
DWT技术早期用于语音识别领域,取得了一定的成果。但近年来被HMM识别方法所替代。主要是DWT技术存在着以下的缺点:第一,它是静态匹配方法,算法上也不显得特别快:第二,信号帧之间的距离量度必须事先进行定义,这对于具有截然不同特征的不通通道的信号是很难以实现的;第三,它不能生成任何关于数据的有意义的描述说明;第四,从数据中获得的模板流也不够细致,通常使用两个两个的实例进行匹配来完成,另外,所有观测到的实例都作为模板进行存贮,这是令人难以置信的缓慢;第五,尽管存在着几种尝试来试图扩展DWT用于强的时变信号分类任务,大量的实验已经证明是不成功的,于是真正地促进了从DWT到HMM的转移口…。
毕竟,DWT相对来说比较简单,商业上它用于弱的时变信号分类任务,比如,孤立的口语数字识别【2“。
1.3.3隐Markov模型
抽象的数学概念与原理对于模型的建立与表达不仅有重要的借鉴和启发,而且提供了表达的语言。在建模过程中,随机性处理具有不可忽视的作用。晦Markov模型(简称HMM)是一种包容性十分强,并且应用十分广泛的数学模型,它是一种不完全观测数据的统计模型。因而有很广泛的适用性,应用的弹性相当大¨”。
一个隐Markov链是指一个不可观测的Markov链(称为状态过程)和一个观测过程(称为测量过程)的整体【”圳,当需要考虑多变量时间序列模式问题时,隐Markov链就应当改称为隐Markov随机场【34’”】,有时还需要考虑观测变量为图或树的情形,这时又称为Markov图或Markov树,这里把这些模型统称为隐Markov模型,记为HMM。
HMM理论用一个隐变量序列来模拟系统动态行为的变化,模型的状态掩盖在系统的观测变量之中,这也是隐Markov模型名称的由来。HMM是一种参数化模型,实践中它的参数集合可以通过实际观测到的试验数据集合运用统计方法而获得””oJ。
HMM之所以得到了广泛的应用,因为这种模型既反映了对象的随机性,又反映了对象的满在基本结构,便于利用被研究对象的直观先验了解【3”,比如某种状态出现的先验概率;另外HMM具有严格的数学结构,便于在实践中利用电路芯片实现它的算法,即算法易于硬件实现。
10
第~节靖砣1.4HMM故障诊断方法的可行性及其意义
1.4.1HMM在语音识别中的应用
HMM在语音识别中所起的作用是众所公认的o。”“I。在语音识别中,要首先建立一种对应关系,例如,使一个字对应一个HMM,这里的状态就是指这个音所包含的全部可能的音素(或其细分,或其组舍)。对应于此字的一个观测样本,这些音素按照一定的先后顺序出现,这就形成了HMM中的状态序列,现实中不可观测到。相应的观测过程的现实就是每个字母所对应的声音信号的振幅。为了建立上述对应关系,首先应对该字的一组观测样本(该字的若干个声音信号)进行学习,也就是说相应的状态序列缺失的情况下进行HMM的参数估计。用数理统计的语言来说,就是不完全数据的参数估计…l。
在学习了每个字的参数后,就可以用来识别。也就是对一组观测样本(一个字的声音信号),找到最大可能产生该观测样本的那个模型作为该宇的代表。
对于不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如图1.3所示。
圄1.3语音识别技术的实现
可见,语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
(!)语音识别单元的选取
选择识别单元是语音iRSrJ研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
(2)特征参数提取技术
语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息昵?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。
浙江人学博L学位论文:HMM动态模式识别理论、方法以及在旋转机械故障中的应用
线性预0IU(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应刚系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。
Mel参数和基于感知线性预钡U(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。
也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。
(3)模式匹配及模型训练技术
模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
HMM模型是语音信号时变特征的参数表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐藏的(不可观测的)具有有限状态的Markov链,另一个是与Markov链的每一状态相关联的观察矢量的随机过程(可观测的)。隐藏Markov链的特征要靠观测到的信号特征来揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的髓机过程描述,而信号随时间的变化由隐藏Markov链的转移概率描述。
孤立词识别是语音识别中一个重要的研究方向,下面简要介绍一个HMM在孤立词识别中的应用方法㈣31,…1。图1.4表示了语音识别的一般过程。即首先要对语音的原始波形信号进行处理,提取能够表征语音的特征参数,形成语音矢量序列,然后对语音矢量序列进行模式识别达到孤立词识别的目的。
波形
000000语音矢量
——\—————、,—————/匣卜;
图1.4孤立词识别的过程12
第一鼋等蹬
基于HMM方法的孤立调识别系统的基本思想:在训练阶段,用HMM的训练算法f如Baum—Welch算法),建立系统词汇表中每个单词形对应的HMM,记为丑。在识别阶段,使用前向一后向算法或Viterbi算法求出各个溉率尸(D/五.),其中0为待识剐词的观测值序列。最后选取最大的P(0,五,)所对应的笪词肜为0的识别结果
图15展示了利用HMM技术对三个孤立词进行识别的过程,对于单词one、two和three分别进行三次发音采样,可以由一个人重复发音三次,也可以由三个人各发音一次,形成语音矢量样本,如图1.5中的方块所示。然后利用采集的语音特征矢量分别建立HMM,比如兄、无和兄。
HMM一旦建立起来,就可以用来对未知的单词的发音进行识jjIj,如圈l5所示,对于来知的观测序列O,分别计算在三个模型下输出的概率,然后对结果概率进行比较,选取输出概率最大的模型,就代表所识别的单词。
(”训练
训练样本。口c1wo(bJ识别口口口口口口
口口口口
口口口口口口口口口口口口口口口口口口口lhrcc
口口口口口口口口口口口口口口口口
柬女喊‘坦忮量0;口口口口口口
/l\\l竺:苎!竺型竺型f
max[P(O/,z)】
图1.5基于HMM的孤立词识别技术
由此可见,在具体应用HMM时,首先要进行建模,要确定模型的状态数,另外从观测过程得到的观测序列并不~定能够满足HMM的要求,因此还应当有~个特征提取的过程,尽量简化状态序列和观测序列的对应关系129,30j。
3。。..‘T,勺
。。.—,,^.I_l,n
塑坚查兰竖:!兰垡笙苎:!尘型垫查堡苎堡型里堡:垄鲨坠墨堡塞堡坠堡墼堕!塑生旦一HMM的应用分为两个阶段进行:学习阶段和推理阶段。学习阶段是由观测到的样本出发,找到(估计)HMM的参数,从而完全确定模型。而在概率推理阶段,是指给定一组观测样本和HMM模型库下,计算观测样本在各个HMM下输出的概率。对于语音识别最终要知逆的是给定的语音样本出自哪个模型。这是一个辨识过程,通常使用Bayes判决原则来决定模型,即选择概率输出为最高的模型作为辨识结果。
1,4.2HMM在其它领域中的应用
最近,}m【M用于手写体字的识别上,得到了相当高的识别率,取得了比较满意的结果,显示了HMM的应用潜力[35】。
目前,m皿d的应用领域也在不断扩大,例如,手语识别川、口型识别p”、车牌识别删、频率跟踪u0】、人脸检测口”、滤波p7r1…、雷达目标识别f“、心电图识别[202】等,几乎信号处理和模式识别领域中的各个方面都能找到H2vlM的踪影。
1,4.3HMM故障诊断方法的可行性
由以上的分析可知,HMM的重要功能就是模式分类。对于故障诊断问题,特别是基于振动信号的旋转机械故障诊断问题,实际上就是一类模式识别问题,具有和语音识别类似的框架,如图1.3所示。
和语音信号相比,旋转机械的振动信号和语音信号具有如下的类似之处:
(1)二者都有一个类似的基本的潜在随机结构,而且不可直接观测。例如,旋转机械的潜在变化状态和语音中的音素。旋转机械的故障状态掩盖在机器的振动信号之中。同样,对于语音而言,常常观测到只是一些语音片断,而实际的音素则隐藏在这些语音片断之中。
(2)广义地讲,语音信号也是振动信号,因此二者的短时信号提取都是一系列空间分布的参数,比如语音中的多个倒谱系数和振动信号的多个幅值谱分量,因此都是多观测变量问题。
(3)在一段时间跨度上,参数空间都随时间而变化,于是形成了一个多变量的动态模式。语音信号往往具有较强的时变特性,而对于旋转机械的暂态过程,比如,转子启停机过程,所表现出来的振动特性,也具有强的时变特性。园此二者在暂态时间序列特性上具有类似性。对于说话人识别问题,一个说话人可以由一系列的语音特征来刻画,同样,对于转子启停机过程,设备所处的工作状态也可以由一系列的特征矢量来表示。因此,启停机过程的故障诊断,很类似于语音识别中的说话人识别。
4
第一章绪论
(4)在旋转机械的稳定工作阶段,抽取的振动信号又非常类似于语音识别技术中的孤立词识别。为了提高模型的泛化特性,对于一个要识别的单词,在建立该词的模型时,往往需要观测到它的若干次样本,需要重复说话多次的语音或多个人读该词的语音。对于旋转机械故障诊断,要建立稳定阶段的HIvIM,也必然要抽取该阶段的若干次振动信号波形,利用多样本训练序列建立模型。
近年来,HMM在设备故障诊断方面的成功应用已有不少文献报道。例如,文献[68,70,76,1061提到使用HMM对工具磨损状态进行实时监测;文献【74】提出了对电机工作条件进行监测的HIvlM方法;文献[75】提到了基于振动信号的HMM在轴承故障诊断中的应用:文献【81】提到了利用HMM对电,‘事故进行监测的方法。本文在这些文献和HMM模式识别理论基础之上,对HMM在旋转机械故障诊断中的应用方法进行深入的分析和研究。由于HMM在语音识别等领域有较高的识别率,可以预见,HMM也必然能够对旋转机械的振动模式进行可靠的诊断。
1.4.4研究HMM故障诊断方法的意义
HMM是一种动态模式识别工具,能够对一个时间跨度上的信息进行统计建模和分类。传统的故障诊断方法是停留在静态观测的基础之上的,比如取某时刻的幅值谱进行比较分析,这往往忽略了故障发生前后的上下文信息,没有揭示系统潜在状态所发生的变化特征,因而也难于对故障的发展做出预测。研究HMM故障诊断方法,在一个动态的环境中对设备状态进行观测、评估,能够早期发现故障发展的迹象,以便于把故障消灭在萌芽阶段,比如在旋转机械的启动过程中就能够发现系统的潜在故障状态,那么对于生产实践将具有重要的积极意义。
另外HMM是以统计模式识别理论为基础的,而模式识别理论是机器学习领域的一个分支,因此研究HMM故障诊断方法对于设备运行状态进行自动监测和估计具有重要意义。
1.5本文的研究内容、创新之处及总体结构
1.5.1本文的研究内容
童进‘”81博士论文‘‘隐Markov模型在旋转机械升降速过程故障诊断中的鹿用研究”提出了利用观测幅值谱矢量的聚类编码进行离散隐Markov模型的建模分析,取得了一定的研究成果。本文在此基础之上,结合国家自然科学基金项Ij(50075079)--“基
15
塑垩叁堂堕.!:兰垡笙塞!型垫查堡当堡!!兰笙:查鲨坠丝垄塑茎堂垫堕主塑些旦
于隐MaYov模型的旋转机械故障新方法的研究”,提出了博士论文研究题目一“HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用”。本文与上文的主要区别是采用了多观测变量和多样奉的隐Markov模型建模方法、并在连续隐Ma&ov模型故障诊断、多传感器信息融合故障诊断和旋转机械运行状态分割和分类等方面得到了新的突破。
本文的主要研究思路为:首先研究HMM基本理论、算法以及实际应用中所要解决的问题(第一章);针对旋转机械的振动故障模式进行HMM动态模拟和诊断尝试(第三、四、五、六章);接着,介绍HMM旋转机械故障监测和诊断软件的开发和设计(第七章);最后,提出研究结论和展望(第八章)。
本论文的主要研究内容如下:
第一章;介绍了旋转机械振动故障诊断技术的概况;综述了多变量动态模式识别问题的研究现状;分析了HMM在故障诊断中的应用中的可行性;最后,结合国家自然科学基金项目提出了本文的研究内容,并给出了本文的总体框架和创新之处。
第二章:介绍了Markov链基本理论,并通过一个简单的实例把它扩展到了隐Markov模型(HMM):然后重点介绍离散HMM的基本概念、理论以及设计时遇到的三个基本问题;分析了HMM在实际应用中所面临的问题并提出了合理的解决方案。
第三章:提出了基于信源编码的Lloyds算法对振动幅值谱矢量进行标量量化编码的方法,既保留了幅值谱各个分量的变化趋势,又获得了离散的整数型编码特征,解决了DHMM对振动信号进行建模和分析所面临的训练码本设计问题}利用振动幅值谱的标量量化编码特征对旋转机械振动故障模式进行DHMM模拟实验。实验结果表明,DHMM故障诊断方法具有算法稳定、计算速度快和分类精度高的优点,利用该方法对旋转机械启动过程的模拟故障进行了成功地识别与诊断。
第四章:利用混合密度CHMM模型对旋转机械启停机过程的振动故障模式进行模拟和诊断,并对多观测样本的CHMM模型的训练算法做了适当的改进,较好地消除了算法的溢出问题。实验结果表明,通过适当选择特征参数,CHMM方法对旋转机械故障模式的分类可以达到较高的精度。
第五章:利用SOM神经网络对多传感器的振动信息特征进行降维、压缩与编码,提出了基于多通道振动信息融合的HMM故障诊断方法,拓展了监测对象的观测范围,从而能够对旋转机械的整体运行状态做出综合识别,并对提出的方法进行了实验研究。
第六章:旋转机械运行过程中的故障往往具有逐渐发展的趋势,表现在信号中,就是具有若干平稳片段的非平稳性质;本章把Kalman滤波和AR系数引入到HMM建
16
正在阅读:
HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用04-30
红石排座方案06-13
一只狗四个口“打一字”02-07
袁绍手下武将和谋士名单及他们的简介02-07
奥运公园是个伟大的工程12-21
不做“上班奴”的20个方法10-19
2018-2024年中国数据库一体机市场运行状况分析与投资风险研究报告目录11-22
语言学习的五个阶段03-16
认识一个真实的曹操06-07
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 识别
- 旋转
- 诊断
- 故障
- 以及
- 理论
- 模式
- 方法
- 应用
- 动态
- 机械
- HMM
- 2017年东南大学人文学院354汉语基础之古代汉语考研仿真模拟题
- 法律制度有效性条件分析
- 北师大版数学八年级下册《1.1.1等腰三角形》同步测试卷(含答案)
- 口语交际:安慰(教案)四年级安慰口语交际教案
- 苏教版-数学-四年级上册-《两、三位数除以两位数》优选作业
- 为什么很多人有钱了都会选择移民?很多有点钱就想移民的人是怎么想的?
- 果蔬贮运与加工习题集
- 安全生产管理制度(通用版)
- 幼儿园实习周记范文
- 2016年自考《大学语文》精选模拟试题及答案
- 最新全国卷2017-2018年高三最新考试数学理试题分类汇编:集合与常用逻辑用语 Word版含答案
- 内科消化性溃疡诊疗指南
- 四川大学考博英语模拟题1(考卷附答案)
- 安全生产事故管理制度度解析
- 完整版小学文言文总复习练习教案.doc
- 2015海南医疗考试护理专业知识:排尿异常的常见症状
- 小学英语时态专项练习
- 一年级下册语文教案第单元动物王国开大会人教部编版
- 寓意好的商城名字大全
- 高中地理一轮全程复习方略课时提升作业 91 工业的区位选择 含答案