基于MATLAB故障诊断系统设计

更新时间:2024-04-26 12:19:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

沈阳理工大学学士学位论文

摘 要

随着对自动化设备的安全性、可靠性以及有效性要求的提高,故障诊断技术受到人们的重视,已成为国内外自动化控制界的热点研究方向之一。故障诊断是对控制系统进行故障检测与诊断,并对故障的原因、故障的频率、故障的危害程度及故障的趋势预测等内容进行分析判断,为确诊故障点、及早采取维修、防护等补救措施提供科学的决策依据。

随着科学技术进步,过程工业生产装置的结构日趋复杂,逐渐从单变量系统发展到以多变量系统为主,通常具有非线性、时变性、强耦合性及结构和参数的不确定性,这类系统和设备一旦发生故障,排除的时间增长,不仅造成巨大的经济损失,甚至造成人员伤亡和环境污染,因此传统的故障诊断方法已无法满足要求。

由于大多数过程工业难以建立精确的数学模型,基于数学模型的故障诊断方法在实际应用中遇到了较大的困难。多元统计过程控制的故障检测与诊断方法不依赖于系统的数学模型,因此该方法更具实用性。基于主元分析的工业过程故障诊断方法,由于充分利用了主元分析算法在处理线性数据时可对其降维的作用,使得对多变量生产过程的监测可在低维变量空间实现。本文对基于主元分析的故障诊断方法进行了系统、深入的研究。

关键字:故障诊断;主元分析;过程工业

I

沈阳理工大学学士学位论文

Abstract

With the increasing requirement on safety, reliability and effectiveness of automation devices, study on the problem of fault diagnosis has received great attention and been one of the most active research topics. Fault diagnosis is doing fault monitoring and diagnosis for monitor and control system. It also analyzes fault source, frequency, severity, tendency etc., and provides scientific decision-making basis in order to confirm fault, take remedies, such as timely maintenance and defense.

With the development of science and technology, the process industrial production installment's structure is getting more and more complex, and develops gradually from the single variable system to the many-variable system primarily. Since it is usually highly nonlinear, time-varying, seriously coupling and its structure parameters are uncertain, traditional fault diagnosis method can’t satisfy the demand. Once this kind of system and equipment comes about malfunction, it will take a long time to be solved and lead to a large amount of economic loss, even human injuries or environmental problems.

It is difficult to found precise math-model in many industry processes, the fault detection method base on math model has much more difficulty actually application. The method of fault detection and diagnosis based on MSPC (Multivariate Statistics Process Control) doesn’t depend on the math model of system. The method of fault detection based on PCA (Principal Component Analysis) making full use of PCA algorithm well and it has the function of declining the dimension while handing line related data. It can make the monitor process carrying out from multivariate space into the low dimension. The main purpose of this thesis is to make further study on the fault diagnosis based on PCA.

Keywords: Principal Component Analysis; Fault detection; Process Industry

II

沈阳理工大学学士学位论文

目 录

1 引 言 .................................................................................................................................... 1

1.1 故障诊断技术的研究背景 ......................................................................................... 1

1.1.1 故障诊断技术概述 .......................................................................................... 1 1.1.2 故障诊断技术的研究对象 .............................................................................. 1 1.1.3 故障诊断技术研究的必要性 .......................................................................... 2 1.2 国内外基于主元分析的故障诊断技术研究进展 ..................................................... 3

1.2.1 基于主元分析的故障诊断技术的研究历史 .................................................. 3 1.2.2 基于主元分析的故障诊断技术发展趋势 ...................................................... 4 1.3 本次设计主要工作内容 ............................................................................................. 7 2 故障诊断方法研究 .............................................................................................................. 8

2.1 基于解析模型的方法 ................................................................................................. 8

2.1.1 状态观测法 ...................................................................................................... 8 2.1.2 参数估计法 ...................................................................................................... 8 2.1.3 等价关系法 ...................................................................................................... 9 2.2 基于知识的方法 ......................................................................................................... 9

2.2.1 专家系统 .......................................................................................................... 9 2.2.2 人工神经网络 .................................................................................................. 9 2.2.3 因果分析法 .................................................................................................... 10 2.2.4 模糊理论 ........................................................................................................ 10 2.3 基于数据分析的方法 ............................................................................................... 10

2.3.1 主元分析法 .................................................................................................... 10 2.3.2 偏最小二乘法 ................................................................................................ 11 2.3.3 Fisher判别分析法 .......................................................................................... 11 2.3.4 规范变量分析法 ............................................................................................ 11 2.4.5 子空间法 ........................................................................................................ 12 2.4.6小波变换法 ..................................................................................................... 12

3 基于主元分析的故障诊断技术研究 ................................................................................ 13

3.1 主元分析的研究背景 ............................................................................................... 13

III

沈阳理工大学学士学位论文

3.2 主元分析的数学思想 ............................................................................................... 13 3.3 主元分析的实现方法 ............................................................................................... 14

3.3.1 主元分析的分解方法 .................................................................................... 14 3.3.2 主元得分向量的计算方法 ............................................................................ 15 3.3.3 确定主元个数的方法 .................................................................................... 16 3.3.4 主元模型的建立 ............................................................................................ 17 3.3.5 主元分析的统计量 ........................................................................................ 18 3.4 基于主元分析的故障诊断流程 ............................................................................... 19 4 基于主元分析的故障诊断技术应用仿真研究 ................................................................ 21

4.1 应用仿真环境 ........................................................................................................... 21

4.1.1 田纳西--伊斯曼过程 ..................................................................................... 21 4.1.2 田纳西--伊斯曼过程工艺流程 ..................................................................... 21 4.2 仿真研究 ................................................................................................................... 22

4.2.1 基于主元分析的故障诊断步骤 .................................................................... 22 4.2.1 仿真概述 ........................................................................................................ 23 4.2.3 仿真结果 ........................................................................................................ 24

结 论 ........................................................................................................................................ 28 致 谢 ........................................................................................................................................ 29 参考文献 .................................................................................................................................. 30 附录A:英文原文 ................................................................................................................... 32 附录B:汉语翻译 ................................................................................................................... 39

IV

沈阳理工大学学士学位论文

V

沈阳理工大学学士学位论文

1 引 言

1.1 故障诊断技术的研究背景

1.1.1 故障诊断技术概述

故障诊断是指通过系统的解析冗余,完成工作情况的分析,对生产是否正常、什么原因引起故障、故障的程度等问题进行相关的分析、判断,并最终得出结论的过程

[1]

利用解析冗余这种故障诊断技术是20世纪70年代初,首先于美国发展起来。系统的解析冗余代替了解析硬件冗余,并通过系统的自动作使系统闭环稳定,通过比较观测器的输出从而得到系统的故障信息。

故障诊断的主要任务,从低级到高级,可以分为以下四个方面的内容

[5]

(1)故障检测:当稳定运行的系统的输出偏离了预期目标范围,或影响系统的输出的过程参数,过程状态或者特征量发生了变化并且超出预定范围时,诊断系统应能够及时检测的出来。但是通常任何故障检测系统都不能完全正确的检测出控制系统的故障,因此如何提高故障的正确检测率,降低故障漏报率和误报率一直都是故障检测领域的前沿课题。

(2)故障分离:从所检测到的特征信号中提取信息,即信号处理与特征变换,根据检测到的故障信息,寻找故障源,确定故障类型及大小。故障源可能是元件,组件,也可以是子系统。该过程主要依靠数学工具,目前常用的方法如:小波变换、主元分析、神经元网络等。

(3)故障评价:将故障对控制系统性能指标以及功能的影响做出相应判断和估计,并评价出出故障等级。同时,计算出故障的程度及故障发生的时间等参数。

(4)故障决策:根据故障检测所得到的信息和故障评价的等级进行故障定位,作出故障诊断决策,针对不同的工作情况,做出报警、修改等操作,甚至停机进行维修等决定,避免故障扩大。

1.1.2 故障诊断技术的研究对象

所谓故障,是指系统中至少一个重要变量或特性出现了较大偏差,偏离了正常范围。从广义上来看,故障可以理解为系统的任何异常现象,使系统表现出所不期望的特性

[6]

系统故障通常是指系统在使用或者运行过程中发生的功能型异常变化,即在一定时间内

1

沈阳理工大学学士学位论文

系统主要功能指标超出规定的范围。

美国麻省理工学院的Beard R. V首先提出了用解析冗余代替硬件冗余,并通过系统的自组织使系统闭环稳定,通过比较观测器的输出得到系统故障信息的新思路,标志着这门技术的诞生。过程监控与故障诊断包括两方面的内容:故障检测与故障诊断。故障检测的任务是依据预处理后的过程信息或借助直接从测量数据中提取的反映过程异常或系统故障特征的信息,判断系统运行过程是否发生了异常变化,并确定异常变化或系统故障发生的时间。通常,依据处理方式和处理时限不同,故障检测可区分为在线检测和离线检测两大类。提高故障的正确检测率,降低故障的漏报率和误报率一直是故障检测领域的前沿课题。故障诊断包括故障分离和故障识别,是指通过足够数量测量设备(例如传感器)观测到的数据信息、过程异常变化的征兆与过程系统故障之间的内在联系等,对系统的运行状态进行分析和判断,查明故障发生的原因,寻找故障源,确定故障类型及人小。

故障诊断技术的主要研究对象是过程运行时出现的异常变化和系统部件非先天性功能故障

[17]

。故障诊断所研究的系统往往是相当复杂的工业过程,这些过程具有如下

的特性:

(1)数量大,集散控制系统(DCS)所采集的数据点多,其数据存储系统可以连续不断地保存数据,从而使数据库变得十分庞大;

(2)维数高,过程的行为通常是由大量相互关联的变量来体现,因此,要采用降维的方法才能有效地显示过程的行为;

(3)过程的不确定性和噪音,这就要求要有去噪性能好的数据处理方法,对原始过程数据进行预处理;

(4)动态性;

(5)过程变量问的相关性复杂;

(6)测量数据冗余。随着过程工业的发展,对过程的高端应用也越来越高,而过程的复杂特性增加了对过程监控与故障诊断的性能要求,必须不断改善过程监测技术的性能来适应这些不断增加的复杂要求。 1.1.3 故障诊断技术研究的必要性

随着先进控制技术在过程工业中的广泛应用,生产系统的复杂程度逐渐加大,系统中出现的某些微小故障如果不能够及时的诊断并排除,就有可能导致整个生产系统的失

2

沈阳理工大学学士学位论文

效、瘫痪,甚至造成灾难性的后果。

现代工业及科学技术的迅速发展,特别是计算机技术的发展,使得现代设备的结构越来越复杂,自动化系统的规模越来越大。一个大型的设备系统往往由大量的工作部件组成,不同的部件之间互相联系,紧密耦合。这一方面提高了系统的自动化水平,为生产带来了可观的经济效益;另一方面,由于影响系统运行的因素骤增,使其产生故障或失效的潜在可能性越来越大。一个部件的故障常常会引起链式反应,导致整个系统甚至各个生产过程不能正常运行乃至瘫痪。现代设备系统运行的安令性和可靠性已成为人类必须解决的刻不容缓的问题。切实保障现代复杂系统的安全性和可靠性,具有十分重要的意义,得到了广泛的高度重视。而过程监控和故障诊断技术则为提高系统的安全性和可靠性开辟了一条新的途径。

从实际应用方面看,系统的安全性和可靠性已成为保障经济效益和社会效益的一个关键刚素,得到了广泛高度的重视;从学科理论的发展方而看,故障诊断具有很强的学科交叉性,现代控制理论、信号处理、模式识别、最优化方法、决策化、人工智能等学科领域近20年米的迅速发展,为解决复杂系统的故障检测与诊断问题提供了强有力的理论基础。从安全生产和降低成本的角度来看,现代制造设备具有规模大、复杂性高、变量多,并在闭环控制下运行的特点。对这些设备进行早期的和准确的故障检测与诊断可以减少停产时间,增加设备运行的安全性,并减少制造成本,可以使企业避免人员和财产的巨大损失,给企业带来可观的经济效益。故障检测与诊断技术在近十几年来的发展中取得了许多成果,应用领域也在不断扩大,由最先的航天、航空领域及核电站的诊断迅速扩展到输油管线、大型电网系统、汽车、船舶发电机、冶金设备、石化设备、家用电器等各个领域,并创造了巨大的经济效益。

1.2 国内外基于主元分析的故障诊断技术研究进展

1.2.1 基于主元分析的故障诊断技术的研究历史

多元统计分析方法在生产过程中得到了广泛的研究与成功的应用。其中有关主元分析的理论研究和应用较多。主元分析(PCA)作为一种不依赖于过程精确机理模型的监测方法,在化工过程监测方面的研究始于20世纪80年代初。在此之前PCA作为一种多元统计分析技术,已在信号处理、经济学、地质学等领域得到广泛的应用

[7]

一般情况,设某生产过程有m个变量,若过程的差异可以由变量的k(k

3

沈阳理工大学学士学位论文

元分析提取少数几个能体现原过程绝大多数信息的新变量,通过监视新变量的变化来判断生产过程运行是否正常,主元分析在故障诊断中得到了较好的应用。由于主元分析主要用来分析过程变量问线性、稳态关系,它在复杂过程系统的应用受到了一定的限制。

研究学者针对这些局限性提出了一些改善方法,如:Barkshi结合小波分析能有效消除变量的自相关性、主元分析能消除变量间的互相关性的特点,提出了多尺度主元分析(Multi. scale PCA)来提高常规PCA在时-频域的局部分析能力

[2]

;以及非线性主元分

析(Nonlinear PCA)结合神经网络来提高处理非线性的能力,进一步改善了常规PCA难于处理测量变量间非线性关系的局限;分块主元分析(Multi. block PCA)将大规模过程分成若干个子过程,针对各个子过程分别进行主元分析,从而改善了常规PCA在处理大系统过程的分析精度;多向主元分析(Multi. way PCA)用来处理批次过程。除此之外还有:动态主元分析(Dynamic PCA)用来改善常规PCA的动态性能;移动丰元分析(Moving PCA)通过分析各个主元方向的变化程度,改善常规PCA的过程监测性能等。

经过近70年在全世界范围的实践,统计过程控制获得了长足的发展,其与计算机技术的结合日益紧密,在过程工业中已经得到了广泛的应用。但是由于连续生产过程的特点及其相关处理的复杂性,使得多变量统计过程控制无论在理论方法或是实际应用方面中,都还有许多的问题有待研究解决。 1.2.2 基于主元分析的故障诊断技术发展趋势

就基于主元分析(PCA)的故障诊断方法而言,首先对生产过程中采集到的正常数据进行主元分析,建立主元模型,然后将过程中新得到的数据向量投影到两个正交的子空间(主元子空间和残差子空间)上,并分别在相应空间上使用Hotelling统计量和甲方预测误差SPE统计量,来进行假设检验,如果检验到数据偏离正常统计模型,就可以判断有故障发生,然后可以借助贡献图分析每个过程变量对SPE统计量和T2统计量的贡献大小,确定是哪些过程变量引起了过程变化或故障,根据以前积累的工程经验,来判断故障原因。

标准多元统计分析的PCA方法在其推导过程中,作了如下假定:(1)各个变量都服从高斯正态分布;(2)过程处于稳态,不存在序列相关性;(3)过程参数不随时问变化;(4)过程是线性的

[16]

。以上假设限制了PCA在实际过程中的应用,导致大量的错报和误报。

因此针对PCA的上述假定,不少学者提出了各种PCA的改进算法。

4

沈阳理工大学学士学位论文

(1)动态方面的改进

标准PCA是以“样本观测相互独立”作为假设前提条件,没有考虑到时间序列相关性的影响,因此标准PCA从其本质上说,是一种静态建模技术。对于大多数工业过程而言,都存在动态特性,测量变量并不是序列无关的,当前时刻的测量变量与过去若干时刻的测量变量都有关系。为此,探讨适合序列相关数据的动态PCA方法是非常必要的。动态PCA建模是在原来时间序列数据块的基础上对每个变量进行增广,在增广矩阵基础上建模。由学者将PCA和时间序列模型ARMAX相结合提出了动态主元分析DPCA,有效的去除了测量变量时间序列的自相关关系。DPCA模型与传统PCA方法相比较,去除相关性能力更强。动态PCA和静态PCA在故障诊断中的实际应用表明在动态系统,动态PCA方法的效果明显优于静态PCA方法。动态主元分析DPCA虽然较好地解决了数据的动态性问题,但仍是一种线性化的建模方法。

(2)非线性方面的改进

多元统计分析方法作为一种线性化的技术,在提取大型复杂、非线性系统主元特征时存在以下两个问题:(1)线性分解方法压缩和提取不充分;(2)线性方法监视结果不可靠。这是由于较小的主元中可能包含重要的非线性信息,如果舍弃该主元,会导致重要信息的丢失;如果保留该主元,会造成模型复杂。所以有必要使用非线性技术提取大型复杂系统非线性统计特征。

常用的非线性多元统计分析方法有以下几种:

①广义PCA:该方法由Gnanadesikian提出,其基本思想是将m维原始向量进行扩充,使新向量包含某些成员变量的非线性函数,然后对这个增广的新向量进行线性主元分析。但是,由于事先并不确切知道变量间存在什么样的非线性函数关系,因此该方法难以在实际中得到很好的应用。

②主元曲线方法:1989年,Hastie和Stuetzle提出了主元曲线和主元曲面(Principal Curve&Principal Surface)的概念,所谓主元曲线,实际上是通过对样本数据进行非线性特征提取而得到的一条光滑曲线,曲线的形状由数据的结构所决定,当曲线为直线时,即为线性PCA的主元曲线,Hastie等给出了主元曲线的近似求解算法,由于该方法计算复杂,因此这种非线性主元还不易于实际使用。

③神经网络PCA方法:在主元分析基础上融入神经网络方法是解决多元统计分析方法线性化问题的另一有效途径。Kramer提出一种自联想神经网络(Autoassociate Neural Network)结构来处理非线性主元分析。这种自联想神经网络的缺点在于,当神经网络隐

5

沈阳理工大学学士学位论文

层数较多时,学习训练能力下降。1995年,Tan和Mavrovouniotis提出用输入训练(Input Training,简称IT)神经网络进行非线性主元分析。IT神经网络特点在于神经网络输入没有给出,学习样本只有输出数据,所以其内部权值和输入都需要学习调整。

(3)自适应方法

在实际工业生产中,由于原料性质的改变、外界环境的变化、过程负荷的改变、设备的磨损等因素,导致工业过程的操作条件是多变的,但是传统的多变量统计方法假定在所考虑的时间尺度上,数据都是静态不变的。所以,有必要对传统的算法做进一步改进以克服系统的非静态特性,以达到自动调整诊断模型,实现故障诊断的准确性和实时性。系统的漂移可以分成两种情况,一种是变量的均值和方差发生了变化,而变量之间的定性关系仍保持不变,第二种情况是除了均值和方差发生变化之外,变量之间的关系也发生了变化。在第一种情况下,Rosen和Lennox提出通过更新数据的归一化参数的方法来适应均值和方差的变化比。第二种情况比第一种情况要复杂一些,Dayal和MacGregor,Qin等采用了递归的方法。这些基于递归的方法的基本原理是将新的测量数据以一定的权值包含到待处理的数据矩阵中,这些权值一般是指数减小的,也就是说,随着过程的进行,历史数据对当前数据矩阵的影响是逐渐减小的,当前时刻的数据具有最大的权值,而离当前时刻越远的时刻的数据具有越小的权值。基于递归的自适应算法也在一定程度上克服了非线性的影响,因为递归模型可以看成是系统在不同操作点的线性化模型。

(4)多尺度方法

传统的多元统计方法没有考虑到频率特性,即数据信息的提取和压缩都是在同一时间尺度上完成的。PCA方法对测量变量的时间序列进行建模,建模过程中仅仅考虑了采样间隔这一尺度,因此该模型是单尺度的。单尺度模型仅适合于在一个时间尺度上有贡献的数据。但是由于多种原因,在单一尺度上建立的模型对于某些尺度上的事件并不灵敏。小波分析为解决多尺度问题提供了可能性。测量信号通过小波分析被分解为不同尺度上的信号,信号的高频信息被包含在高尺度上,而低频信息被包含在低尺度上。Bakshi提出的多尺度PCA( Multiscale PCA,MSPCA),利用小波变换将每一信号分解为多个尺度上的信号,在每一尺度上分别建立相应的模型。

(5)层次和多块主元分析方法

对于大型的化工联合企业而言,每一生产流程都涉及大量的化工装置,总的测量变量个数也极为庞大,因此,在建立统计过程模型时,对模型中变量之间相互关系的解释

6

沈阳理工大学学士学位论文

极为复杂,使模型难以实际应用。一种有效的方法就是建立一种层次模型,将整个装置分为若干等级,每一等级都建立相应的模型。Wangen,Kowalshi和MacGregor等研究者分别阐述了多块或多层次PCA的思想,使模型的解释能力大为增强。层次PCA或多块PCA将数据分层次组织起来,下一等级的得分被用于构造上一等级的PCA模型。每一模型都相对比较简单,与单一的PCA模型相比,这种建模方法具有更好的解释能力,特别是对于流程工业而言,测量数据可能来自同一流程不同的过程装置或过程单元,对每一过程装置或单元的测量数据分别建立相应的统计模型,然后从每一模型中抽取出主元,构建出上面一层的模型。这一思想实质上是一种将大系统层层分解简化的方法,对于最底层的模型而言,由于模型中的测量变量都是来自于同一过程单元,变量之问的相互关系相对比较明确,模型的解释能力比较强。因此,基于层次或多块思想的建模方法相比传统的单一PCA模型,具有更好的解释能力和故障诊断能力。

(6)间歇生产过程的监控方法

以上方法主要应用于连续工业生产过程的故障诊断,作为工业生产中另一种重要的生产方式之一的间歇生产过程,与连续生产过程相比,具有启停频繁、动态特性变化快、时序操作严格、多阶段、有限生产(以批次为周期的生产)等特点,间歇生产过程的故障诊断更为复杂。不同于连续过程的二个维度,其测量数据包括时间、变量、批次三个维度。Nomikos和MacGregor提出了基于复合主元分析(Multiway Principal ComponentAnalysis,MPCA)的过程监控方法。该方法通过将三维矩阵按时间进行切片,展开成二维矩阵,从而利用主元分析对其进行监控。

1.3 本次设计主要工作内容

本文通过查阅相关资料文献,通过对多种故障诊断方法的研究,选取基于主元分析(PCA)的方法作为本文设计故障诊断系统的基础。本文主要研究了基于主元分析的数学原理和实现过程,并使用田纳西--伊斯曼过程TEP (Tennessee Eastman Process)平台产生仿真数据,利用MATLAB软件建立故障检测与诊断模型。通过T2和Q(或SPE)统计量与其阈值的判断,并通过贡献率图对系统进行故障诊断。实验表明,基于PCA的故障诊断方法能够对过程的非正常变化做出反应,也能较正确地找出发生故障的原因以及相应环节。

7

沈阳理工大学学士学位论文

2 故障诊断方法研究

系统故障是指系统中的重要变量或特性出现了较大偏差,在一定时间内系统主要功能指标超出规定的范围。从广义上来看,故障可以理解为系统的任何异常现象,使系统表现出所不期望的特性。故障诊断技术是一门综合性的技术,涉及到多门学科,如现代控制理论、可靠性设计、数理统计、模糊集理论、信号处理、模式识别、人工智能等。

故障诊断技术所使用的方法目前尚未有一个统一的分类标准,常见的分类方式将其分为三类:基于解析模型的方法、基于知识的方法、基于数据分析的方法

[12]

2.1 基于解析模型的方法

基于解析模型的方法又称为解析冗余法。该方法以系统的数学模型为基础,利用状态观测器、卡尔曼滤波器、参数估计辩识、等价空间方程等方法产生残差,然后基于某种准则或阈值对残差进行分析与评价,实现故障诊断。由于该方法能与系统的机理模型紧密结合,可以方便地实现监控、容错控制、故障重构等。根据残差的产生方式可细分为状态观测法、参数估计法和等价关系法等。 2.1.1 状态观测法

当故障与执行器、传感器或状态变量的变化密切相关时,状态观测法是一种比较合适的故障检测与诊断方法。使用状态观测法或卡尔曼滤波器重构被控过程的状态,与可测变量相比较构成残差序列,通过统计检验对残差进行分析,当残差超过了设定的阈值,就可以确认检测到故障的发生。根据状态对应的物理意义,可进一步对故障进行辨识及决策。用状态观测法进行故障检测与诊断需要一个合适准确的系统机理模型,该模型的建立对故障的辨识过程极为有利。但是对于某些大型的工业工程来说,建立一个准确的系统模型并非轻而易举的事情。 2.1.2 参数估计法

如果过程故障是和模型参数的变化密切联系的,并且恰当准确的数学模型容易得到,则用参数估计法进行故障诊断比较合适。使用该方法时,首先建立被控过程的输入输出参数模型,然后根据系统的输入输出序列计算出模型参数,由模型参数估计过程物理参数,将它与过程中的实际物理参数相比较得到残差序列。最后根据残差序列的变化检测故障是否发牛,当确定有故障发生时,再根据参数的变化进行故障分离、估计及决

8

沈阳理工大学学士学位论文

策。一种强跟踪滤波器理论可用于非线性系统的在线故障诊断。用参数估计法进行故障诊断需要对系统的机理有深入的了解,这样才能在检测到故障的同时,迅速地对故障原因进行分析。 2.1.3 等价关系法

该方法是要检查系统数学模型和系统运行状态的一致性。用广义残差方程来观测系统的残差,通过设计合适的传递函数,使得残差与未知输入(故障)解耦。当无故障时,未知输入为零,系统的输入输出与系统数学模型一致,广义残差超出预计的统计阈值。当故障发生时,系统的广义残差超出预设的统计阈值。由于传递函数已经对未知输入进行了解耦,因此可以通过对残差的分析来分离故障。

2.2 基于知识的方法

基于解析模型的方法要求有一个精确的定量数学模型。对于大型的工业生产系统,这样的模型可能无法得到,但是现场工作的专家和操作工程师可以提供许多过程的定性描述,这些定性描述加上从过程机理得到的深层次知识,形成了基于知识的方法,如专家系统、神经网络、因果分析等。这些方法,需要一个定性的模型,通过对系统的定性描述来进行故障诊断。 2.2.1 专家系统

专家系统是基于知识的技术,是对人类思维方式的功能模拟。它将专家的经验以规则的形式用公式表达出来,这些规则可以与系统的机理描述相结合,对系统的运行状态进行逻辑推理从而达到故障诊断的目的。专家系统的基本组成包括知识库、推理机和人机接口。知识库可以含有浅知识和深知识,前者是启发性知识和专家论述,后者是根据对象的结构、机理获得深层次知识。这些知识的表示方案有产生式规则、框架、语义网络。推理机利用知识库和用户信息按照一定的推理策略进行推理,对系统的运行状态做出结论,推理机的设计应考虑推理方法、推理策略和搜索方向。人机界面是用户和专家系统进行交互的窗口,将用户信息转化为计算机语言,将系统结论转化为用户可认知的形式。

2.2.2 人工神经网络

人工神经网络是近年来发展起来的一门交叉学科,是对人脑的生理模拟,它能够描

9

沈阳理工大学学士学位论文

述复杂的非线性关系。神经网络在用于故障检测与诊断时,常用的做法是:过程变量作为人工神经网络的输入层,输出层的每个神经元分别对应着不同类型的已知故障,用已知的过程数据对神经元网络进行训练,描述过程的正常状态和故障状态。在理论上,人工神经网络可以完美地描述系统行为,但是由于过程的复杂性,人工神经网络在进行训练时往往会遇到较大的困难。 2.2.3 因果分析法

因果分析法使用的是故障症状关系的因果模型,有符号定向陶(signed directed graph,SDG)和症状树模型方法(symptom tree model,STM)。SDG是一种显示过程变量间因果关系的图,它反映了过程的特性及系统的拓扑结构,使用SDG进行故障诊断的目标是,通过观察到的症状,定位代表系统故障的根节点。基本的SDG存在一些缺陷,对其改进后可以更好地进行故障诊断,STM与SDG相似,是一种将故障与症状关联起来的故障树模型的实时形式,在STM中,故障的根本原因是通过求取隶属于所观察症状的各种原凶的交叉点来确定的。 2.2.4 模糊理论

模糊理论是1965年Zadeh提出的,它是处理广泛存在的不确定、模糊时间的理论工具,为复杂系统的故障诊断提供了重要的理论方法。模糊逻辑系统的优点是一个适当设计的模糊逻辑系统可以在任意精度上逼近某个给定的非向性甬数。利用专家知识米构造模糊规则库,可以充分利用专家系统的推理规则。模糊理论和人工神经网络相结合,构成模糊神经网络用于故障诊断。模糊神经元与人工神经元相似,其特别之处在于它的部分参数或者全部参数通过模糊逻辑进行描述。

2.3 基于数据分析的方法

基于数据分析的方法,也称为基于信号处理的方法。该方法的思想是对过程的输入输出数据进行信息处理和特征提取,从而监控过程的状态变化

[14]

。该方法回避了过程

建模的问题,适用于大型工业系统的过程监控,已经成为近年来的研究热点。 2.3.1 主元分析法

主元分析 (principal component analysis,PCA)是一种有效的数据降维和特征提取方法,该方法可以最大可能地提取数据的主要变化,使用于大型的工业过程故障检测与诊

10

沈阳理工大学学士学位论文

断。PCA用于诊断诊断的基本思想是:对正常稳态数据进行PCA处理,得到数据的主要变化,进而建立统计模型,新的实时数据与统计模型进行比较,计算统计量SPE和T2,两个统计量中有一个超出统计阈值,就说明可能有故障产生。PCA是一种线性变换的方法,而且只考虑了变量问的相关性。系统的非线性和变量的时序相关性,严重影响了PCA故障诊断的灵敏性。许多学者对此进行了更进一步的研究,考虑到数据的时序相关性,先后提出了动态主元分析(Dynamic PCA,DPCA)、基于主元曲线和神经网络NPCA(nonlinear PCA,NPCA)和基于核函数的KPCA(kernel PCA,KPCA)处理过程的非线性以及PCA的递推算法用于过程的自适应监控,主元分析法和其他方法的相结合可以更加有效地进行故障诊断。 2.3.2 偏最小二乘法

偏最小二乘法又称为部分最小二乘法(partial least squares,PLS)和特征结构投影法(projection to latent structure,PLS)。它是一种将预测矩阵和被预测矩阵的协方差最大化的降维技术,该技术常用于软传感器的设计。应用PLS的故障诊断方法与PCA类似,选择被预测矩阵作为产品质量变量数据,选择预测矩阵包含所有的其他变量。 2.3.3 Fisher判别分析法

PCA包含了一定的优化特性,但是PCA没有考虑类之间的信息。Fisher判别分析(fisher discriminant analysis,FDA)考虑了各类之间的信息,在故障辨识方面比PCA更有优势¨引。通过对正常数据类的定义,FDA同样可以应用于故障检测。利用FDA进行故障诊断时,首先需要采集正常数据和各种故障数据,定义为不同的数据类。FDA是一种将各类数据进行最大程度分离的线性降维技术,它确定的一系列线性变换向量将使得类之间的离散度最大,类内的离散度最小。 2.3.4 规范变量分析法

规范变量分析法(canonical variate analysis,CVA)是一种多元统计分析的降维技术。对于两个变量集,CVA寻找一种线性变换使得两个变量集相关性最大。CVA算法用于故障检测与诊断时,两个变量集的定义是过去向量集和未来向量集。通过对CVA分析,可以获取过去向量集的最优线性变换,变换后的向量互不相关且与未来向量集的相关度最大,这组变换后的向量类似于状态向量,称为记忆向量(memory vectors)。在记忆向量

11

沈阳理工大学学士学位论文

的基础上,CVA算法通常定义3个统计量来监控过程的变化,诊断过程故障。 2.4.5 子空间法

子空间算法是一种模型辩识方法,该方法利用过程的输入输出数据来辨识过程的状态空间模型。CVA方法就可以看作是一种子空间算法。某些子空间算法在噪声情况下给出模型结构的一致性估计,从而可以更加准确地监控过程状态的变化。 2.4.6 小波变换法

小波变换是20世纪80年代中期形成的新的数学理论,在信号处理、模式识别、图象处理等领域有着广泛的应用。它在时域和频域同时具有良好的局部化性质,被誉为信号分析的显微镜。动态系统故障通常会导致系统的观测信号发生突然性变化。利用连续小波变换检测信号的奇异点,就可以检测出系统故障。再利用小波变换提取故障的特征,就可以进行故障的辩识。此外还可以将小波变换和神经网络结合,形成小波神经网络,这种网络具有良好的非线性逼近功能。小波变换和PCA相结合,充分利用了信号内在的信息,能够更加有效地进行故障检测。

12

沈阳理工大学学士学位论文

3 基于主元分析的故障诊断技术研究

3.1 主元分析的研究背景

主元分析研究多维随机变量总体,总体的每一个个体都可以用 p项指标来刻画。指标多固然有其描述详尽、刻画细腻的一方面;但指标太多,也容易造成主次不清,难以对所考察对象获得一个直观清晰的把握

[19]

。譬如,要分析比较若干个地区的经济发展

状况,对每一个地区都可以统计出数十项与经济状况有关的指标,这数十项指标虽然详尽地反映了一个地区的经济发展状况,但若要据此对不同地区的发展水平进行评价、比较、排序,则因指标太多、主次不明而显得过于复杂,也很难做到客观公正。另一方面,这数十项指标中,有些是主要的,有些是次要的,甚至有些指标间还有一定的相关性。鉴于此,一个自然的想法是:能否用较少的几项指标来代替原来较多的指标,而这较少的几项指标仍然能基本上反映出原来较多的指标所反映的信息。这就是提出主元分析方法的客观背景和实际需要。

然而主元分析方法不是去分析、比较各项指标的重要性,将那些不太重要的指标简单地去掉了事,而是通过全面分析各项指标所携带的信息,从中提取出一些潜在的综合性指标(称为主成分),用这不多的几项综合性指标替代原来较多的可观测指标去刻画每一个个体。既然分析的目的是减少指标的个数,所以也希望这不多的几项综合性指标每一个都能独立的反映某一方面的综合信息。因此从概率的角度可以要求这几项综合性指标相互间是不相关的。归纳起来,主成分分析的目的是通过分析原来较多可观测指标所反映的个体信息,提取出较少的几项综合性指标。它们互不相关,并且能最大限度地反映出原来较多指标所反映的信息,进而用这较少的几项综合性指标来刻画个体。

3.2 主元分析的数学思想

主元分析(PCA)是多变量统计方法,采用把高维信息投影到低维子空间,并保留主要过程信息的方法,该方法又被称为主成分分析。它在有一定相依关系的m个参数的n个样本值所构成的数据阵列Xn?m的基础上,通过建立较小数目的综合变量,使其更集中的反映原来m个参数中所包含的变化信息

[4,5]

。其基本方法是根据数据变化的方差大小

来确定变化方向的主次地位,按主次顺序得到各个主元。这些主元彼此之间是相互独立的。以二维的情况来做直观的说明。设某生产过程只有两个参数x1和x2。根据这两个变量参数的变化,将第二章统计过程控制理论基础中参数的数据点绘在二维平面上,如图

13

沈阳理工大学学士学位论文

3-1所示。样本点间的差异显然是由x1和x2的变化引起的,从图上看x1和x2变化范围相差都不大,但如果将坐标轴进行旋转,不难看出样本点的差异主要体现在y1轴上,y1所体现的差异占了大部分,譬如 85%以上,那么可将y2 忽略,只考虑y1,这样两个变量就缩减为一个,问题也就相对的简化了。

一般情况,设某生产过程有m个变量,若过程的差异可以由变量的k个主元(k

x2y2

.. .. .. .. . .图3.1 数据分布图

y1x13.3 主元分析的实现方法

3.3.1 主元分析的分解方法

从数学角度讲,PCA分解实质上是求数据协方差的特征值和特征向量。求协方差矩阵特征值和特征向量方法很多,主要有谱分解和奇异值分解两种方法差矩阵未知,由似然估计法得到协方差的估计值??n?1XTX。

(1)协方差矩阵的谱分解

PCA 方法作为一种有效的数据压缩和信息抽取的手段,其压缩过程实质上

14

[9]

。实际上,协方

沈阳理工大学学士学位论文

是数据矩阵X协方差矩阵的谱分解过程。

COV(X)?(m?1)?1?(Xi ?Xi)T (3.1)

? COV(X)pi??ipi (3.2)

式(3-2)中:COV(X)是X的协方差矩阵;pi是协方差矩阵的特征向量;?i是按降序排列的特征值;PCA 方法信息抽取实质上是选择几个有代表性的主元来解释数据中大部分变化。其数学表达式如下:

X?t1p1?t2p2?...?tkpk?Ek k?min{mn, } (3.3)

约束条件:

pipj?0,i?j , pipj?1,i?j , (3.4)

titj?0,i?j, titj?1,i?j, (3.5)

式(3.5)中,ti是系统主元得分向量,提取不同采样关联信息;pi是主元负载向量,提取变量间关联信息;k是模型保留的主元个数。残差矩阵 E提取随机噪声和模型误差信息。X的第一个主元t1表征数据块中最大方差变化信息。第二个主元表征数据块中第二大方差变化信息,以此类推,X的第i个主元表征数据块中第i个方向数据变化信息。

(2)协方差的奇异值分解(SVD)

PCA谱分解与数据矩阵的奇异值分解存在一定联系。X的奇异值分解:X?U?VT,其中:U的列为XXT标准特征向量;V由XXT标准特征向量构成;?是对角矩阵,对角线元素是XXT矩阵按降序排列的特征值的正平方根。基于前面 PCA 谱分解的定义,对比协方差矩阵的谱分解和奇异值分解方法,可以得出两种方法之间存在的联系。当P=V,T=U?时,两者等价。

(3)迭代算法

由主元分析方法可知,仅仅前几个主元就足以解释数据中大部分变化信息,所以并不要求计算数据矩阵的全部主元。迭代算法仅仅计算数据矩阵前几个主元,大大节省了计算时间。特别是主元维数远远小于变量维数时,迭代算法比谱分解和奇异值分解更快速、有效。变量维数较大时采用迭代算法。 3.3.2 主元得分向量的计算方法

设某生产过程中有m个变量。主元分析的过程实际上是对原坐标系进行旋转变换,

15

沈阳理工大学学士学位论文

使得新坐标系的原点与样本点集合的重心重合,新坐标系的选取的第一轴与数据变异的最大方向对应,新坐标系的第二轴与第一轴标准正交,并且对应于数据变异的第二大方向…,以此类推。这些新轴分别被称为第一主轴、第二主轴…。若经舍弃少量信息后,由主轴p1,p2...pk 构成的子空间能够十分有效的表示原数据的变异信息,则原来的m维空间就被降至k维,k?m,这个新生成的k维子空间被称为k维主超平面。当k=2时,就称其为主平面。可以用原样本点集合在主超平面上投影来近似地表示原样本点集合。原样本点集合在主超平面的第h主轴上的投影构成综合变量th?Rk,称为第h主元得分向量,主轴的方向向量ph称为主元负荷向量,h?1,2...k。

常用主元得分向量的计算步骤:对于正常运行的生产过程的监控数据矩阵

X?Rm?n,n是采样次数,m是变量的个数。

1、在实际问题中,不同的变量具有不同的量纲,为消除由于量纲不同可能带来的一些不合理的影响,通常应对测量数据进行标准化处理:

m ,X?(Xi?E(Xi))/var(Xi) (i?1,2,..... X?[X1,X2,.....,Xm] (3.6)

2、计算标准化后的数据矩阵X的协方差矩阵:

1 V?XTX (3.7)

n?1式(3.7)中的V也是标准化后的矩阵X的相关系数矩阵。

3、求协方差矩阵V的m个特征值?1??2?.....??m,以及所对应的特征向量

p1,p2,.....pm,其中pi 之间是相互标准正交的,即piTpi?1,piTpk?0 ,当i?k时,

i,k?1,2,.。m.

4、求第h主成分th,有:

th?Xph,h?1,2,.....,m (3.8)

式(3.8)中,主成分th是原数据列向量X1,X2,.....,Xm的线性组合,组合系数即为ph,从这个角度看,又可以说th是个新的综合变量。 3.3.3 确定主元个数的方法

在信息抽取过程中,合理确定主元个数十分重要,主元选取多则模型相对精确,但增加了分析与诊断的复杂性,无法有效清除噪声;主元个数选取过少,则不能充分提取

16

沈阳理工大学学士学位论文

原始数据空间的信息,使得分析与诊断的误差增加

[4,15]

。在实际检验中可采用交叉检

验法来确定最优主元个数,一部分用来建立主元回归模型,另一部分用来检验所建立的主元模型。通过保留不同数据的主元,建立若干主元模型,然后在检验数据上测试这些模型,并从中选取在检验数据中测试误差最小的那个主元回归模型。有几种技术可以确定主元个数,但目前为止还没有出现一种占主导地位的技术。下面简单介绍两种方法:

1.特征值方差累计贡献率

方差累计贡献率(Cumulative percent variance,CPV)是根据主元分析理论中样本协方差矩阵的最大特征值所对应的特征向量即是第一主轴方向,该特征值就是第一主元的方差,类似地,第二主元的方差和方向是由协方差矩阵的第二大特征值及对应的特征向量来决定。每个主元的方差和总方差的比值称为该主元对样本总方差的贡献率。确定主元贡献率累积和百分比的计算公式为:

CPV(k)?100(k??i?1i??i?1m )% (3.9)

i式(3.9)中,?i是X的协方差矩阵的特征值,m为变量的个数。使用该方法必须人为地选定一个期望的CPV值作为准则,如90%,95%或 99%。当CPV值大于期望的值时,对应的k值就是应该保留的主元个数。由于CPV期望值的选择是根据人为经验,所以该方法的主观性很强。

2.平均特征值法

平均特征值法(Average eigenvalue,AE),该方法选取大于所有特征值均值的特征值,作为主元特征值,同时舍弃掉那些小于均值的特征值。对应的特征值的序号即为确定的主元数。相关系数矩阵的特征值的均值计算公式是:

1m ????i (3.10)

mi?1m是变量个数。 3.3.4 主元模型的建立

在实施多变量统计分析时,需要建立一个反应过程正常运行的主元模型。将反映过程正常运行的历史数据收集起来,对这些数据进行主元分析,建立主元模型。由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将数据标准化,即将每

17

沈阳理工大学学士学位论文

个变量的均值减掉然后除以它的标准差。对标准化后的数据进行主元分析,如果只取前 k个主元,那么可以得到下面的主元模型:

X?t1p1?t2p2?...?tkpk?E?Xp?E (3.11)

TTT?t2p2?...?tkpk式(3.11)中,Xp?t1p1。

TTT3.3.5 主元分析的统计量

为了利用主元模型对生产过程进行监控,需要有过程正常的数据来确定过程运行的控制限。典型的监视控制图包括主元得分图和平方预测误差(SPE)图。当主元模型的SPE 或得分超出控制限时,就认为过程中出现了不正常情况。

对于生产过程中采集到的数据矩阵Xm?n,n为采样次数,m为变量个数,利用式(3.6)进行标准化后变为Xm?n ,求出Xm?n的协方差的特征值?i和特征向量pi,i?1,2,...,m后,进一步利用式 (3.8)求出个m主元得分向量T?(t1,t2,...tm)。在选取了其中k(k?m)个主元后得到Xm?n的重构数据:

??TPT?tpT?tpT?...?tpT (3.12) Xkk1122kk以及重构误差E:

? (3.13) E?X?X主元模型的预测误差平方和 SPE也称作Q统计量可以定义为:

Qi?eiei?Xi(I?PkPk)Xi (3.14)

TTT式(3.14)中ei是式(3.13)中E的第i行,Pk?[p1,p2,...,pk]是前个主元负荷向量,I为n?n的单位阵。SPE或Q统计量代表了数据中没有被主元模型所解释的变化。当SPE过大时,说明了过程中出现了故障现象,从过程正常运行数据所建立的模型已不再适用。控制限的计算是建立在一定假设基础上的,当检验水平为?时,SPE控制限可以按下式计算:

QUCL?a(b?cz?) (3.15)

d式(3.15)中z? 为标准正态分布的100?百分点,其他参数如下:

a?i?k?1??

in

18

沈阳理工大学学士学位论文

b?1?[?2h0(h0?1)](2?2h0)a2

c?ad?1h0

?2?i?k?1??nn2i

?3?h0?i?k?1??3i

(1?2a?3)3?22

若监测数据的Q统计量没有超出上限,属于正常数据;反之,数据为异常数据。 还可以通过Hotelling T2统计量来实现对多个主元同时进行监控。T2统计量通过主元模型内部的主元向量模的波动来反映多变量变化的情况,T2统计量的定义为:

Ti?ti?ti?XiPk?PkXi (3.16)

2?1T?1TT式(3.16)中ti是Tk矩阵中的第i行,Tk由构成主元模型的k个得分向量所组成;?是由与前k个主元所对应的特征值?i(i?1,2,...,k)所组成的k?k对角矩阵。Pk为前k个主元负荷向量。

Hotelling T2统计量指标的控制限计算如下:

k(n?1)2 Tk,m,?? Fk,n?1,? (3.17)

n?k式(3.17)中,?是显著性水平,n是数据采样次数,m为变量个数。k为数据阵的主元个数,F?(k,n?k)是对应检验水平为?,自由度为(k,n?k)条件下的分布临界值。通常定义:??0.05时的置信区间边界为预警边界,??0.01时的置信区间边界为报警边界。当统计量小于控制限时,数据正常,反之,数据异常。

3.4 基于主元分析的故障诊断流程

基于主元分析的故障诊断流程,如图3.2所示:

1、对于从过程采集获得的实时运行数据进行标准化处理; 2、将实时运行数据输入建立的主元模型;

3、在主元空间和残差空间分别计算Hotelling T2和Q两个变量;

19

沈阳理工大学学士学位论文

4、计算出两个统计量Hotelling T2和Q统计量控制限; 5、作出T2图和Q等多变量统计控制图,监测过程运行状态;

26、将Hotelling T统计量和Q统计量的计算结果与计算所得相应统计量一定置信

度的控制限比较,监测过程运行的状态是否发生异常;

7、若运行正常,利用实时数据对丰元模型参数(即均值和方差)进行在线调整: 8、若出现异常,则进行故障报警,并利用变量贡献图方法或基于故障重构的方法进行故障诊断,确定出故障源。

图3.2 基于PCA故障诊断流程图

故障重构贡献图 大于控制限?Y故障报警N运行正常计算T方统计量计算SPE统计量主元模型累计递推数据均值和方差标准化处理过程运行实时数据确定故障源确定故障变量

20

沈阳理工大学学士学位论文

4 基于主元分析的故障诊断技术应用仿真研究

4.1 应用仿真环境

4.1.1 田纳西--伊斯曼过程

田纳西--伊斯曼过程(Tennessee Eastman Process),简称TE过程,是由伊斯曼化学品公司创建的,其目的是为评价过程控制和监控方法提供一个现实的工业过程

[11]

。它是

一个模拟的仿真实际过程的模拟仿真,由J.J.Downs和E.F.Vogel首次提出。J.J.Downs和E.F.Vogel是美国Tennessee Eastman Process化学过程的控制小组成员。TE过程作为比较各种方法的数据源,已在过程监控领域得到了广泛的应用。

TE的测试过程是基于一个真实的工业过程的仿真,其中的成分、动力学、运行条件等因专利权的问题都作了修改。TE过程模型在公开发表时是以FORTRAN源代码的形式公开的,主要是描述非线性关系和物料与能量平衡问题。最近华盛顿大学的Prof.N. Lawrence Ricker提供了C语言的源代码,在MATLAB仿真软件上的Simulink上就可以进行仿真研究。TE过程中各个变量之间关系和数据的产生都可以通过Simulink仿真模块得到,使TE过程可视化,使用起来更加方便。

TE过程包括五个主要单元:反应器、冷凝器、压缩机、分离器和气提塔,包含八种成分:A、B、C、D、E、F、G和H。

TE过程共有4个反应,4个气体进料,分别为A、C、D、E,通过反应生成两种液体产品G、H和副产品F,此外在进料中含有少量的惰性成分B。

反应器的各种反应是:

A(g)?C(g)?D(g)?G(liq),

A(g)?C(g)?E(g)?H(liq),A(g)?E(g)?F(liq),3D(g)?2F(liq); (4.1)

其中(g)表示气体,(liq)表示液体。物质F是反应的副产品。反应是不可逆、放热的,并且对反应物浓度来说,近似为一阶的。反应速度是温度的Arrhenius函数,其中生成G的反应比生产H的反应有更高的活化能,导致对温度具有更高的灵敏度 4.1.2 田纳西--伊斯曼过程工艺流程

如图4.1所示,原料气体首先在反应器内进行反应,其反应物通过冷凝器冷却,然

21

沈阳理工大学学士学位论文

后进入气液分离器,从分离器分离出的蒸汽通过压缩机再次送入反应器。为了防止B和F的积聚,须排放一部分再循环流。来自分离器的冷凝成分流10被泵送到汽提塔。从汽提塔底部出来的产品G和H被送到下一个过程。

图4.1 田纳西--伊斯曼过程工艺流程图

A/B/CFIFCLC411LCFIXAXBXCXDXEXF6TICWRTI12反应器TITCLITCFCXCFIEAXCFIDXCFIFC3LICWSTC汽捉塔PIFC2SC冷凝器PI5LCFI1013FCXCFIFC17TICWRCWSFI8FCFIPHLFCXC9 排放JI压缩机XALIPI分XBXCXDTI汽/液分离器析器XEXFXGXH分析器FI分析蒸汽压缩机XDXEXFXGXH产品器4.2 仿真研究

4.2.1 基于主元分析的故障诊断步骤

对于生产过程的监测数据矩阵X?Rm?n,n是采样次数,m是变量的个数 1.将矩阵X进行标准化:

X?[X?Imu]D?T?12 (4.2)

式(4.2)中Im是m?m维单位矩阵,u?[u1,u2,...,um]T为变量的均值向量,

22D??diga(?12,?2,...,?m) 为变量的方差矩阵。

2.计算标准化后的数据矩阵X的协方差矩阵:

22

沈阳理工大学学士学位论文

V?1 XTX (4.3)

n?1式(4-3)中的V也是标准化后的矩阵X的相关系数矩阵。

3.求协方差矩阵V的m个特征值:?1??2?...??m,以及所对应的特征向量

p1,p2,...,pm,其中pi之间是互相标准正交的,即piTpi?1,piTpk?0,当i?k时,

。i,k?1,2,...m,

4.利用特征值方差贡献率累计和百分比的计算公式(3.9)来确定主元个数,式(3.9)中的CPV 定为95%。

5.求主元的得分向量:

ti?Xpi,i?1,2,...,kT?[t1,t2,...,tk] (4.4)

?和重构误差E。 6.利用式(3.12)和式(3.13)求出重构数据X7.利用式(3.14)和式(3.16)分别求取Q统计量和T2统计量。

8.利用式(3.15)和式(3.17)分别求取Q统计量的阈值和T2统计量的阈值,采样点超出阈值即为出现故障,反之为正常数据。 4.2.1 仿真概述

田纳西--伊斯曼过程包括41个测量变量和12个控制变量,所有的过程测量值都包含高斯噪声。TE过程仿真还包括21个预设定的故障如表5.1所示,这些故障中,16个是已知的,5个是未知的。故障1~7与过程变量的阶跃变化有关。故障8~12与一些过程变量的可变性增大有关。

表5.1 TE过程故障类型

变量号 1 2 3 4 5 6 7

变量名

A/C进料比率,B成分不变(流4) B成分,A/C进料比率不变(流4)

D的进料温度(流2) 反应器冷却水的入口温度 冷凝器冷却水的入口温度 A进料损失(流1)

C存在压力损失-可用性降低(流4)

23

类型 阶跃 阶跃 阶跃 阶跃 阶跃 阶跃 阶跃

沈阳理工大学学士学位论文

8 9 10 11 12 13 14 15 16 17 18 19 20 21

A、B、C进料成分(流4) D的进料温度(流2) C的进料温度(流2) 反应器冷却水的入口温度 冷凝器冷却水的入口温度

反应动态 反应器冷却水阀门 冷凝器冷却水阀门

未知 未知 未知 未知 未知

流4阀门固定在稳态位置

随机变量 随机变量 随机变量 随机变量 随机变量 慢偏移 粘住 粘住 未知 未知 未知 未知 未知 恒定位置

4.2.3 仿真结果

按照以上步骤编写程序,选取数据库0和数据库1的数据运行MATLAB软件进行训练和测试,得出仿真结果图。

训练集和测试集中的数据包含了所有的控制变量和测量变量,除了反应器的搅拌器的搅拌速度,总共有52个观测变量,不包含搅拌速度是因为没有对其进行控制。训练集数据产生时,仿真时间都是25h,仿真开始时没有故障情况,故障是在仿真时间1h的时候引入的,对于每一次所产生的观测数据总数是500,但只有480个观测数据是在一如故障后采集的,即只有480个观测值实际用于实验研究。测试数据运行的仿真时间都是48h。仿真在无故障情况下开始,在仿真时间为8h的时候引入故障,每一次运行所产生的观测数据总数为960,即21个故障的测试数据都是960行52列的数据。

图4-2为训练时的SPE统计图。图4-3为测试时的SPE统计图。图4-4为训练时的

T2统计图。图4-5测试时的T2统计图。图4-6为各主元对样本总方差的贡献率图。统计图图中红线为阈值,超出阈值即为故障数据,在阈值下的数据为正常数据。

24

沈阳理工大学学士学位论文

SPE统计图--训练9876543210

0100200300400500600采样次数7008009001000图4.2 SPE统计图—训练

图4.3 SPE统计图—测试

SPE统计图--测试2001801601401201008060402000100200300400500600采样次数7008009001000

25

沈阳理工大学学士学位论文

[17] 李尔国, 俞 金等. PCA在过程故障检测与诊断中的应用[M], 华东理工大学学报, 2011, 5: 1-8

[18] 陈国金, 梁 军, 钱积新. 独立主元分析方法及其在化工过程监控和故障诊断中的应用[M], 化工学报, 2007, 12: 14-17

[19] 赵立杰, 王 纲, 李 元. 非线性主元分析故障检测与诊断方法及应用[M], 信息与控制出版社, 2010: 359-361

[20] 徐东艳, 孟晓刚. MATLAB函数库查询词典[M],

31

, 2006: 55-62

中国铁道出版社沈阳理工大学学士学位论文

附录A:英文原文

Fault detection industrial processes using canonical variate

analysis and dynamic principal component analysis

1. Introduction

Large amounts of data are collected in many industrial processes. The task of fault detection is to use this data to determine when abnormal process behavior has occurred, whether associated with equipment failure, equipment wear, or extreme process faults. While techniques based on first-principles models have been around for more than two decades, their contribution to industrial practice has not been pervasive, due to the substantial cost and time required to develop a sufficiently accurate process model for a complex chemical plant. The fault detection techniques that have dominated the literature for the past decade and have been most effective in practice are based on models constructed almost entirely from process data.

The accuracy of detecting faults from data can be improved using data dimensionality reduction techniques, such as principal component analysis (PCA), dynamic principal component analysis (DPCA) and canonical variate analysis (CVA).The lower dimensional representations produced by these techniques can better generalize to new process data than representations using the entire dimensionality.

Academic and industrial process control engineers have applied PCA for abstracting structure from multidimensional chemical process data. PCA determines the most accurate lower dimensional representation of the data, in terms of capturing the data directions that have the most variance. The resulting lower dimensional model has been used for detecting out-of-control status and for diagnosing faults leading to the abnormal process operation. Several applications of PCA to real industrial data have been conducted at DuPont and other companies over the past 6 years, with much of the results available in various publications (for example, see Refs, and citations therein)

PCA can be extended to take into account serial correlations in the data by augmenting each observation vector with the previous l observations. We will refer to this approach as

32

沈阳理工大学学士学位论文

dynamic PCA (DPCA), irrespective of how the number of lags are selected (the DPCA method of Ref. is one implementation of this approach).CVA is a dimensionality reduction technique in multivariate statistical analysis involving the selection of pairs of variables from the inputs and outputs that maximize a correlation statistic. Like DPCA, the method takes serial correlations into account during the dimensionality reduction procedure.

PCA has been used to detect faults from data collected from real chemical plants and computer simulations the Tennessee Eastman process. Applications of DPCA and CVA to chemical processes either in simulation or industry are much more limited. The objective of this paper is to evaluate and compare the performance of PCA, DPCA, and CVA for detecting faults in a realistic chemical process simulation. In this comparison, a CVA-based residual space statistic is proposed

for use in fault detection. As will be seen later, the proposed statistic gave better overall sensitivity and promptness than the existing PCA, DPCA, and CVA statistics applied to the Tennessee Eastman process.

The paper is organized as follows. First, PCA and DPCA are briefly described. Then, the CVA statistical method and fault detection statistics are described. Finally, PCA, DPCA, and CVA are applied to data collected from the Tennessee Eastman process simulator. The sensitivity, promptness, and robustness of the statistics are compared. 2. PCA

2.1. Definition

PCA is an optimal dimensionality reduction technique in terms of capturing the variance of the data. PCA determines a set of orthogonal vectors, called loading vectors, which can be ordered by the amount of variance explained in the loading vector directions. Given n observations of m measurement variables stacked into a training data matrix X, the loading vectors are calculated by computing the singularities of the optimization problem

vTXTXvmax v?0vTv(1.1)

Wherev?Rm, the stationary points of Eq. (1).can be computed via the SVD

1X?U?VT n?1(1.2)

33

沈阳理工大学学士学位论文

Where U?Rm?n and V?Rm?n are unitary matrices and the matrix

??Rm?n contains

the nonnegative real singular values of decreasing magnitude (?1??2?....??min(m,n)?0) The loading vectors are the or normal column vectors in the matrix V, and the variance of the training set projected along the ith th column of V is equal to

?i2.

2.2 Fault detection

Normal operations can be characterized by employing Hotelling’s T2 statistic

T2?xTP?aPTx

?2(1.3)

Where P includes the loading vectors associated with the a largest singular values, contains the first a rows and columns of

?a?and x is an observation vector of dimension m.

Given a number of loading vectors, a, to include in Eq. (3), the threshold can be calculated for the T2statistic using the probability distribution.

(n2?1)aT??F?(a,n?a)

n(n?a)2(1.4)

WhereF?(a,n?a)is the upper 100a% critical point of the F-distribution with a and n-a degrees of freedom. The T2 statistic with Eq. (4) defines the normal process behavior, and an observation vector outside this region indicates that a fault has occurred.

The portion of the measurement space corresponding to the lowest m?a singular values can be monitored by using the Q statistic developed by Jackson and Mudholkar:

Q?rTr,r?(I?PPT)x

(1.5)

The threshold for the Q statistic can be calculated from its approximate distribution:

Q???1[h0c?2?2?1?2h0(h0?1)1h?1?]

?120(1.6)

Where ?i?j?a?1??2ji,h0?1?n

2?1?33?2234

沈阳理工大学学士学位论文

2.3 Reduction order

A key step in a data dimensionality reduction technique is to determine the order of the reduction. There exist several techniques for determining the number of loading vectors, a, to maintain in the PCA. Ku et al recommend the parallel analysis method, because it had the best performance in their applications. Parallel analysis determines the dimensionality of the PCA model by comparing the singular value profile to that obtained by assuming independent measurement variables. The dimension is determined by the point at which the two profiles cross. This approach is particularly attractive since it is intuitive and easy to automate. 2.4 DPCA

The previously discussed PCA monitoring methods implicitly assume that the observations at one time instant are statistically independent to observations at past time instances. For typical chemical processes, this assumption is valid only for long sampling intervals, e.g,2 to 12 h. Shorter sampling intervals are de-sired for speedy fault detection, in which case a method taking into account the serial correlations in the data may provide improved fault detection. The PCA methods can be extended to take into account the serial correlations, by augmenting each observation vector with the previous l observations and stacking the data matrix in the following manner,

?xtT?X(l)??xtT?1?xtT?l?n?xtT?1xtT?2xtT?l?n?1xtT?l??xtT?l?1? xtT?n??(1.7)

Where xtT is the m-dimensional observation vector in the training set at time in stancet. By performing PCA on the data matrix in Eq. (7), a multivariate auto regressive (AR) (ARX model if the process inputs are included.) is extracted dire ctly from the data.The Q statistic is then the squared prediction error of the ARX model. If enough lags l are included in the data matrix, the Q statistic is statistically independent from one time instant to the next, and threshold (6) is theoretically justified. This approach of applying PCA to TE. (7).is referred to here as dynamic PCA(DPCA).To determine the number of lags l, autoregressive models with several different numbers of lags to the training data are fitted. The number of lags l is selected to be the lag minimizing the small sample AIC criterion [7]. Note that this method for automatically determining l is not the same as that used by the DPCA algorithm of Ku et al. The T2and Q statistics and their thresholds generalize directly to DPCA. 3. Application

The Tennessee Eastman process simulator was created by the Eastman Chemical Company to provide a realistic industrial process for evaluating process control and

35

沈阳理工大学学士学位论文

monitoring methods. The Tennessee Eastman process simulator has been widely used by the process monitoring community as a source of data for comparing various approaches. The test problem is based on an actual chemical process where the components, kinetics, and operating conditions were modified for proprietary reasons. A diagram of the process is contained in Fig. 1.The simulation code allows 21 preprogrammed major process upsets, as shown in Table1. The plant-wide control structure recommended in Lyman and Georgakis[ was implemented to generate the closed loop simulated process data for each fault. For detailed discussion on the control structures of the Tennessee Eastman process simulator, please refer to Refs.

The training and testing data sets for each fault consisted of n?500 and 960 observations, respectively. Each data set started with no faults, and the faults were introduced 1 and 8 simulation hours into the run, respectively, for the training and testing data sets. All the manipulated and measurement variable except the agitation speed of the reactor’s stirrer for a total of m?52 variables were recorded. The data was sampled every 3 min, and the random seed was changed before the computation of the data set for each fault. Twenty-one testing sets were generated using the preprogrammed faults (Fault 1–21). In addition, one testing set (Fault 0) was generated with no faults.

Fig.2.The (D)PCA multivariate statistic for fault detection for Fault 4

36

沈阳理工大学学士学位论文

Multiple faults occurring within the same time window are likely to hap-pen for many industrial processes. The statistics for detecting a single fault are directly applicable for detecting multiple faults because the thresholds in Eqs. (4) and (6)depend only on the data from the normal operating conditions(Fault 0). Multiple simultaneous faults should be detectable provided that their affects on the measured process variables do not cancel. The task of diagnosing multiple faults is rather challenging and the proficiencies of the fault diagnosis statistics depend on the nature of the combination of the faults.

The minimum missed detection rate achieved for each fault except Faults 3, 9, and 15 is contained in a box in Table 4. Except for the CVA Q-statistic, the statistics which quantify variations in the residual space were usually sensitive to the faults than the statistics quantifying the variations in the score or state space. In other words, the faults usually created new states in the process rather than magnify the states during in-control operations. For example, consider Fault 4, where the missed detection rates for T2and the D (PCA)-based Q statistics are much smaller than T2and the (D.) PCA-based T2statistics (see Table 4).The extent to which the multivariate statistics are sensitive to Fault 4 can be examined in Figs. 2. 4. Conclusions

The Tennessee Eastman process simulator was used to compare PCA, D-PCA, and CVA for detecting faults in terms of sensitivity, promptness, and robustness. This comparison included a proposed residual space CVA statistic (T2) for fault detection. This appears to be the first application of this residual sp-ace CVA statistic for detecting faults.

Except for the CVA-based Q statistic, the statistics quantifying variations in the residual space (CVA T2, PCA Q, and DPCA Q statistics).were more sensitive for most faults than the statistics quantifying the variations in the score or state space (CVA T2, PCA T2and DPCA

T2 statistics.). The statistics exhibiting a small missed detection rate usually exhibited small detection delay and vice versa. The smallest detection delays were usually exhibited by either the CVA-based T2or Q statistics.

Based on the original thresholds, the PCA- and DPCA-based T2statistics gave lower false alarm rates than the DPCA-based Q and the CVA statistics. The lack of robustness of CVA was due to the CVA statistics being overly sensitive to a matrix inversion step. A strength of applying the proposed CVA-based T2statistic is that it is sensitive and prompt;

37

沈阳理工大学学士学位论文

however, its threshold must be adjusted to achieve robustness. With the thresholds defined so that the techniques had similar missed detection rates, DPCA had similar performance as to PCA for most faults.

38

沈阳理工大学学士学位论文

附录B:汉语翻译

基于PCA的工业过程故障诊断

1 概述

大量数据在许多工业生产过程中收集。故障检测任务是使用这数据确定反常行为什么时候发生,是否与设备故障、设备外包或者极端过程故障有关。由于为一个复杂的化学故障创建一个精确的模型需要很高的花费和时间,所以基于基本原理模型的技术都已经出现二十多年了,它在工业实践并没有得到广泛应用。在实践中得到广泛应用并在文献中得到广泛研究的故障检测技术都是利用全部过程数据建立模型的。检测故障的准确性,可以用数据的降维技术来提高,如主成分分析(PCA)动态主元分析(DPCA)和规范变量分析(CVA)。使用低维描述比全维描述更能推断出更新的过程数据。学术界和工业程序控制的工程师从多维化学过程数据[1][2]提取了PCA结构。PCA是根据获取数据的变化度来确定数据的最准确的低维描述法的。低维表示模型已经在诊断失控状态和诊断异常过程操作中应用[3]。PCA在Dupont和其他公司的工业数据中的几种应用已有六年,很多成果已经刊登在各种各样的出版物上。

考虑到数据中的序列相关性,PCA可以用前面的l个观测对每个观测向量进行扩充。我们将借鉴这种做法提出动态 PCA(DPCA),不考虑滞后时间是怎么选定的(文献[6]就是这种方法的一种应用)。在多元统计分析中CVA是一种涉及选择对变量输入和输出最大化相关统计的降维技术。像DPCA这种方法,在降维过程中就把数据序列相关性的进行了考虑。

PCA 的已应用于从实际化工厂和计算机仿真收集的数据的检测故障(田纳西-伊斯曼过程)。对 DPCA 和 CAV 的应用,无论是在仿真或是化工方面都是有限的。本文的目的就是要评价和比较 PCA、DPCA和CAV在一个现实化工过程中检测故障的表现。在这方面比较,CAV 中基于剩余空间的统计(T2)应用于故障检测中。后面可以看出,拟议的统计量比现有的、应用到田纳西伊斯曼进程中PCA,DPCA和CAV统计量具有更好的整体敏感性和实时性。本文安排如下。首先,简要介绍PCA和DPCA。然后,介绍CVA统计方法和故障检测的统计。最后,PCA,DPCA和CVA应用到从田纳西-伊斯曼过程仿真收集的数据。各种统计量的灵敏性、实时性和鲁棒性将进行比较。

39

沈阳理工大学学士学位论文

2 PCA

2.1 定义

PCA是一种线性降维技术,是按获取数据的变化度是最优的。PCA确定了一系列相互正交的向量,称为负荷向量,按照在负荷向量方差大小来排序。给定一个训练集,它有n个观测值,m个过程变量,写成矩阵X的形式,则负荷向量可通过求解如下最优化问题的稳态点来计算:

vTXTXv max T (1.1)

v?0vv其中v?Rm。式(1)的稳态点可通过奇异值分解(SVD)来计算:

1 X?U?VT (1.2)

n?1其中U?Rm?n和V?Rm?n都是单位矩阵,矩阵??Rm?n包含沿其主对角线递减的

(?1??2?....??min(m,n)?0)实的非负奇异值,其他非对角元素为零。负荷向量是矩阵V

中的正交的列向量,训练集沿矩阵V 第i列的投影的方差等于?i2。 2.2 故障检测

正常操作可以用 Hotelling T2统计量进行描述:

T2?xTP?aPTx (1.3)

?2其中矩阵 p 包括与a 个最大奇异值相关联的负荷向量,?a包含?的前a行和列, X是一个维数为m的观测向量。给定负荷向量的数目a,T2统计量阈值可以通过分布函数计算:

(n2?1)a(1.4) T??F?(a,n?a)n(n?a)其中F?(a,n?a)是指自由度为a和n-a的F -分布的上100 %临界点。式(1.4)中的统

2计量表示的是正常过程行为,当一个向量偏离阈值就意味着故障发生。

观测空间中与(m-a)个最小奇异值相对应的那部分可以用Q统计量进行控制,Q统计量是由Jackson和Mudholkar发展的。

Q?rTr,r?(I?PPT)x (1.5)

Q统计量的阈值可以通过近似分布计算:

?2h0(h0?1)1hQ???1[?1?]2??1 (1.6) 1

0

h0c?2?2

40

沈阳理工大学学士学位论文

这里 ?i?

j?a?1??2ji,h0?1?n2?1?33?222.3 降维顺序

数据降维技术的一个关键步骤就是确定降维顺序。有几种技术可确定PCA中保留的负荷向量的数目a的值。Ku et al 推荐使用平行分析法,因为在他们的经历中,这种方法在各方面都表现的最好。平行分析法通过把方差轮廓线与通过假设独立观测变量获得的轮廓线进行比较来确定维数。降阶由两个轮廓线的交叉点确定,这种方法直观且容易自动实现,所以特别具有吸引力。

2.4 DPCA

前面讨论的 PCA 监控方法都隐含地假定:一个时刻的观测值对于前面时刻的观测值来说是统计独立的。对于典型的工业过程,这一假定只对长采样间隔是有效的,例如 2-12h。这间接地表明需要一种考虑到数据中序列相关性的方法,用来实现快速采样时间的过程监控方法。PCA 方法可以用前边l个观测对每个观测向量进行扩充的方法考虑序列相关性。

?xtT?X(l)??xtT?1?xtT?l?n?xtT?1xtT?2xtT?l?n?1xtT?l??xtT?l?1?xtT?n?? (1.7)

其中,xtT是t时刻在训练集中的m维观测向量。通过对式(7)的数据矩阵进行PCA处理,可以从数据中直接得到多变量的自回归(AR)(如果包含了过程输入,也可以直接从数据中得到ARX模型)。Q统计量是ARX模型的平方预测误差。如果在数据矩阵中包含了足够滞后l,则从一个时刻到下一时刻,Q统计量是统计上独立的,并且阈值(6)在理论上也是合理的。这种把 PCA 应用到式(7)的方法称为动态 PCA(DPCA)。可以用不同滞后时间的自回归模型在训练集中应用来确定滞后l 。滞后l可以通过小样本AIC 准则来选择。T2和Q统计量以及它们的阈值可以直接用于DPCA。

3 应用

田纳西-伊斯曼是由伊斯曼化学公司创建的,其目的是为评价过程控制和监控方法提供一个现实的工业过程。田纳西-伊斯曼过程仿真作为比较各种方法的数据来源,已在过程监控领域得到了广泛的应用。。测试过程

是基于一个真实的工业过程仿真,其中的成分、动力学、运行条件等因为专利权的问题都做了修改。图1是该工业设备的工艺流程图。仿真代码包括21个预设定的故障。

41

沈阳理工大学学士学位论文

Lyman和Georgakis建议为每个故障产生一个闭环过程仿真数据。

训练集和测试集分别为每个故障设置了n =500和n =960个观测值。仿真开始时没有故障,在训练集中故障是在仿真时间1h的时候引入的。在测试集中,故障是在仿真时间8h的时候引入的。所有测量变量和控制变量中除了反应器中的搅拌器的搅拌速度外共用m =52个变量。每个变量的采样间隔为3min。在每次运行之间,都改变随机过程的随机种子来产生故障。21次测试运行产生21个预设定的故障(故障1-21)。而且故障0是在没有故障的情况下发生的。

图2对于故障4,用于故障检测的(D)PCA多变量统计量

多重故障发生在用一时间可能是发生在许多的工业生产过程。检测单一故障的统计量可以直接应用于检测多重故障,因为式(4)和(6)中的阈值是依赖于从正常运作产生的数据的(故障0)。当多个同步故障对过程变量的影响没有消失时,就会被检测出来。检测多重故障具有挑战性,而且该故障诊断统计量的熟练程度取决于多重故障相结合的性质。

除故障3、9和15,所有故障的最小漏检率都在表4中。除CVA的Q统计量,在残差空间的统计量都比在得分或状态空间的统计量要敏感。换句话说,故障经常在过程中创建一个新的状态而不是在受控操作中放大状态。例如故障4,T2和D(PCA)中的Q统计量比T2和(D)PCA中的T2统计量要小。哪种多元统计量对故障4更敏感。

42

沈阳理工大学学士学位论文

4 结论

田纳西-伊斯曼过程仿真在灵敏性、实时性和鲁棒性上对 PCA、DPCA 和CVA 进行比较。这种比较包括一个假定的残差空间 CVA(T2)故障检测统计量。这是首次用 CVA残差空间统计量进行故障检测。

除CVA的Q统计量,对于大多数故障,在残差空间的统计量(CVA-T2PCA Q,和 DPCA Q统计量)比在得分或状态空间的统计量(CVA T2,PCA T2和 DPCA T2统计量)要灵敏。统计量有小的漏检率就会有小的检测延迟,反之亦然。CVA的T2和Q统计量通常表现出最小的检测延迟。

基于原始的阈值,PCA和DPCA的T2统计量的误报率比 DPCA 的Q统计量和CVA 的统计量的误报率要小。CVA缺乏鲁棒性是由于它的统计量对矩阵的逆更敏感。一个应用CVA的T2统计量的重要原因是它的灵敏性和实时性,但是它的阈值必须进行调整,以实现鲁棒性。由于阈值的定义,DPCA和PCA对大多数故障有类似的漏检率。

43

本文来源:https://www.bwwdw.com/article/iw3p.html

Top