电子产品健康监测和故障预测方法的案例研究_孙博

更新时间:2023-05-23 23:54:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

故障物理

第29卷 第6期2007年6月

文章编号:1001-506X(2007)06-1012-05

系统工程与电子技术

SystemsEngineeringandElectronicsVol.29 No.6Jun.2007

电子产品健康监测和故障预测

方法的案例研究

孙 博1,赵 宇1,黄 伟1,谢劲松1,康 锐1,吕 瑞2

(1.北京航空航天大学可靠性工程研究所,北京100083;

2.沈阳飞机设计研究所,辽宁沈阳110035)

摘 要:以工程实际中广泛应用的电子产品为案例,对电子产品健康状态监测和故障预测的方法和流程进行了实验验证。实验中采用了性能参数监测法与故障物理模型法相结合的形式,将健康状态监测和故障预测的一般性方法、技术和理论应用到具体的电子产品,对相关的实验流程和实验数据分析结果进行了详细阐述。通过本

实验验证案例研究,明确了实现健康状态监测和故障预测在实验上的技术细节问题,为工程中实际构建电子产品的健康状态监测和故障预测能力提供了实践积累。

关键词:健康状态监测;故障预测;实验验证;故障物理;失效机理;电子产品中图分类号:N945.17;V240.2    文献标识码:A

Casestudyofprognosticandhealthmanagementmethodologyforelectronics

SUNBo1,ZHAOYu1,HUANGWei1,XIEJing-song1,KANGRui1,L Rui2

(1.Inst.ofReliabilityEngineering,BeijingUniv.ofAeronauticsandAstronautics,Beijing100083,China;

2.ShenyangAircraftDesignInst.,Shenyang110035,China)  Abstract:Acasestudyofprognosticandhealthmanagement(PHM)methodologyforelectronicsispresen-

ted.Amethodwithcombinedparametricmonitoringandreal-timemodel-basedpredictionisusedinthestudy

onacommercialelectronicproduct.Ageneraltestflowandaprocessthatwasdevelopedinaprecedentstudyareverified.ThisstudyidentifiestechnicalissuesthatremainyetdevelopingasatisfactoryPHMmethodologyforavionicsandotherelectronicsystem.

Keywords:prognosticandheathmanagement;testverification;reliabilityphysics;failuremechanism

0 引 言

电子产品尤其是航空电子产品,其系统结构组成复杂,工作环境条件恶劣,要求具有更高的可靠性,对其进行视情维修或更换显得尤为重要。而具有实时的健康状态监测和故障预测能力,可以实现这一需求。实时的健康状态监测和故障预测能力已成为下一代复杂系统的一个主要特征[1]。由于实时的健康状态监测和故障预测涉及众多的方法和技术以及电子产品的特殊性,使得其在具体的工程应用中存在较大困难。

国外尤其是美国已在这方面开展了一些案例研究工作。如美国Impact公司主要利用特征参数监测方法,如GPS(globalpositioningsystem)系统的特征参数值来判别产品的健康状态[2]。而由于作为电子产品故障判据的应力或性能参数难于直接监测和获得,通常采用故障物理方法

收稿日期:2006

0407;修回日期:200606

02。

实现对其健康状态的监测,即间接地通过监测产品的实际

使用环境条件如温度、振动等参数信息,进而结合故障物理模型实现对电子产品的健康状态监测和故障预测

[3]

。如美

国马里兰大学CALCE中心采用故障物理模型方法,对航空电子产品在温度、振动以及冲击等环境应力作用下的健康状态监测和剩余寿命预测进行的案例研究

[45]

。相比

Impact公司侧重通过对可以表征产品健康状态的特征参数进行监测来实现健康状态监测和故障预测,CALCE中心更注重最终造成电子产品损伤的失效机理的故障物理模型评估来实现。

本研究项目的前期工作已经对健康状态监测和故障预测的方法进行了总结,讨论了健康状态监测和故障预测的基本方法、失效模型的形式和不同数据处理技术的适用范围,明确了上述方法、形式和技术三者之间的相互关系[6]。并且,在此研究的基础上建立了电子产品健康状态监测和

。E-@dse.edu

故障物理

 第6期孙博等:电子产品健康监测和故障预测方法的案例研究

·1013 · 

故障预测的工作流程,利用假定的监测数据作为案例,演示了在已获得实测数据的基础上进行产品健康状态监测和故障预测的具体步骤[7]。此外,对作为故障物理模型方法基础的失效机理及其故障物理模型进行了研究和总结分析,包括印制电路板中电镀通孔(PTH)的疲劳寿命评估模型,金属互连线部位的电迁移(EM)失效机理及模型,芯片内部MOS管氧化层的热载流子退化效应(HC)和时间相关的氧化层击穿(TDDB)失效机理及模型以及各种封装形式焊点的疲劳寿命评估模型等[812]。但是,如何将上述一般性的理论、方法和技术应用到实际具体产品的健康状态监测和故障预测中,仍需要具体的案例研究及真实的实验监测数据结果分析给予指导说明。

本文将在上述研究内容的基础上,以工程实际广泛应用的典型电子产品为案例,对健康状态监测和故障预测的流程进行实验验证。与Impact公司和CALCE中心不同,实验中将采用参数监测法和故障物理模型法相结合的形式,对实际电子产品进行健康状态监测和故障预测的实施流程进行详细说明。首先利用可能引起产品故障的失效机理的故障物理模型来预计不同环境应力水平下产品的寿命,进而通过加速实验来验证上述预计结果。同时,在实验中对可以表征产品健康状态的特征参数进行监测,最后将两种方法得到的实验结果进行比对分析。

式中:Ai、Bi———实验参数,VD———漏端电压,VDsat———漏端饱和电压,ID———沟道电流,Isub———衬底电流,l———MOS管有效沟道长度(μm),K1———实验常数。1.2 剩余寿命预测模型

剩余寿命预测是指在故障物理模型获得的产品损伤百分比数据的基础上,进一步预测产品可以继续可靠工作的时间(这里的时间可以是天数、循环周期数,也可以是公里数等)。根据Palmgren-Miner线性损伤累积理论,不同应力水平下的损伤百分比可以近似由该应力水平下产品的实际工作时间同该应力水平下预计的产品失效前时间的比值来确定

[13]

,即

n

DR=

i=1

ti

(4)

式中:ti———根据故障物理模型预计的不同应力水平下产品

的总失效前时间,Δt———该应力水平下产品的实际工作时间,DR———产品在n个不同应力水平下工作后的累积损伤百分比。当DR≥1时,我们就认为该产品发生失效。在产品使用环境变化不大的情况下,可根据式(5)计算剩余寿命;而在产品使用环境变化较大的情况下则使用式(6)进行计算[13]。

RLN=

N-N

ADRN

(5)

1 实验设计的方法和理论基础

本实验中利用参数监测法和故障物理模型法以及相应的故障物理模型对实验样品的健康状态进行监测和故障进行预测。为了便于后面的阐述和讨论,本节首先对实验中涉及到的方法和理论进行简要的说明。1.1 失效机理及故障物理模型

根据本实验案例产品的结构组成及特点,主要考察了如下4种失效机理引起的失效,即印制电路板PTH的疲

劳失效,有引脚形式芯片封装结构焊点的疲劳失效,金属互连线部位的电迁移失效以及MOS管氧化层内的热载流子退化失效。针对这4种机理,已有研究给出了相应的故障物理模型,为了便于后面计算,这里给出了电迁移的寿命评估模型

[10]

式中:RLN———第N天时的剩余寿命,ADRN———第N天时的累积损伤百分比。

RLN=RLN-1-DRN×TLN-1

(6)

式中:RLN———第N天时的剩余寿命,DRN———第N天的损伤百分比,TLN-1———第(N-1)天时预计的产品失效前时间。

2 实 验

2.1 实验样品

在实验样品的选取上主要考虑了产品结构相对简单、成本相对低廉、应用比较广泛等因素,在市场上选取了某厂商生产的7个闪存产品作为实验样品,其外观如图1所示。样品的主要结构组成和技术指标见表1所示。

(式1)和热载流子退化的寿命评估模型

[11]

(式2-3)。PTH和焊点的疲劳寿命评估模型由于形式较为复杂,不在这里列出,具体的详细信息可参见相应文献

[89,12]

aMTTF=3eCj

3

E

(1)

式中:W———局部线宽(μm),d———局部线厚(μm),Ea———激活能(eV),j———电流密度(A/cm2),T———绝对温度(℃),k———波尔兹曼常数,C———实验常数。

lBIsub≈(VD-VDsat)IDexp()

B

(2)3)

图1 实验样品外观及主要组成结构示意图

故障物理

 · ·1014

表1 样品的主要结构组成及其技术指标[15]

名称  闪存样品电源控制模块Hynix闪存芯片

系统工程与电子技术第29卷 

表4 Hynix芯片中电迁移和热载流子退化模型输入参数

模型参数

芯片内互连线材料局部线宽W/μm局部线厚d/μm激活能Ea/eV电流密度j/(A/cm2)波尔兹曼常数k/(J/K)

栅氧化层厚度xox/nmMOS管沟道长度L/μm有效沟道长度Leff/μm阈值电压VT/V栅极电压VG/V源端电压VS/V漏端电压VD/V拟合参数μcm2V-1)0/(拟合参数εMV·cm)0/(拟合参数v

实验参数vsat/(cm/s)实验参数Ai/(μm-1)实验参数Bi/(V/μm)

Al0.150.450.583.33×104

1.380662×10-234

0.130.080.451.803.36700.671.68×106200170

参数值

主要技术指标及封装形式存储容量:128MB

存取速率:读出1000kB/s;写入800kB/s工作电压:5V;SOT封装芯片工作电压:3.3V;TSOP封装芯片

主要

结构组成

iCreate闪存控制器工作电压:3.3V;TSOP封装芯片

2.2 实验条件的评估

如前面所述,我们考察了如下4个机理,即PCB镀通孔的疲劳失效,芯片焊点的疲劳失效,芯片内金属互连线部

位的电迁移失效以及MOS管氧化层内的热载流子退化失效。从这4个机理的故障物理模型可以看到,影响失效的主要应力是温度。利用前面描述的模型和方法,可以对样品在不同实验条件下的寿命进行初步的评估。

进行寿命预测计算所需要的相关几何参数、材料参数以及其它参数如表2~4所示(除PTH的几何参数是在立体显微镜下实测得到外,其它数据来源于样品技术资料[15]和相关文献[8])。利用这些参数数据,选取不同的实验条件(如温度应力水平等),可分别计算得到各失效机理下的预测寿命,结果如表5所示。

表2 PTH疲劳寿命评估模型输入参数模型参数

镀层/基板材料弹性模型E/psi泊松比μ

热膨胀系数CTE/(ppm/℃)屈服强度/psi断裂强度/psi基板厚度H/μmPTH孔径r/μm镀层厚度t/μm

等效基板作用半径Req/μm

PTH孔。

表3 焊点疲劳寿命评估模型输入参数模型参数

封装体长度E/mm封装体宽度D/mm管脚厚C/mm管脚与焊料接触处的面积尺寸/mm热膨胀系数/(ppm/℃)引脚的柔性刚度KD/(lb/in)最大循环应变能密度

3参数值

iCreate芯片

813.40.2B=0.22

L=0.8

Hynix芯片

20120.2B=0.17~0.25

L=0.5~0.68

Cu12×1060.351825000400001000225252025*

参数值

FR-40.5×1060.1350

表5 不同应力水平下各机理的寿命预测结果

应力水平0℃

~125℃

PTH7600cycles760天*12400cycles1240天*

Hynix焊点iCreat焊点28911cycles2891天*23620cycles2362天*

123333cycles12333天*98104cycles9810天*

电迁移277h

热载流子460h

332276天**天***197h

460h

25℃~135℃

236276天**天***

注:*按10cycles/天计算;

**按10cycles/天,高温持续时间5mins/cycles计算;***按10cycles/天,加电持续时间10mins/cycles计算。

从上述寿命预测结果可以看到,PTH及焊点的疲劳失效其预测寿命时间较长,而电迁移和热载流子的寿命预测时间相对较短。通过对实验条件的初步评估,可以便于我们对实验所需的相关设备、人力等资源进行统一协调。2.3 样品性能特征参数的选取

对于电子产品,一般可采用参数监测法或故障物理模型法对其进行健康状态监测和故障预测,两种方法的具体选择需要根据实际电子产品的失效判据而定[7]。根据健康状态监测和故障预测流程,本实验中采用了参数监测法中的性能参数监测法和故障物理模型法中的寿命模型法相结合的方式。

对于闪存产品,存取速率是衡量其性能的重要参数之一。在产品处于正常状态时,其速率基本保持不变;而当产品处于非正常工作状态下时,由于发生错误需要进行反复验证和校验而增加了芯片的存取时间,随着错误的增多,时间越来越长,可用作闪存产品的故障判据之一。在,*注:这里等效半径的确定考虑了基板中可能产生最大应力的那个

基板(FR-4):50

封装体材料:6.35000.00328

4000.006085

故障物理

 第6期孙博等:电子产品健康监测和故障预测方法的案例研究

·1015 · 

格式和大小的数据文件,来对其存取速率性能参数进行监测。

与此同时,由于闪存的基本功能是对数据文件的存取。一般来讲,主要表现为文件数据丢失,盘符不能识别等功能

故障模式。本实验中,利用自行设计的实验程序实时地对样品文件数据存取的准确性和存取时间进行监测,程序功能框图如图2所示。

图4 实验流程示意图

图2 实验监测程序功能框图

3 实验结果和讨论

3.1 性能参数的监测结果

按照上述实验流程,从2005年10月开始对7个样品进行了不定时的温度循环实验。对样品所经历的温度环境条件和样品的性能参数同时进行了监测,到目前为止已累计经历不同温度循环幅值的686个温度循环周期,其中已确定发生失效的样品有3个,表现为不能正确识别盘符。样品的性能监测数据如图5中间部分所示。

从图5中可以看出,2#、4#、6#样品由于发生了失效,其存取时间监测曲线中断。然而,也可以看到本实验中所选取的性能参数对失效并不够敏感,在失效前没有发生明显的趋势变化(超出阈值范围)。此外,通过对存取时间监测结果的统计分析,可以看出样品性能参数存在着分散性。3.2 剩余寿命预测结果

对实验中监测记录的温度数据进行初步的处理,再结合各个机理的故障物理模型可以计算得到样品在不同机理下的累积损伤率,如图5所示。

图5中上面部分记录了样品在实验期间所经历的具有不同循环幅值的温度循环条件。图中大圆圈内给出了每个循环周期内典型的温度剖面。图5中下面部分是根据相应的模型和参数计算得到的寿命耗损曲线。可以看出,由于没有考虑样品在几何参数、制造工艺质量等方面的分散性,,2.4 实验装置

根据前面确定的实验条件和选定的样品性能监测参数,

建立了如图3所示的实验装置。其中,温箱用于控制样品的实验条件,监测程序用于实现对功能状态和性能参数的监测。

图3 实验装置示意图

2.5 实验流程

针对上述实验设计,利用文献[7]中提出的性能参数监测法和寿命模型法对闪存产品进行健康状态监测和故障预。

故障物理

 · ·1016

系统工程与电子技术第29卷 

率相同。随着产品实际使用时间的增加,每个机理下的累积损伤率都在增大,即产品的寿命在发生耗损。在各失效机理引起的寿命耗损中,电迁移最大,热载流子次之,而

PTH和焊点疲劳引起的寿命耗损最小(

表现为寿命耗损曲线比较平缓)。据此可以推断,随着样品使用时间的增加,样品最有可能首先发生电迁移失效。

图5 存取时间监测数据及样品在不同机理下的累积损伤率

此外,寿命耗损监测曲线还可以反映产品在不同应力

水平下不同程度的寿命耗损情况。在图中小圆圈监测时段(第50天左右),由于实验温度升高,使得受高温值影响较大的电迁移失效的寿命耗损有显著增加。据此可以对产品实际使用情况下的健康状态进行实时的监测。进而可以利用前面叙述的剩余寿命预测模型对样品的剩余寿命即未来的健康状态进行预测。

USA,2004:381386.

[4]WilkinsonC,HumphreyD,VemeireB,etal.Prognosticand

healthmanagementforavionics[J].IEEE,2004,5:34353447.

[5]VichareN,EveloyV,RodgersP,etal.In-Situtemperaturemeasurementofanotebookcomputer-Acasestudyinhealthand

usagemonitoringofelectronics[J].DeviceandMaterialsRelia-bility,IEEETransactions,2004,4(4):658

663.

[6]谢劲松.失效模型的形式与实时故障诊断预测的基本方法和技

术[C]∥中国电子学会第十一届全国可靠性物理学术讨论会论文集.浙江温州,2005:283290.[7]马静华,谢劲松,康锐.电子产品健康监控和故障预测的流程和

案例[C]∥中国航空学会可靠性工程专业委员会第十届学术年会论文集.北京:国防工业出版社,2006.[8]孙博,谢劲松,康锐.印制电路板镀通孔应力-应变分布的简化模

型[C]∥中国电子学会第十一届全国可靠性物理学术讨论会论文集.浙江温州,2005:102

111.

[9]XieJingsong,KangRui,ZhangYuan,etal.APTHreliabili-tymodelconsideringbarrelstressdistributionsandmultiple

PTHsinaPWB[C]∥The44thInternationalReliabilityPhysics

Symposium,

IRPS

2006,

San

Jose,

CA,

USA,2006.

[10]赵宇,谢劲松.半导体器件的通用电迁移失效物理模型[C]∥

中国电子学会第十一届全国可靠性物理学术讨论会论文集,

2005:77

83.

[11]MulerRS,KaminsTI,ChanM.Deviceelectronicsforinte-gratedcircuit[M].3rd,NewYork:JohnWiley&SonsInc.,2004.

[12]LeeWW,NguyenLT,etal.Solderjointfatiguemodels:re-viewandapplicabilitytochipscalepackages[J].Microelectron-icsReliability,2000,40:231244.

[13]MishraS,GanesaS,PechtM,etal.Lifeconsumptionmonito-ringforelectronicsprognostics[J].IEEE,2004,5:3455

3467.

[14]MishraS,PechtM,SmithT,etal.Remaininglifeprediction

ofelectronicproductsusinglifeconsumptionmonitoringap-proach[C]∥EuropeanMicroelectronicsPackagingandInter-connectionSymposium,IMPS2002,Cracow,Poland,2002:136

142.

[15]汉鑫王盘WP-X型闪存技术文档[Z].深圳:深圳汉鑫科技公

,20054 结 论

文中通过对实际样品案例的实验过程,给出了健康状

态监测和故障预测应用实施的具体化流程。通过对产品实际性能参数和环境应力参数的监测,可以实时获得产品当前时刻的健康状态。并且可以利用这些监测数据,应用参数化模型或非参数化模型(如神经网络方法)方法来预测产品未来时刻的健康状态。

此外,通过本文研究还明确了产品健康状态监测和故障预测技术在实用化之前仍存在下列问题有待解决:

(1)在性能参数监测时,需要考虑所选取的监测参数对失效是否敏感,即可否表征系统的健康状态。例如本文选取的“存取时间”参数对闪存样品的失效就不够敏感。对于与数字信号相关的参数,都可能存在这样的问题;

(2)由实验结果可以看出,预测结果与实际发生的失效仍存在较大差异,造成这种差异的因素包括:实验中用于评估各机理下样品寿命的模型输入参数信息的准确性、产品自身质量的分散性以及所考虑失效机理的充分性。此外,已发生的样品失效是否仅为逻辑错误所引起的软故障也有待进一步确认。

参考文献:

[1]HessA,FilaL.Thejointstrikefighter(JSF)PHMconcept:

potentialimpactonagingaircraftproblems[J].IEEE,2002,6:

30213026.

[2]BrownDW,KalgrenPW,ByingtonCS,etal.Electronic

Prognostics-Acasestudyusingglobalpositioningsystem(GPS)[J].IEEE,2005,832838.[3]XieJingsong,PechtM.ApplicationsofIn-situhealthmonitoring

andprognosticsensors[C]∥The9thPanPacificMicroelectron-Sm,

,

本文来源:https://www.bwwdw.com/article/i5f4.html

Top