网易云官网音乐
基于退化特征相似性的航空发动机寿命预测
张妍;王村松;陆宁云;姜斌
【摘 要】针对航空发动机结构复杂、性能退化参数众多、寿命预测精度低等问题,提出了一种基于退化特征相似性的寿命预测方法.首先通过基于Relief算法的退化特征筛选、基于主成分分析(principal component analysis,PCA)的特征提取和基于核函数的特征平滑,提取低维正交多变量退化特征;然后进行特征的相似性匹配,寻找与当前样本特征片段最相似的一组历史样本中的特征片段集合,将这些片段对应的RUL信息融合并采用密度加权方法得到当前样本的寿命预测估计值;最后通过美国国家航空航天局(national aeronautics and space administration,NASA)提供的航空涡轮扇发动机仿真数据集验证了该方法的有效性,其寿命预测性能高于现有几种代表性方法.
【期刊名称】《系统工程与电子技术》
【年(卷),期】2019(041)006
【总页数】8页(P1414-1421)
根号函数【关键词】寿命预测;性能衰退;Relief特征选择;相似性;密度加权
【作 者】张妍;王村松;陆宁云;姜斌
【作者单位】南京航空航天大学自动化学院,江苏南京210016;江苏省轨道交通车辆门系统重点实验室,江苏南京210016;南京航空航天大学自动化学院,江苏南京210016;南京航空航天大学自动化学院,江苏南京210016;江苏省轨道交通车辆门系统重点实验室,江苏南京210016;南京航空航天大学自动化学院,江苏南京210016
【正文语种】中 文
【中图分类】V233.7;TB301
0 引 言
持仓差
般若经航空发动机是各类航空飞行器的核心设备,其可靠性、维修性、安全性、保障性和测试性(reliability, maintainability, safety, supportability and testability,RMSST)一直是学术界和行业界的关注焦点。为提高设备RMSST性能、降低维修成本,解决系统维护的经济可承受性,
以剩余寿命预测为核心的预测与健康管理技术(prognostics and health management,PHM)已成为当前航空航天领域的研究热点[1-2]。
剩余寿命预测一般通过分析设备历史性能退化趋势,预测设备从当前时刻到最终失效的剩余时间[3]。现有的寿命预测方法大致分为3类[4]:基于物理失效模型的方法、数据驱动的方法和混合方法。对于航空发动机等性能参数众多、退化规律不明显的精密复杂设备,难以获取其精确的物理失效模型。数据驱动的方法因其不依赖于设备的物理失效机理,只需要采集、分析发动机的历史和在线监测数据,在实际应用中颇受关注。
数据驱动的寿命预测主流方法是基于退化建模和回归预测的方法[5-10],直接寻找性能退化过程与剩余寿命之间的映射关系,单变量情况下一般用退化模型(如Wiener模型[5-7]、逆高斯模型[8])的输出参数作为健康度指标,多变量下则先构建一个综合健康度指标[9](synthetical health index,SHI),然后通过知识或专家经验设定健康度指标的失效阈值(failure threshold,FT),最后通过回归方法(如核递归最小二乘模型[10]、支持向量机[11])预测设备的剩余使用寿命。健康度指标的构建和失效阈值的设定是其中的核心和难点问题,决定了寿命预测方法的准确性和可靠性。现有方法大都采用单变量线性退化模型,实际上很难直接应用
于具有多退化量及非线性退化过程的复杂对象[12];另外,现有方法一般假定所有样本的退化特征具有一致或已知的健康初值,有些方法还假定历史样本与待测样本退化特征长度一致,这些假设为这类方法的实际应用带来诸多困难。
数据驱动的寿命预测还有基于样本退化特征相似性的方法[13-18]。其主要思想是,两个样本前期退化过程的相似性越高,则当前时刻之后的剩余寿命相似概率也越大,因此可通过将当前样本与数据库中的历史样本进行相似度匹配,寻找出最为相似的样本作为参考,预测当前样本剩余使用寿命。这类方法的应用前提是要拥有一定数量的历史样本,当历史样本充足的情况下其性能一般优于其他类方法[13-14]。譬如,针对航空发动机,采用基于相似性的寿命预测方法比神经网络等方法具有更高的预测精度[15];该方法结合基于核密度估计的不确定性度量,可进一步提高寿命预测的准确性和鲁棒性[16]。针对电子产品的寿命预测,根据K均值聚类理论计算特定个体与同类产品退化轨迹的相似度权值,然后通过加权同类产品的退化轨迹来获得特定个体的退化轨迹并实现有效的预测寿命[17]。针对高压水泵这类非线性退化过程,退化变量时间序列经相空间重构后再采用基于相似性的寿命预测方法进行预测具有良好的寿命预测效果[18]。
上述基于相似性的寿命预测方法仍以单退化量过程为主,目前仍有退化特征选择、不确定初始健康状态的相似度计算、相似样本的权重分配等问题尚未得到有效解决。以航空发动机为研究对象,考虑发动机所有可测的性能参数,应用多种数据分析手段提取出含有系统性退化信息的低维正交退化特征,在样本相似性评估算法中将初始健康状态的不确定性问题转变为退化轨迹片段的时延问题,并提出基于核密度的相似样本权重分配算法,最后在美国国家航空航天局(national aeronautics and space administration,NASA)提供的航空发动机退化过程标准数据集上进行了验证,并和两种代表性的寿命预测方法进行了比较,验证结果表明本文方法具有更高的及时预测能力。
1 多变量退化特征提取
航空发动机是一个复杂的机电液磁耦合系统,其性能退化并不仅取决于某一个变量的退化,而是多个状态变量动态变化且相互耦合的结果,如温度、电压、振动等皆含有反应系统退化的重要信息,所以必须充分利用所有可测的性能参数,从中提取能体现系统退化特性的特征参数,准确预测发动机的剩余寿命。
1.1 基于Relief算法的退化特征筛选
航空发动机的性能状态通过多个可测参数表现,但不同参数对整个系统退化过程的敏感程度不一样。好的特征参数应能反应系统级退化趋势,而有些特征退化行为不明显或受其他干扰因素污染严重,引入这些特征反而会弱化寿命预测方法。因此,首先要对原始特征参数进行筛选,获取最能体现系统级健康状态变化的特征信息。
Relief算法最早是由Kira提出的特征权重算法[19],原理是通过区分相互靠近样本对特征的有效性进行评价。好的特征不仅能使同类样本相互靠近,同时还具有使不同类样本远离的能力,Relief通过设计样本特征的权重,以样本的聚散性能为指标筛选合适的特征。
假设历史发动机的退化数据从开始至失效发生经历E个时间观测点ti(i=1,2,…,E),特征变量有M维。ti处的观测值xi由M维特征值构成,即xi=(x1,x2,…,xM)T,而每一维特征变量都是长度为tE的时间序列,各时间点处的数据没有直观的类别属性。所以,基于Relief算法的退化特征筛选首先要从连续的时间序列数据中分离出不同类别的样本空间。本文按照退化程度对退化数据的时间序列进行归类,早期时间点数据组成退化程度低的一类,末期时间点数据组成退化程度高的一类。
采用Relief算法对二类数据筛选退化特征,特征的权重越大,表示该特征对退化的贡献越大;反
之,贡献小。
首先定义两个时间点xi和xt对于第j个特征的差异为如何加强团队建设
(1)
式中,表示第i个观测点的第j个特征值;vj为第j个特征的标准化单位。
海的诗句
退化特征筛选方法如下:
基于Relief算法的退化特征筛选输入 样本集X,抽样次数k,特征权重阈值τ输出 选择后的特征集R算法过程:1 取出所有历史发动机退化数据集最初运行的前T0个时间点的观测数据作为性能正常数据,Q0={Tree0(t)|t=1,2,…,T0},t表示运行时间点,Q0={正例}2 取出所有历史发动机退化数据集的性能失效数据,即取出每个数据集最后T1个时间点的观测数据,Q1={Tree1(t)|t=tE-T1+1,tE-T1+2,…,tE},Q1={负例}
3 初始化权重W=(0,0,…,0)4 for i=1 to k5 随机选择一个样例x∈Q0∪Q16 随机选择一个X的最近邻正例Z+∈Q07 随机选择一个X的最近邻负例Z-∈Q18 ifX是一个正例9 then Near-hit=Z
+;Near-miss=Z-10el Near-hit=Z-;Near-miss=Z+11 for j=1 toM12 wj=wj-avg(diff(xj,Near-hitj))k+avg(diff(xj,Near-missj))k13 归一化wj14 for j=1 to M15 if wj≥τ16 then fj是一个相关的特征17 el fj不是相关的特征
特征权重阈值τ=avg(w),经上述算法筛选出m个特征,新的特征集F′={f1,f2,…,fm}。
1.2 基于主成分分析的退化特征提取
虽然通过Relief算法可从众多特征中选出与系统退化行为更相关的特征,但特征之间可能会存在相关关系。因此,可以通过减少特征间的相关性降低问题分析的复杂性,提取更简洁、有效的低维正交退化特征。
主成分分析(principal component analysis,PCA)通过正交变换将多个可能存在相关性的变量转换为少数几个线性不相关的主成分,主成分既保留了原始变量的主要信息,同时又消除了变量间的相关性。
设发动机的历史退化数据X经特征筛选后具有m维特征变量,X=[x1,x2,…,xm]T∈RtE×m,xj=[x1,x2,…,xtE]表示第j个特征变量的时间序列,PCA对m维数据提取主成分的方式为:
(1) 首先对X标准化处理(均值归0,方差归1),标准化后矩阵为X*;
(2) 求X*协方差矩阵(m×m维)的特征值λj(j=1,2,…,m)和特征向量;
(3) 对λj值按从大到小降序排列,即λ1≥λ2≥…≥λm,计算累计贡献率通常要求θ大于85%,取前P个特征值对应的特征向量按序组成特征向量矩阵
(4) 将X*在作投影,得到降维后的主成分Y的计算公式为王维安
(2)
式中,Y定义为X的主成分特征;y1称为第一主成分,y2称为第二主成分,依次类推。由式(2)可知,保留的前P个主成分是原始数据特征集在上的投影,也可看成是退化特征的线性组合结果,它既保留了原始数据的绝大多数特征信息(一般阈值取85%以上),并且特征之间彼此不相关,这里称为正交退化特征。
经PCA变换后得到前P个主成分为Y=[y1,y2,…,yp]T,yp=[y1,y2,…,ytE]为第p个主成分的时间序列。定义Fl为第l个历史样本的退化模型,Fl可由主成分特征关于时间的函数表示心理暗示效应
Fl:y=f(t)+ε,0≤t≤tE
(3)
式中,ε为噪声信号,通常认为高斯白噪声;f(t)为特征随时间变化的实际退化轨迹。Fl模型认为能观测到的退化特征,这里为主成分特征,由实际特征退化轨迹加上噪声组成。许多参数和非参数拟合的方法都可以用来求解f(t),如选择合适的函数形式进行参数拟合;此外,通过滑动平均、Kernel平滑、支持向量回归等方法也都可解得f(t)。文献[15]从残差、运算速度、占用空间等多方面对这些方法进行了对比。Kernel平滑属于非参数拟合,只利用训练数据本身进行平滑,适用范围广,可根据实际平滑程度需要,自行调整宽度参数,且计算方便。因此,采用Kernel平滑的方法,它对数据的平滑方式为