故障特征提取探究论文
故障特征提取探究论文 1基于BP神经网络的特征提取方法 要从N个特征中挑选出对诊断贡献较大的n个特征参数(nN),通常以特征参 数X对状态Y变化的灵敏度ε作为评价特征参数的度量:εij=|(аYi)/(аXj)| 采用三层BP网络,输入层n个单元对应n个特征参数,输出层m个单元对应 m种模式分类,取中间隐层单元数为q,用WBiq表示输入层单元i与隐层单元q之 间的连接权;
用wOqj表示隐层单元q与输出层单元j之间的连接权,则隐层第q单 元的输出Oq,为:
输出层第j个单元输出yj为:
式中j=1,2,…,m;
εj为阈值。
则特征参数xi对模式类别yj的灵敏度为:
代入(1)式,则特征参数Xi的灵敏度εij和特征参数Xk的灵敏度εkj之差可 整理为:
大量的试验和研究表明,当网络收敛后有:a1≈a2≈…≈aq。
从上式可以看出,如果:
则必有:εij>εki 即特征参数Xi对第j类故障的分类能力比特征参数Xk强。
将特征参数X和分类模式分类结果y组成的样本集作为BP网络的学习样本, 对网络进行训练。设Wiq和Wkq分别为与特征参数Xi和Xk对应输入单元与隐层单 元q之间的连接权系数,记:
│Wεi│=│Wi1│+|Wi2|+…+|Wiq| │Wεk│=│Wk1│+|Wk2|+…+|Wkq| 如果│Wεi││Wεk│,则可以认为Xi的特征灵敏度εi比特征参数Xk的灵敏度εk大。这样可知特征参数Xi的分类能力比特征参数Xk的分类能力强。
2基于互信息熵的特征提取方法 由信息特征可知,当某特征获得最大互信息熵,该特征就可获得最大识别 熵增量和最小误识别概率,因而具有最优特性。特征提取过程就是在由给定的n 个特征集X二{XI~X2,…,zn)所构成的初始特征集合情况下,寻找一个具有最 大互信息熵的集合:X={X1,X2,…,Xk},kn。由于最大互信息熵由系统熵 和后验熵决定,而系统熵是一定的,后验熵越小,则互信息熵越大,分类效果越 好。因此有效的特征提取就是在X给定后,寻找一个具有最大互信息熵或后验熵 的集合Y。即已知该域R上的初始特征集合X=[x1,x2,…,xn]T,寻找一个新 的集合Y=[y1,y2,…,yk]T,kn,使互信息熵最大,i=1,2,…,k。
在一定的初始特征集合下,识别样本的后验熵是一定的。在实现特征优化 过程中,随着特征的删除,会有信息的损失,使得后验熵趋于增加。因此后验熵 增值大小反应了删除特征向量引起的信息损失的情况。当删除不同特征及删除特 征数逐步递增时,会对应有不同的后验熵。按后验熵由小到大排列,可获得对应 的特征删除序列。其过程可描述为:
(1)初始化:设原始特征集合F={N个特征},令初始优化特征集合S=[K 个特征,K=N];
(2)计算后验熵;
(3)实现递减:S=[K-1个特征],并计算相应的后验 熵;
(4)选择优化特征集合:以多个递减特征集合所对应的后验熵为依据,选 择具有最小后验熵增的特征向量集合为优化特征集合S[N-1个优化特征];
(5)返回(3),重新计算,直到满足分类要求,选择具有最小后验熵的优化 特征集合;
(6)输出优化特征集合。
3特征提取实例在热电厂的发电机组工作中,发电机组主轴经常遇到如喘振、流体激励等 故障。这些故障不仅会引起生产效率下降,而且会对机器造成严重危害,影响机 组的安全运行。传统的诊断方法是在主轴轴承处加传感器进行振动测试,得到其 频谱图;
然后在频域内分析,根据基于能量分布的故障诊断理论将振动信号功率 谱密度按一定的规则进行量化,利用神经网络等工具进行故障诊断。但是喘振、 流体激励等故障在频域内通常表现为连续分布的有色噪声带,在频域内分析难以 区分,难以进行频谱特征提取,全息谱分析方法也不甚有效。传统方法增加了系 统的开销,诊断效果不理想。如果在时域内采用信息优化方法做预处理,再用传 统的诊断方法进行诊断,可以收到很好的效果。
本文采用时域内故障振动信号的方差、峭度、偏斜度等参数,分别利用 BP神经网络和后验熵分析对其进行特征提取,研究如何从中找出最能反映故障 的特征。
表1为主轴喘振、流体激励故障时振动信号在垂直和水平方向的方差、峭 度、偏斜度等6个参数的数据。
表1主轴故障的特征参数 序号喘振流体激励均方差峭度偏斜度均方差峭度偏斜度垂直水平垂直水 平垂直水平垂直水平垂直水平垂直水平 17.509.21-0.02-0.00-0.22-0.1040.244.10.22-0.42-0.11-0.08226.115.2-0.75-0.92-0.31- 0.2170.120.53.821.780.000.16313.89.21-0.81-0.72-0.290.1912.414.2-0.38-0.620.030. 0146.28.5-0.01-0.04-0.22-0.238.1533.50.15-0.140.070.10536.111.2-0.61-0.01-0.230. 077.2115.2-0.41-0.510.010.01611.59.71-0.81-0.93-0.31-0.1825.730.2-0.370.19-0.11- 0.06733.128.2-0.79-0.85-0.07-0.4571.225.33.811.850.010.16837.226.8-0.81-0.87-0.0 6-0.418.1135.2-0.81-0.130.010.11 设原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分别为垂直、 水平方向的均方差,x3、x4分别为垂直和水平方向的峭度,x5、x6,分别为垂直 和水平方向的偏斜度。
①基于BP神经网络的特征提取方法:采用表1中的数据作为BP神经网络的 输入,编制程序对神经网络进行训练,训练算法采用标准BP算法和 Levenberg-Mar-quardt法两种方法来训练BP网络,从而计算特征参数的特征灵敏 度,确定出对结果影响最大的特征参数。
喘振:│W1│={1.58741.655325.532025.176574.472440.4295} 流体激励:
│W2│={1.58741.655325.532025.176574.472440.4295} 从结果可以看出:偏斜度对这两种故障最为敏感,反映了低频自激故障的 主要特征。
②基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5, x6}对应表1中的特征参数。在特征参数优化过程中,随着特征的删除,后验熵变 化较大。当删除的特征中包含有x5、x6时,后验熵明显降低;
如仅保留x5、x6 时,后验熵最小。说明偏斜度对这两种故障最为敏感。
对比这两种特征提取方法,可以看出它们得到的结论是一样的。如果采用 通频全息谱法来进行分析,得到的结论相同,从而验证了这两种特征提取方法的 有效性。
在实际的状态监测和故障诊断中,可以重点监测系统的偏斜度,配合对振 动信号的频谱分析,可以快速地判断故障类型和具体发生的时间。
摘要:针对常规特征提取方法存在着问题不足,提出了基于BP神经网络 和基于互信息熵的特征提取方法,并通过特征提取实例加以说明。结果表明这两 种方法是可行和有效的。
关键词:特征提取故障诊断神经网络互信息熵