温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
CEEMD
能量
算子
oost
滚动轴承
故障诊断
王昊天
技术与市场创新与实践2023年第30卷第2期基于 CEEMD 能量算子和 XGBoost 的滚动轴承故障诊断王昊天(重庆交通大学机电与车辆工程学院,重庆 400074)摘要:针对滚动轴承故障特征提取困难、故障类型识别困难的问题,提出一种基于互补集合经验模态分解(CEEMD)能量算子和极端梯度提升(XGBoost)树模型的滚动轴承故障诊断方法。CEEMD 在处理信号时成对添加符号相反的白噪声以降低重构误差,XGBoost 树模型通过对目标函数进行二阶泰勒展开计算叶子节点权重以进行合适分裂。该方法充分结合了 CEEMD 算法和 XGBoost 树模型的优点,首先使用 CEEMD 算法分解滚动轴承的振动信号,根据相关系数选取了 4 个含有主要故障信息的固有模态函数(IMF)分量,分别提取能量算子特征构建数据集,将训练集输入到 XGBoost 模型进行训练,最后对滚动轴承4 类故障进行识别分析。通过试验数据验证了该方法在滚动轴承故障识别中的可行性。关键词:滚动轴承;CEEMD 算法;XGBoost 树模型doi:10 3969/j issn 1006 8554 2023 02 0050引言滚动轴承被认为是旋转机械中的关键部件之一,许多机械设备停工都是因其故障引起的,其健康状况直接关系到整个机械系统的运行。为使机械设备稳定工作,减少非生产时间,避免发生灾难性故障对机器和人的生命造成损害,应对滚动轴承故障进行准确诊断和分析。振动信号被广泛应用于滚动轴承故障诊断中,对信号进行优化处理提取特征,是进行故障诊断的主要手段。滚动轴承的振动信号是非平稳、非线性的,如何从中提取有效故障信息,准确诊断并识别轴承状态是当前研究的热点。针对振动信号的特点,将时频分析技术引入旋转机械故障诊断中。Huang et al1 于1998 年提出的经验模态分解(EMD)可将信号自适应分解为多个固有模态函数(IMF),非常适合非平稳、非线性的振动信号,目前已成功应用于滚动轴承故障诊断中2 4。但 EMD 存在模态混淆的缺陷,为解决此问题,Wu et al5 研究白噪声信号的统计特性后提出了集合经验模态分解(EEMD)。为了提高分解效率,Yeh et al6 提出了一种互补集合经验模态分解(CEEMD),向原始信号中添加 2 个相反的白噪声信号,并对每个噪声情况分别执行 EMD,该算法有效减少了白噪声对原始信号的影响。极端梯度提升(XGBoost)树模型是近年来被广泛使用的一种模式识别分类方法。Chen et al7 提出的 XGBoost 算法是目前最快、集成度最高的决策树算法。该算法融合了梯度提升、随机森林等算法的优势,创造性地提出了模型的离散意识和离核计算方法,不仅提升了算法模型对分布式数据库的预测效果,也大大提高了模型训练的速度。受以上研究的启发,本文提出一种基于 CEEMD能量算子和 XGBoost 树模型的滚动故障诊断方法。使用 CEEMD 算法对原始振动信号进行分解,然后提取各 IMF 分量中能量算子这一特征,并将特征值输入到 XGBoost 模型进行训练,最后使用需要训练完毕的模型对滚动轴承的 4 种故障进行分类识别。通过对滚动轴承故障试验数据进行实验分析,验证该模型的有效性。1CEEMD 算法及能量算子求解1.1CEEMD 算法概述EEMD 算法可以在一定程度上抑制 EMD 算法中的模态混淆现象,但添加的白噪声并不能完全中和。针对此缺陷提出 CEEMD 算法,在分析信号中成对加入符号相反的白噪声,降低重构误差。CEEMD 算法的详细步骤如下。步骤 1:成对添加符号与原始信号相反的白噪声信号,如式(1)所示。91创新与实践TECHNOLOGY AND MAKETVol30,No2,2023Mi1Mi2=1111Xni(1)式中:X 为原始信号序列;Ni为第 i 次添加的白噪声序列。步骤 2:对第 i 次加入白噪声后的信号 Mi1和 Mi2进行分解,得到对应的模态分量 ci1,j和 ci2,j,以及对应的残差 ri1和 ri2。步骤 3:取各分量的均值得:cij=12(ci1,j+ci2,j)(2)ri=12(ri1+ri2)(3)步骤 4:将 n 次叠加白噪声迭代产生的分量相加并求均值,最后得到 CEEMD 结果:cj=1nni=1cij(4)式中:cj是 CEEMD 分解后的第 j 个模态分量。1.2能量算子的求解能量算子的求解过程如下。步骤 1:对滚动轴承的振动信号进行 CEEMD 分解,获得各 IMF 分量和残差。步骤 2:求各个 IMF 分量的能量算子 E,如公式(5)所示。Ej=1Nnt=1(cj cj)4(1Nnt=1(cj cj)2)2(5)式中:N 为样本中采样点数;cj=cj2 cj(t 1)cj(t+1)。2XGBoost 树模型基本原理XGBoost 使用的是 CAT 回归树模型,该算法的思想为:不断添加树,即不断分割特征生成树。它本质上是学习一个新的函数来拟合先前预测的残差,然后重新装配,直到满足要求。假设 XGBoost 模型本身由 K 个 CAT 组成,则模型可以表示为:yi=(xi)=Kk=1fk(xi),fk F(6)式中:yi为预测值;fk为第 k 棵树;fk(xi)为第 k棵树中第 i 个样本的得分;K 为样本总数;xi为第 i 个输入数据;F 为所有可能的 CAT。XGBoost 与大多数机器学习模型类似,其目标函数可以是损失函数和正则项之和,分别控制模型的准确度和复杂度,具体公式如下。L()=l()+()=ni=1l(yi,yi)+Kk=1(fk)(7)(f)=T+12Tj=12j(8)式(7)中:yi为观察值;l 为损失函数,用来衡量yi和yi之间的差异。式(8)中,为正则函数,用于惩罚模型复杂度,从而避免过拟合;为每个叶子的复杂度;T 为决策树中的叶子总数;为折衷参数,主要用于缩放惩罚;j为第 j 个叶子的得分。使用式(8)中的树模型,其中函数作为参数,假设yti为第 t 次迭代时对第 i 个实例的预测,并添加新函数 f(t)以最小化以下目标。L(t)=ni=1l(yi,y(t1)i+ft(xi)+(ft)(9)式中的优化过程与泰勒展开式(10)近似,以 t 步优化为例,优化目标函数如下。f(x+x)=f(x)+f(x)x+f(x)x(10)L(t)ni=1 l(yi,yi(t1)+gifi(xi)+12hif2t(xi)+(ft)(11)gi=y(t 1)l(yi,y(t 1)(12)hi=2y(t 1)l(yi,y(t 1)(13)式中:gi和hi分别为损失函数第一和第二步统计。在去除式(11)中的常数项后,获得以下简化目标。L(t)=ni=1gifi(xi)+12hif2t(xi)+(ft)(14)3实验分析3.1数据简介为验证本文方法,采用美国凯斯西储大学轴承数据集。该实验使用轴承为 6205 2SJ 型轴承,数据集分为 48K 基线、12K 驱动端故障、48K 驱动端故障、12K 风扇端故障共 4 类,每个子故障数据集均有滚子、内圈、外圈故障数据。本文使用 48K 基线和 12K驱动端故障数据,其中主轴转速 1 772 r/min,故障直径 0 021 mm,加速度传感器位于电机的驱动端,采样频率 12 kHz。使用重叠采样的方式对数据进行随机分割,每类状态(健康、滚子故障、内圈故障、外圈故障)400 个样02技术与市场创新与实践2023年第30卷第2期本,共 1 600 个样本,按照 82 的比例划分为训练集和测试集。本文所选用数据中轴承转速为1 772 r/min,根据 N=fs 60/ns可得每个周期内采样点数为406 个,为保证每个数据样本故障信息的完整性,设置每个样本长度为 2 048 个采样点。3.2基于 CEEMD 的故障特征提取本文以滚子故障中某一样本为例进行分析,原始振动信号如图 1 所示。对该样本使用 CEEMD 算法进行分解,本文设置分解为 6 个 IMF 分量。因 IMF分量很多,若不进行筛选而使用所有 IMF 分量,计算过程会过于冗余。因此,仅选取 IMF 分量中包含原始信号信息较多的几个分量,本文使用 4 个分量。选取原则为:计算比较各 IMF 分量与未分解前原始信号的相关系数。图 1滚子故障原始信号及 CEEMD 分解图该样本经过 CEEMD 分解后的各 IMF 分量与原始信号的相关系数如表 1 所示。IMF 分量 1 4 相关系数较大,相关系数排名前 4 的 IMF 分量已经包含有原始信号中存在的主要信息,故使用前4 名 IMF 分量。12创新与实践TECHNOLOGY AND MAKETVol30,No2,2023表 1各 IMF 分量与原始信号的相关系数IMF1IMF2IMF30 812 20 516 90 335 7IMF4IMF5IMF60 178 50 073 20 001 2对排名前 4 的 IMF 1 4 分别提取能量算子作为特征值,如表 2 所示。表 2各 IMF 分量的特征值IMF1IMF2IMF3IMF49 895 138 625 215 162 20 001 6重复上述过程对全部 1 600 个样本进行 CEEMD分解,对相关系数排名前4 的 IMF 分量分别提取能量算子作为特征值。3.3基于 XGBoost 树模型的故障识别将获得的特征矩阵按照类别分别划为 0 类、1类、2 类和 3 类,其中 0 类代表滚子故障,1 类代表健康,2 类代表内圈故障,3 类代表外圈故障。将数据按照 82 的比例划分为训练集与测试集(训练集有1 280个样本,测试集有 320 个样本),将训练集输入模型。模型参数中的最大深度设置为 50,学习率设置为 0 05,其他参数均为默认值。模型训练完毕后,用测试集进行测试,测试准确率为 97%。准确率的公式为:Accuracy=100%TP+TNFN+TP+TN+FP(15)式中:TP 为正确识别的阳性样本数量;TN 为正确识别的阴性样本数量;FN 为错误识别的阳性样本数量;FP 为识别错误的阴性样本数量。其混淆矩阵如图 2 所示。滚子故障样本中有 1个样本误判为健康;健康样本中有 1 个样本误判为滚子故障,有 3 个样本误判为内圈故障;内圈故障样本中有 2 个样本误判为健康;外圈故障样本中全都预测正确。总体预测效果较优。4结论本文提出了一种利用 CEEMD 和 XGBoost 模型分析振动信号来识别滚动轴承故障的方法。实验结果表明:CEEMD 算法分解振动信号后提取的能量算子作为特征,通过 XGBoost 数模型可以较好地实现识别故障类型,证明了本文方法的有效性。0123predict80706050403020100true0123图 2XGBoost 模型测试混淆矩阵参考文献:1 HUANG N E,SHEN Z,LONG S,et al The empiricalmode decomposition and the Hilbert spectrum for nonlin-ear and non-stationary time series analysis J Proceed-ings of the oyal Society of London Series A:Mathemati-cal,PhysicalandEngineeringSciences,1998,454(1971):903 995 2胡超,沈宝国,谢中敏 基于 EMD-FastICA 与 DGA-ELM 网络的轴承故障诊断方法J 太阳能学报,2021,42(10):208 219 3谷玉海,朱腾腾,饶文军,等 基于 EMD 二值化图像和 CNN 的滚动轴承故障诊断 J 振动 测试与诊断,2021,41(1):105 113+203 4 郑一珍,牛蔺楷,熊晓燕,等 基于 EMD SDP 特征融合的 CNN 轴承保持架故障诊断研究 J 机电工程,2021,38(1):81 87 5WU Z,HUANG N E Ensemble empir