温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
改进
优化
算法
轧机
滚动轴承
深度
学习
故障诊断
方法
收稿日期:基金项目:国家自然科学基金项目();“兴辽英才计划”项目()作者简介:高坤(),男,河北邯郸人,高级工程师,研究方向:轧制过程智能化质量精准控制与多工序协调优化 通讯作者:李旭,:辽宁大学学报 自然科学版第 卷 第 期 年 基于改进优化算法的轧机滚动轴承深度学习故障诊断方法高 坤,黄 雁,马冰冰,吴菁晶,霍利锋,李 旭(中重科技(天津)股份有限公司,天津;东北大学 计算机科学与工程学院,辽宁 沈阳;东北大学 轧制技术及连轧自动化国家重点实验室,辽宁 沈阳)摘 要:近年来,基于深度学习的智能故障诊断方法在理论研究和工程应用方面都取得了显著的效果,滚动轴承是轧机的核心部件之一,对轧机轴承进行精确的故障诊断能够有效保障轧机装备安全运行与生产效率当前基于深度学习的故障诊断方法通常训练过程不稳定,模型难以收敛,造成工程应用中随机性强 本文提出基于改进优化算法的轧机滚动轴承深度故障诊断方法,在保证模型诊断精度的同时提升训练效率、模型输出结果的稳定性以及模型相对于参数变化所表现出的鲁棒性,并通过实验台获取滚动轴承的故障数据,使用该方法对数据进行诊断来证明方法的准确性关键词:深度学习;滚动轴承;轧机;故障诊断中图分类号:文献标志码:文章编号:(),(),;,;,):,DOI:10.16197/ki.lnunse.2023.01.013 ,:;引言近年来,机械设备的发展方向正趋于高效率、高精密以及高自动化 为了使设备能够始终在安全的状态下运转,我们需要对设备的主要零部件的运行状态进行实时的监控 在重点领域技术路线图 中国制造 中提到,有必要对先进的机械设备,如轨道交通相关设备、航空发电相关设备等进行高效的实时故障监测及诊断,在该报告中,又特别提到,研究并开发有着故障监测、诊断以及寿命预测功能的高端健康管理系统应该提上日程 滚动轴承作为轧机系统的核心部件,可能会在系统运动的过程中出现故障导致设备停工,因此机械设备的运转性能对滚动轴承工作性能的要求越来越高最近,卷积神经网络作为一种深度学习方式,成为热门的研究方向,已经有很多研究人员开始着眼于研究该网络 许多卷积神经网络相关方法在模式识别领域里有着应用成功案例 相比于繁琐的传统特征工程相关算法,该方法能够从故障信号中自动挖掘特征 卷积神经网络能够在众多特征提取算法中脱颖而出,都得益于其拥有较多参数,可以通过对大量数据集进行训练来防止网络过拟合 虽然已经有相关文献研究了一些基于深度学习的故障诊断方法,但是目前还无法对不同的应用对象进行不同的针对性优化,这会导致故障诊断的准确率降低 本文基于深度学习模型,提出一种针对轧机滚动轴承的故障诊断方法,该方法对传统智能诊断算法进行了改进优化,优化后的训练方法可提升模型性能与训练效率 基础知识 卷积神经网络 等在 年成功将卷积神经网络用于 数据库进行分类识别任务,且错误率很低 后来,许多研究人员也提出了残差网络(),谷歌神经网络()和基于区域的卷积神经网络()等变体改进对象识别和图像分类任务的准确性 卷积运算的核心称为卷积核函数,实际上可以看作一种过滤器 这种过滤器可以在矩阵中进行从左到右、从上到下的滑动来学习所需要的特征 在学习的过程中,有两种填充策略:零填充和有效填充,这取决于在原始矩阵中是否添加零 本文采用的是零填充,卷积层运算如式()所示:(,)()()()()第 期 高 坤,等:基于改进优化算法的轧机滚动轴承深度学习故障诊断方法 式中:(,)代表权值参数;()表示卷积层输入;()表示偏置;是激活函数;代表第 层的第 个特征图 卷积运算示意图如图 所示图 卷积运算示意图为了表示一个随机事件的相关损失,可以设置一个损失函数,该损失函数可以映射这个随机事件变量为非负的实数 神经网络正向传播之后可以通过反向调参来使该网络达到最优,损失达到最小 实际上损失函数是一个非负函数,其可以表现该模型最终获得的输出和预测的输出值存在的误差,误差越小,神经网络模型的训练效果就越好,鲁棒性越强 优化方法在深度学习训练过程中,优化损失函数是一个重要的环节 通过优化算法,模型的损失值可以收敛到一个相对小的值,从而达到较好的结果 常见的优化算法有动量随机梯度下降法(,)以及适应性矩估算法()随机梯度下降法(,)由于每次选的是随机数据,所以震荡比较大,利用积累的梯度方向指数移动平均值来减缓 的震荡 梯度下降方向如图 所示图 动量随机梯度下降法梯度下降方向分解 每次更新幅度等于学习率和梯度范数的乘积,不仅取决于当前梯度的范数还取决于连续梯度变量的积累 实质上是给 过程增加了一个惯性,使算法在下降时考虑之前梯度的影响 算法可以极大减小梯度运动,及时阻止坡度不够时的梯度运动,有效减少了 算法的震荡性并且帮助其收敛 年,的 和多伦多大学的 合作发表 论文,提出了 算法 和 这两种算法的学习率是不变的,而 算法可以在迭代中通过一阶和二阶矩估计,达到控制学习率的变化 由于 算法占内存较少,可以在大规模数据情况下来优化参数 基于改进优化算法的深度故障诊断方法学习率是深度学习故障诊断方法中直接影响诊断结果的一种超参数 对于 算法来说,学习率是固定的,在整个算法的迭代过程中一直保持初始值 学习率过大,算法不收敛甚至发散;过小容易陷入局部最优、损失函数收敛极慢,训练时间过长 恰当的学习率需要通过多次实验调节,对于神经网络的训练来说调参是至关重要的 虽然可以自适应调节学习率,但该算法在后期学习率容易过小导致算法迟迟不收敛,从而导致整个深度神经网络模型的训练效果不好 本文针对学习率 辽宁大学学报 自然科学版 年 这一重要的超参数进行改进,将其应用在深度残差网络轧机滚动轴承故障诊断模型中,以期达到更好的诊断效果学习率的衰减方式分为分段衰减(图)和指数衰减(图)分段衰减首先将训练次数分为多段,每一段都有不同的学习率,学习率可从大到小慢慢递减,分段中每一段的学习率都是一定的 在实际神经网络训练中,需要操作人员根据具体任务对学习率调节 指数衰减是使学习率大小与迭代次数指数相关,并呈指数衰减并更新 其更新规则如式()所示:()式中:是当前迭代阶段衰减得到的学习率;是迭代总次数;是当前迭代次数;是衰减频率;是学习率 这种衰减方式简单直接,收敛速度快,是目前最常用的学习率衰减方式图 学习率分段衰减图 学习率指数衰减 本文提出的学习率分段弱重启式逐步衰减法结合了分段和指数衰减更新学习率的思想 一般来说,在开始迭代设置一个较大的学习率实现快速的梯度下降,随着迭代次数增加,可以使学习率越来越小,以达到使模型收敛于最优解的目的 本文提出的方法随着迭代次数整体呈下降趋势;其次利用分段思想,将整个迭代步数分成 段,在第一段迭代过程中采用较大的学习率迭代使得算法可以快速下降;在迭代的中期采用适当的学习率,避免学习率的过大或者过小;在迭代的末期采用小的学习率让算法最后慢慢接近最优解,使得算法最终获得好的效果本文所采用的学习率分段弱重启式逐步衰减法步骤如下:第一步,设置迭代总次数,当前迭代次数,初始学习率 第二步,初始化参数、;、;、第三步,设置迭代停止条件 如果,进入下一步;否则迭代结束第四步,如果 ,则更新学习率的公式如下:()()第五步,如果 并且,则更新学习率的公式如下:(,)()()()()()()第 期 高 坤,等:基于改进优化算法的轧机滚动轴承深度学习故障诊断方法 第六步,如果 ,则学习率更新公式如下:(,)()()()()()()式中:是初始学习率;和 分别代表第一段和第二段分段阈值;是一个非常小的正数;是学习率衰减幅度;、和 是迭代更新的频率;和 是两个常数,这两个常数是为了自由地控制分段式学习率的大小;、是 个所提方法中的超参数,为常数 该方法增加了学习率的可调节性,更加灵活,更易与各种优化算法结合第七步,对网络进行判断,看其是否收敛,若收敛,则停止算法;否则通过判断 与 的大小关系,选择需要执行的步骤图 是本节所提学习率衰减方法的曲线,反映了学习率分段弱重启逐步衰减方法的整体呈衰减趋势 图()表示 和 设置成 的情况,图()表示 和 分别设置为 和 的情况图 学习率分段弱重启式逐步衰减曲线 实验验证 数据集本文采用美国凯斯西储大学()电气工程实验室的滚动轴承故障模拟实验台采集到的实验数据,作为数据源来模拟轧机滚动轴承的故障状况并对所提算法进行验证 数据采集装图 凯斯西储大学轴承数据采集实验台置如图 所示 图 中由左至右是 电动机、扭矩传感器 本文使用 型轴承作为驱动端,利用电火花在轴承内圈、外圈和滚动体表面制造出 、直径的单点故障 驱动端轴承数据的采样频率为 样本 秒和 样本 秒滚动轴承故障数据集如表 所示 轴承原始振动数据经过标准化处理后,按行存入矩阵,再将矩阵转存为灰度图片保存 本文选用 采样频 辽宁大学学报 自然科学版 年 率的轴承数据,将不同负载下相同的运行状况视为同一种类的故障,共分为 类表 滚动轴承故障数据集数据集数据集 数据集 数据集 数据集 数据集 数据集 数据集 数据集 数据集 数据集 测试样本 训练样本故障类型正常滚动体滚动体滚动体内圈内圈内圈外圈外圈外圈损伤直径 故障程度无轻中重轻中重轻中重标签编号 故障诊断模型本文搭建一个基于 的深度残差网络来验证不同优化算法训练模型的效果 相关参数主要可总结为网络的深度,卷积核的大小以及数量 考虑 种网络深度,分别设置为 层,层和 层深度 卷积核大小考虑 ,和 ,这里使用卷积核大小恒定模型来设计 卷积核数量考虑递增模型、恒定模型和递减模型 池化层大小设置为 ,整个网络均采用零填充进行补边操作 本文采用 算法进行训练,输入参数的大小选择 ,数据量为 ,损失函数为交叉熵函数,选择值为 ,结果如表 所示表 不同网络结构模型的准确率对比参数网络层数卷积核数量 卷积核大小递增模式递增模式递增模式递增模式递增模式递增模式恒定模式递增模式递减模式小批量样本训练集准确性 测试集准确性 表 改进诊断模型输入参数设置输入大小 训练集准确率 测试集准确率 通过表 中的测试结果可以得出最佳的深度残差网络结构为 层,使用 大小的卷积核,卷积核数量选用递增模型由 增为,网络结构参数根据表 设置 根据表 可知网络尺寸选用 大小的输入参数对于搭建的网络结构最为合适如图 所示基于上述实验给出本文基于改进优化算法的故障诊断模型的网络结构 将同一类的时域数据和频域数据进行融合,解决输入数据量小引起诊断模型训练不足而导致的轻微过拟合现象首先搭建卷积层、层和 层;堆叠 个残差模块;在 残 差 模 块 之 后 衔 接 全 局 池 化 层、以 函数为激活函数的分类层以及全连接层,最后获得模型输出 实验结果将本文提出的学习率衰减方法与 和 算法结合,并与、(融合适应性矩估计的动量随机梯度下降算法)和(学习率指数衰减的 算法)的诊断效果作对比 设计 组实验,分别设置学习率初值为 、和各优化算法在滚动轴承故障数据集上时的最佳初始学习率 在 组实验中使用相同的数据集与诊断模型,并都使用交叉熵函数作为模型的损失函数,迭代 次;本文提出的学习率分段弱重启逐步衰减法相关参数设置为,;第 期 高 坤,等:基于改进优化算法的轧机滚动轴承深度学习故障诊断方法 ,;,;,图 基于改进优化算法的 故障诊断模型网络结构 初始学习率 图 为初始学习率 时、等 种算法训练过程损失函数图 学习率 时各算法收敛曲线收敛曲线的对比结果 从图 中可以看出,算法由于滚动轴承数据的高维性,数据变化剧烈,再加上学习率过大,更新速率时大时小,最终不停振荡无法收敛;由于学习率过小,所以每次的更新幅度都很小,导致迟迟无法收敛;、和 种算法收敛 与 相比 收敛后期曲线更加平滑,由于学习率可以分段弱重启并且每段衰减频率不同从而加速了收敛 初始学习率 图 为初始学习率 时、等 种算法训练过程损失函数收敛曲线的对比结果 辽宁大学学报 自然科学版 年 从图 可以看出,算法由于学习率较大,梯度更新速率时大时小出现了振荡,与学习率 图 学习率 时各算法收敛曲线时相比计算的更新值变小了,虽然仍不收敛但是振荡减弱;每次都是随机地选取小批次计算