分享
采用TCN-HS的滚动轴承剩余使用寿命预测_王体春.pdf
下载文档

ID:2573961

大小:1.76MB

页数:8页

格式:PDF

时间:2023-07-24

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
采用 TCN HS 滚动轴承 剩余 使用寿命 预测 王体春
()年 第 卷 第 期 收稿日期:基金项目:江苏省自然科学基金面上项目();国家自然科学基金项目();华东空管局科技项目作者简介:王体春,男,博士,副教授,主要从事知识工程与可拓工程、人工智能及应用研究,:。本文引用格式:王体春,吴广胜,咸玉贝,等 采用 的滚动轴承剩余使用寿命预测 重庆理工大学学报(自然科学),():,(),():()采用 的滚动轴承剩余使用寿命预测王体春,吴广胜,咸玉贝,胡玉峰(南京航空航天大学 机电学院,南京;中国民用航空华东地区管理局,上海)摘 要:滚动轴承作为旋转机械中的关键部件,对其剩余使用寿命()的准确预测可以帮助维修人员及时制定维修计划,延长设备工作时间,保证安全。由于利用数学建模精确建立轴承退化过程的模型涉及到复杂的物理过程,所以以深度学习为基础的基于数据驱动的方法已经成为主流方法。提出了一种融合混合膨胀卷积与自适应斜率软阈值函数的时间卷积神经网络()用于滚动轴承寿命预测。模型使用混合膨胀卷积()解决了栅格效应问题,并利用自适应斜率软阈值函数()进一步筛选特征。为了验证 模型的有效性,基于 轴承数据集进行了实验,结果表明:改进方法提升了模型的性能,预测结果准确。关 键 词:剩余寿命预测;时间卷积神经网络;混合膨胀卷积;自适应斜率软阈值函数中图分类号:文献标识码:文章编号:()引言滚动轴承无论在制造业、运输业或者是航空航天业中都是旋转机械中必不可少的组成部分,例如雷达驱动机构中的滚动轴承或者是直升机传动系统中的滚动轴承,无论是哪种旋转机械,滚动轴承都起到至关重要的作用。然而,由于其经常工作在恶劣的环境中,发生故障是不可避免的,并且伴随着故障的发生常常导致安全事故和重大经济损失,比如直升机驱动机构受损导致的安全事故和雷达故障停机所需的维护成本。所以对滚动轴承的剩余寿命进行准确的预测是非常必要的,准确的剩余寿命预测可以帮助我们提前制定维修计划,延长设备使用时间,保证人身安全。以深度学习为基础的基于数据驱动的方法可以实现端到端的机械设备健康监测,雷亚国等提出了一种利用机械频域信号训练深度神经网络的方法,等提出的深度残差伸缩网络()用于机械故障诊断,等提出的结合软阈值与注意力机制的时间卷积神经网络()。上述三者的优势都在于无需具备信号处理技术与故障诊断的先验知识,借助深度学习模型就可以完成故障特征的自适应提取与健康状况的智能诊断。然而前两者使用的模型忽略了振动信号的时序特性,等提出的 虽然利用了振动信号的时序特性,但是由于膨胀卷积的稀疏采样方式存在网格效应(),损失了信息的连续性与相关性,并且软阈值函数完全保留了阈值以外的信号,其中可能存在噪声。基于此,本文提出一种 模型,该方法将混合膨胀卷积()与自 适 应 斜 率 软 阈 值 函 数()融合到时间卷积网络中,混合膨胀卷积解决了网格效应(),自适应斜率软阈值函数则进一步对经过软阈值降噪后的信号特征进行筛选,以 轴承数据集进行算法性能对比,验证了所提模型的有效性。模型 基本模块 的基本模块组成如图 所示,由预激活模块、阈值计算模块和斜率计算模块组成。图 基本模块 预激活模块根据激活函数与卷积层的相对位置关系,其组合方式可以分为“预激活”与“后激活”,模型采用“完全预激活”,即批标准化层和激活函数都放到一维膨胀因果卷积的前面,如图 所示。使用预激活有 个优点:变为恒等映射,使得网络更易于优化;使用批标准化层作为预激活可以加强对模型的正则化。在预激活模块中激活函数选择,牺牲了梯度的硬零稀疏性,因此在优化期间更稳健。式()为 函数。(),()式中:为泄漏率,在,的区间内,这样函数就保留了一些负轴的信息,而非全部舍弃掉。图 完全预激活模块 丢弃层是为了防止训练中模型发生过拟合。丢弃层后为膨胀因果卷积层,膨胀卷积()是通过跳过部分输入使 可以应用于大于 本身大小的区域,等同于通过增加空洞从原始 中生成更大的。和传统卷积不同的是,膨胀卷积在卷积操作时存在空洞,采样时的间距由膨胀率()即图 中的 控制。图 膨胀卷积 输入层的膨胀率 ,表示对于输入的每个像素都进行采样,隐藏层膨胀率 ,表示对于本层的输入,间隔一个点采样一个作为输入。一般来讲,层数越深,当前层的膨胀率越大。所以,膨胀卷积可以使感受野随着层数越深而呈指数型增长,这样在网络中就可以用较少的网络层数,却获得了普通卷积网络深度很大时才可以获得的感受野。自适应斜率软阈值函数模块软阈值函数通常被用于振动信号的去噪中,软阈值函数如式()所示。(),()王体春,等:采用 的滚动轴承剩余使用寿命预测式中:表示阈值,是一个正数。从式()可以看出,软阈值化就是将 ,区间内的信号特征置为,将大于 的信号特征减,将小于 的信号特征加。软阈值函数还有一个好处就是求导后梯度只有 和,如式()所示,这样避免了梯度爆炸和梯度消失现象。,()但同时软阈值函数也完全保留了阈值区域之外的特征,这些特征可能包括噪声,影响剩余寿命预测的结果。因此,使用了一种自适应斜率软阈值函数来代替软阈值函数。自适应斜率单元使网络能够有效地学习阈值区域之外的有用信息,对于软阈值函数筛选出的特征赋予不同的权重,而不是完全保留它们。自适应斜率阈值的函数表示为:()(),(),()式中:表示输入;表示输出;表示阈值;表示斜率。在 中,自适应软阈值斜率函数由阈值计算模块和斜率计算模块组成。阈值计算模块如图 所示,在这个模块中,首先输入在绝对值层的所有特征的绝对值,获得的输入的绝对值经过全局平均池化层,得到一个特征;在另一条路径中,全局平均池化层输出的特征输入到一个以 函数作为最后一层的子网络中,这样子网络的输出会归一化到 ,将全连接层的输出记为。最终的阈值可以表示为 。因此,阈值就是一个 的数字乘以特征图的绝对值的平均值。通过这种方式,保证了阈值为正,而且不会太大。图 阈值计算模块 自适应斜率软阈值函数的斜率计算模块如图 所示,与阈值计算模块相似,二者的不同之处是本模块只有一条路径,即对输入特征图的所有特征求绝对值,经过全局平均池化层后直接输入到子网络中,最后经过 函数归一化之后的全连接网络的输出就是斜率。图 斜率计算模块 值得注意的是,经过上述 个模块的运算,不同的样本就有了不同的阈值。因此,在一定程度上,可以理解成一种特殊的注意力机制:软阈值函数可以注意到与当前任务无关的特征,通过软阈值化,将它们置为零;或者说,注意到与当前任务有关的特征,将它们保留下来并且输出,而斜率则是对软阈值函数已经筛选出的特征进一步赋予不同的权重。在训练过程中,模型会自适应调整阈值 与斜率 的值来使模型输出与真实值之间的差值最小化。表 为、融合软阈值函数的 和融合自适应软阈值函数的 在处理同一段加了噪声的轴承加速度信号时进行轴承剩余寿命预测的结果,可以看出融合了自适应软阈值函数的模型效果最好。表 不同模型结果轴承融合软阈值函数的 融合自适应软阈值函数的 轴承 轴承 轴承 残差连接残差链接解决了深层网络的训练问题,在神经网络中,当网络很深时,除了增加计算资源消耗以及模型过拟合问题外,还会出现梯度消失或是梯度爆炸问题,导致浅层网络参数无法更新,而残差连接可以实现网络各层级之间的跨层传递信息。残差连接将输出表述为输入和输入的一个非线性变换的线性叠加,如图 所示。假设层间需要学习的隐藏映射为(),残差映射为()(),那么原本需要学习的映射()便为残差函数(),即残差定义为:残差等于输出减输入。图 残差连接 模型结构与超参数 模型结构上文中提到的 种模块组成了 的基本模块,将 模块与一维卷积层、一维最大池化层、一维全局平均池化层和全连接层进行堆叠就可以得到 模型,模型的输入是一个 张量,输出即为预测的结果,模型的整体结构如图 所示。图 网络结构 模型超参数设置在相同卷积核大小并且神经网络中参数量相当的情况下,因为扩张率()的存在,传统的膨胀卷积相较于普通卷积具有更大的感受野。但是膨胀卷积是一种稀疏采样的方式,所以膨胀卷积存在网格效应(),即会损失信息的连续性,当多个膨胀卷积叠加时,有些特征直接被跳过了,这些被跳过的特征可能存在的关键信息的缺失,会影响模型的最终预测结果。膨胀卷积膨胀率为,的感受野如图 所示。图 膨胀卷积膨胀率为,的感受野 为了解决膨胀卷积存在的网格效应问题,将混合膨胀卷积替换膨胀卷积。假设有 个卷积层并且卷积核大小为 ,膨胀系数为,混合膨胀卷积()的目标是让一系列卷积操作后的最终感受野完全覆盖一个方形区域,没有任何漏洞或缺失的边缘。定义“个非零值之间的最大距离”为(即第 层 个非 元素的距离):,(),()定义 ,设计目标是让。例如,对于内核大小 ,当 时,膨胀率设置为 ,显然是实现了目标。实际上,并不是在下采样后对所有层使用相同的膨胀率,而是对每层使用不同的膨胀率。在设置膨胀率时,组内公约数不能大于。膨胀卷积膨胀率为,的感受野如图 所示。图 膨胀卷积膨胀率为,的感受野 顶层可以访问与原始配置相同区域的更广泛的像素范围内的信息。这一过程在所有层中重复,从而使顶层的感受野保持不变。考虑到混合膨胀卷积理论和下一节的实验结果对比,本文的超参数设置如表 所示。王体春,等:采用 的滚动轴承剩余使用寿命预测表 超参数设置一维卷积层卷积核数目为,卷积核长度为,步长为 一维最大池化层池化尺寸为 丢弃层丢弃率为 模块 卷积核数目为,卷积核长度为,膨胀率为,泄漏率为 ,丢弃率为 模块 卷积核数目为,卷积核长度为,膨胀率为,泄漏率为 ,丢弃率为 模块 卷积核数目为,卷积核长度为,膨胀率为,泄漏率为 ,丢弃率为 模型中的优化器为,吸收了(自适应学习率的梯度下降算法)和动量梯度下降算法的优点,既能适应稀疏梯度(即自然语言和计算机视觉问题),又能缓解梯度震荡的问题,可以根据历史梯度的震荡情况和过滤震荡后的真实历史梯度对变量进行更新。普通初始化器用于初始化网络权值。对扩张的因果卷积层设置 正则化项,以减少过拟合。学习率为 ,小批大小为,为。实验 实验数据介绍实验采用 数据挑战发布的轴承运行至故障数据集,数据采集自加速退化平台,如图 所示。图 加速退化平台 试验台水平和垂直放置 个加速度计,收集来自 和 个方向的振动信号。采样率为 ,每 记录 的数据。为安全起见,当振动数据幅值超过 ()时,停止实验。数据集共包括 种工况的数据:负载 ,转速 的 个轴承;负载 ,转速 的 个轴承;负载 ,转速 的 个轴承。实验细节实验结果的评估采用 个性能指标,即平均绝对误差(),均方根误差()和一个对 进行改进的评分函数,称为,被用来评价所开发的方法的性能。和 是 领域常用的评价指标,方便与领域中的其他优秀作者的实验结果进行比较。()()()在工程实际中,对剩余寿命的低估(即当前预测结果小于实际的剩余使用寿命)和对剩余寿命的高估(当前预测结果大于实际的剩余使用寿命)对机器运行的影响不同,低估可能导致不必要的停机,而高估则更加严重,可能导致事故和人员伤亡。因此,高估要比低估受到更严厉的惩罚。此外,在机械使用寿命中,后期剩余使用寿命预测的准确性比早期更重要,因为机器在生命周期的早期出现缺陷的可能性相对较低。这意味着在机械全寿命周期的后期,应该给预测结果分配较大的权重。因此,为了客观、全面地评价预测模型,本文采用了改进的 评分函数,最终的得分函数如式()所示。()式中:表示总时间步数;表示早期的百分比;和 分别表示早期和晚期的权重。本文取 ,即对寿命后半段的预测比早期更可靠、更有意义。和 的值是根据用户输入通过实验确定的。的取值在区间(,),数值越大,预测性能越好。值得注意的是,的值不一定与 和 的值一致。由于 和 在实验数据的生命周期中为每个预测分配相等的权重,它们不区分高估和低估。因此,可能存在高估的 和低估的 情况。因此,在 或 与 不一致的情况下,将 作为模型选择的度量标准。模型的输入为 轴和 轴信号进行堆叠后的数组,维度为(,),超参数设置见表,实验流程如图 所示。图 实验流程 预处理包括对振动数据和剩余使用寿命进行归一化处理,如果直接使用真实的剩余使用寿命值作为输出标签,一个剩余使用寿命值可能对应不同轴承的多

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开