温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
多元
分解
深度
学习
机器
故障
检测
方法
研究
林香
基于多元分解和深度学习的机器故障检测方法的研究林香(闽西职业技术学院智能制造学院,福建 龙岩 )摘要:基于声学的机器故障检测方法是一种新颖的研究方法,但是需要依赖采集足够丰富的故障类型数据因此,提出一种无监督的机器故障检测方法,即使用机器正常运行状态的数据作为训练样本,从而鉴别出机器异常状态该检测方法的一个关键问题是信号中的噪声,它会影响检测的性能,针对这个问题,提出了一种基于多元张量分解的准非参数光谱数据去噪策略,即非负正则多重分解,这种策略特别适用于发出稳定声音的机器 通过实验证明了这种声学检测方法,可以使得工业过程的故障监控更加准确关键词:多元分解;深度学习;无监督机器故障检测中图分类号:;文献标识码:文章编号:()引言早期机器故障检测是工业问题的难点,也是工业 降低维护成本的支柱之一声音是一种可以记录下来,并用以监控机器健康状态的信号基于声音的这一特性形成的声学监测,由于它便宜、非侵入性、非破坏性且易于安装,为行业带来了巨大的便利然而,如何区分机器正常和异常的声音仍然是难点,原因如下:故障情况通常比较少见;记录的故障无法覆盖所有可能的故障类型,噪声和伪像的存在概率可能很高,不同的操作模式使得很难区分机器的正常和异常状态为了解决这些问题,提出了无监督异常检测策略,即将正常数据用于异常检测器的训练,寻找出与其它数据最不匹配的实例来检测出测试数据的异常 目前的研究方向主要集中在没有任何关于系统故障特征数据的情况下如何去识别异常数据 本文的方法是考虑两类(正常和异常情况)之间的不平衡现象,以及缺少所有可能故障的记录,基于深度学习方法在无监督检测问题(以及更一般的音频信号处理)方面表现出显著的性能,常见的方法是单类分类器或自动编码器,对残差进行决策以执行异常检测 针对去除高频数据的重要性问题,设计了基于深度学习方法进行后续的异常检测任务 其核心思想是降低数据集的复杂度和冗余度,以达到提高神经网络分类性能的目的为了提高光谱表示的质量,研究了由机器在几个瞬间的不连续记录组成的数据结构,以及消除记录特有的假象和噪声的方法为此,提出了基于数据驱动的准非参数去噪策略方法,其主要采用了非负典型多元分解的思想,与基于非负矩阵()分解的去噪方法相比,当机器能够发出稳定的声音时,该方法十分有效多元张量分解方法使用一个典型的公开数据集作为单类分类器或自动编码器的输入数据特征进行故障检测器训练,这个数据集可以简单地写成一个三维数据立方体的张量形式,表示为 R,其中是所考虑的频率数,是帧数,是记录数 非负矩阵分解非负矩阵分解()可以被视为软聚类的一个实例 它可以用于特征的提取,还经常被用在基于声学信号的事件检测中 由于这种方法只适用于矩阵而 不 是 张 量,因 此 考 虑 张 量 的 矩 阵 表 示,即第 卷第期 菏泽学院学报 年月 收稿日期:基金项目:福建省中青年教师教育科研项目()作者简介:林香(),女,福建武平县人,讲师,硕士,研究方向:机电一体化,汽车电控技术DOI:10.16393/ki.37-1436/z.2023.02.022 R 并定义为:,:,.,:()式()中,是每个记录的时频拼接而成的 在 上应用非负矩阵分解旨在找到两个较低维度的矩阵 R和 R(是超参数,表示每个矩阵中列的数量):,()式()中,是 范数,和被约束为非负矩阵(即它们的所有元素都必须大于或等于零)矩阵的列可以被视为表征数据集的主要光谱基序,矩阵的列表示每个基序随时间激活相应的系数矩阵 非负性约束将在获得的基序中引入稀疏性,有助于获得去噪的成分同时,光谱数据是非负的,也有助于获得可解释的成分因此,使用非负矩阵分解去噪的思想是使用矩阵中的去噪基序来重构输入特征 使用非负矩阵分解的 的去噪版本表示为?,并且对应于:?()矩阵?的去噪数据也可以用张量的形式表示,记为?非负多元张量分解众所周知,张量分解(如经典的多元分解)具有良好的模式提取特性 (,卡诺尼亚多元分解)常被用于振动数据的故障检测 (,非负卡诺尼亚多元分解)可以被视为非负矩阵分解的扩展,用于表示为张量形式的数据 两个矩阵之间的乘积可以写成秩为的矩阵之和,例如:()式()中,是矢量积(设 R和 R,张量积 R)然后,对应用 分解,旨 在 用 三 个 矩 阵 R、R、R,通过对模型进行最大化方式优化,获得张量的近似值:,(:)(:)(:)()非负约束背后的出发点和非负矩阵分解是相同的 此外,它保证了这种分解方式存在全局的解 图表示了 的多元分解示意图图多元张量分解示意图这种分解去除了记录所特有的噪声和伪像的几个来源实际上,矩阵的一个分量表示为:,重新组合共享相似的光谱基序:的记录 对于该组的每个记录,该光谱基序必须随时间同步激活(与时间激活:一致)因此,通过这种分解,只有在几个记录中冗余的且时间一致的基序将被提取 此外,如果机器发出的声音是稳定的,方法尤其有效在这种情况下,表征信号的光谱基序将与几个记录中存在的恒定激活分布图相关联最后,使用 去噪,相当于使用去噪的基元来重构输入特征使用 来对去噪后可以表示为:?:()对于式()的非凸优化问题,目前已经有几种算法提出了解决方法 本文使用了分层交替最小二乘算法 来进行求解,因为它易于实现,并且与其它算法相比,表现出良好的性能声学监测测试分析将提出的去噪方法应用于声学监测案例进行研究,这是来自 数据集的公开测试基准 该数据集由真实工厂环境中记录的四种不同的机器操作声音组成这四个机器分别是一个泵、一个风扇、一个滑块和一个阀门 基准测试由一个自动编码器组成,基于异常检测器,以声音信号的 谱图作为输入特征 时频表示每台机器的声音通过一个声道麦克风阵列记录下来(仅考虑来自第一通道的信号)每个录音对应一个以 采样的 秒钟的声音片段 为了降低输入特征的维数,通过 频谱图记录每个时频与经典声谱图相比,声谱图模拟了人类的声音感知 事实上,人类不会感知线性范围的频 年 菏泽学院学报 第期率,更善于检测出低频的差异 在 频谱图中,频率被重新调整(通过 标度),使得音调中相同的距离听起来与听者的距离相似 如果经过耳朵专门训练的人能够容易地察觉正常发射和异常发射之间的差异,则这种转换是相关的将 谱图应用于来自一台机器的次记录,产生了以下表示为 R的数据集,其中和分别是用于每个录音的 谱图计算的 频率和帧数 同时,使用相同的超参数来计算 谱图,令,异常探测器异常检测器采用了自动编码器的结构 考虑到输入特征:,和,是来自一次记录的某帧的 频率,与自动编码器相关的损失函数由下式给出:(,)()()式()中,(,),()和()分别是编码器和解码器网络编码器网络()由两个 节点的密集连接层和一个节点的密集连接层组成 解码器由 个节点的两个密集层组成 使用的激活函数是 为了学习正常信号的分布,自动编码器仅针对来自健康机器发出的声音进行训练,将该训练数据集称为 通过最小化输入特征与其重构特征之间的均方根误差来寻找最佳参数:,()当故障机器发出异常声音时,训练的模型具有较高的重构误差,因为它处于在训练样本的特征分布之外 可以通过人工设定阈值来区分正常和异常声音,从而消除重建误差 阈值的选择是成功检测异常并限制错误检测的中间值可以通过使用包含故障机器发出的异常声音的验证数据集或者通过分析训练数据集的重构误差分布来确定该参数 去噪策略为了提高自动编码器的性能,建议使用由上述两种策略之一导出的去噪信号作为自动编码器的输入 如图所示,首先使用 或 策略对输入特征进行去噪,通过将自动编码器的输出与去噪后的输入进行比较,做出异常的判断 使用与基线方法中相同的自动编码器,确保观察到的改进是由于对输入信号应用了去噪策略所产生的效果 对于每种方法,唯一需要考虑的超参数是组分数量 如果太低,重建时几乎没有光谱基元 在这种情况下,将具有良好的去噪特性和伪像消除效果,但可能会错过一个关键的光谱基元 相反,如果 太高,数据集中存在的噪声和伪影也将会一并被重建 谱图仅包含非正元素,而上述两种去噪策略都具有非负约束 式()和式()是对的绝对值 此外,基线使用了数据扩充策略,其中输入特征不是直接的(或),而是来自同一记录的五个连续帧拼接而成图基于声学信号去噪的机器异常检测方法示意图实验结果使用公开数据集 来验证所提出方法的有效性将所有可用的机器分成两组:一组是感兴趣的信号稳定时:包含风扇和泵;另一组是感兴趣的信号不稳定时:包含阀和滑块 例如,在阀门正常的情况下,声发射是脉冲且稀疏的 对每台机器,采用与文献 所阐述的相同方式生成训练和验证数据集训练数据集 仅包括正常声音,有效验证数据集包含与异常记录一样数量的正常记录,目标是在用训练数据集训练了网络之后,仅检测来自验证数据集的异常声音 验证方法使用 优化技术对上述的自动编码器进行 个周期的迭代训练 利用式()在训练数据集中求解优化问题得到的参数记为 同样地,对分别使用具有 和 的去噪训练数据集?求解得到的参数记作和 验证数据集的每个记录,分别比较了基线方法(即不去噪的原始数据)、方法和 方法的 年林香:基于多元分解和深度学习的机器故障检测方法的研究第期输出 分别使用 或 分解对验证数据集 进行去噪 所使用的组分数量与处理训练数据集时的相同 和 分别独立应用于所有数据集通过 曲线(受试者操作特征曲线)以及曲线面积(),对在验证数据集的所有记录中所获得的决策,与真实情况进行比较 每个实验重复次,对神经网络进行不同的权重初始化 信号稳定时的情况首先考虑在 数据集中处于稳定运行的机器,例如风扇和泵如图显示了泵电机 的个记录的去噪效果,图中的行表示机器泵 在种不同方法下的去噪效果的记录,列表示对于每种数据记录分别采用 和 去噪的影响为了说明去噪性能,对于,按经验设定;而对于 ,令 第一段记录没有呈现出任何特殊性,可以得出,即使分量的数量比多,似乎也能去除更多的噪声与第一次记录相比,第二次记录包含不同的光谱基序在这种情况下,可以检索每个光谱基序,而会丢失低频基序 实际上,没有出现在同一时期的后续记录中的每个事件都将被删除从而说明了 对机器平稳运行过程具有去噪的优势,因为它将剔除一次性的以及时间上不一致的事件图泵电机 的去噪效果表对 比 了 对 输 入 信 号 分 别 进 行“不 去 噪”“去噪”和“去噪”策略后,在不同风机和泵数据集上的 均值 这里只考虑具有中等信噪比()和低信噪比()的数据集对于“”和“”方法,应用网格搜索,并且只保留每台机器基于异常检测的最佳试验均值性能从表中可以观察到,对于 ,使用 时获得最优结果 通过基于验证数据集优化,可以找到更精确的结果在不同情况下,与基线和方法相比,方法获得了明显的改进(除了 时的风扇)在 方法和基线之间,有一个平均的 提升,在 为 时为 ,为 时为 这些结果证明了 去噪可以降低稳定运行机器数据集的复杂性和相关性表稳定信号的机器在三种不同方法下进行次实验得出的 平均值机器 不去噪非负矩阵分解非负多元张量分解泵 泵 风扇 风扇 平均 图提供了从三种方法获得的三条 曲线,对于这些例子,说明了 去噪可以同时降低无监督机器故障异常检测的假阳性率和假阴性率 年 菏泽学院学报 第期()的泵()的风扇()的风扇 图去噪结果的 曲线 信号不稳定时的情况如图中所示,在不稳定运行时,机器阀门 的个记录的去噪效果如记录和所示,阀门声发射以稀疏和周期性事件为特征 从图中可以看出,从一个记录到另一个记录(如从记录到记录),波形的尖峰不会在相同的时间段出现 方法可以检索这些尖峰信号,但 方法不能很好的检索 对于 方法,尖峰会变平滑,但可以检测到同时具有尖峰激活的几个记录,它会大大的削弱尖峰信号重建的质量 对于最后一条记录(机器故障时发出的异常声音),尖峰不再被周期性地激活,它们都被 策略所移除,因为这种一次性的尖峰激活会被认为是一种假象图机器阀门 的三个不同方法下的数据记录表对比了输入信号分别进行“不去噪”“去噪”和“去噪”策略,对不同阀门和滑块数据集的 均值这里只考虑中等信噪比 的数 据()这些结果表明 分解不适用于此类不稳定信号 在大多数情况下,方法相比于基线方法,会带