温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
支持
向量
决策树
算法
滚动轴承
故障诊断
中的
应用
孔祥媖
技术与市场技术应用2023年第30卷第2期支持向量机和决策树算法在滚动轴承故障诊断中的应用孔祥(重庆交通大学机电与车辆工程学院,重庆 400074)摘要:滚动轴承作为旋转机械中常见的部件,其发生故障轻则导致设备停工,重则造成经济损失和人员伤亡,因此滚动轴承的故障诊断在机械维护中有着重要意义。使用 DC 竞赛轴承故障检测数据集对滚动轴承故障诊断中常用模型进行对比分析,按照 8 2 的比例划分训练集与测试集,采用 SMOTE 过采样方法对训练集进行处理,从而解决类样本不平衡问题。将处理完后的训练集输入支持向量机(SVM)以及决策树模型,通过比较 2 个模型的测试集测试结果可以发现,SVM 模型在滚动轴承故障诊断中更有效。关键词:故障诊断;滚动轴承;支持向量机(SVM);决策树doi:10 3969/j issn 1006 8554 2023 02 0160引言滚动轴承是风力发电机等大型机械设备的重要零部件,其性能状态直接影响机械设备的安全稳定运行。及时、准确的故障诊断对制定针对性维护计划,延长使用寿命,提高机械系统可靠性有重要意义。因此,滚动轴承故障诊断的研究具有重要意义1。在滚动轴承故障诊断领域,信号采集技术、计算能力,特别是人工智能和机器学习技术的进步,使诊断更加自动化。基于机器学习的故障诊断范式可分为 3 个阶段:数据采集、特征提取和模式识别。第 1 阶段,从安装在设备中的传感器收集信号,以获得有关其状态的定量信息。其中,振动信号最常用于轴承故障诊断2。第 2 阶段,在时域、频域或时频域3 中处理收集的信号,以提取可能代表轴承状态的属性(或特征)。例如,属性是统计指标、自回归模型系数、分解为奇异值4 等。这些属性被收集到一个低维向量中(远小于所收集信号的样本数),作为下一步分类的输入。第 3 阶段,使用专门用于模式分类的算法读取属性并进行诊断,这通常在训练步骤后完成。在训练步骤中,调整算法以从机器操作历史中识别不同的操作模式。在滚动轴承故障诊断的背景下,已经使用了一些算法来实现,例如决策树5、k 近邻(k-NN)6、朴素贝叶斯分类器和支持向量机(SVM)7 等算法。SVM 技术具有良好的泛化性,并且有着坚实的理论基础,已成功应用于各种分类问题,如字符和对象识别。SVM 分类器通常针对二进制问题进行训练,其中只需要区分两类(“缺陷”和“非缺陷”),但也可以针对多类问题进行调整(使用“全反一”策略)。决策树算法则是一种基于树的知识方法,用于表示分类规则。用 C4 5 算法生成的标准树由多个分支、1 个根、多个节点和多个叶子组成。1 个分支是从根到叶的节点链;每个节点涉及 1 个属性。树中属性的出现提供了有关相关属性重要性的信息。本文利用 SVM 算法和决策树算法,使用 DC 竞赛轴承故障检测数据集对其在滚动轴承故障诊断中的使用效果进行对比分析,通过观察 4 个评价指标对2 个模型进行综合评估,结果表明,SVM 能更为准确地对滚动轴承进行故障诊断。1支持向量机算法SVM 分类器条目是要分类的对象的属性向量。该算法的输出是一个分数,其信号(正或负)描述测试向量是否属于每个感兴趣的类别,该分数直接作为检测类别的标签呈现给用户。SVM 是一种二元识别模型。它的目的是找到一个最优超平面段样品,以便最大化之间的距离最近的点的空间和本身,算法如下。56技术应用TECHNOLOGY AND MAKETVol30,No2,2023给定 1 个训练集:D=(x1,y1),(x2,y2),(x3,y3),(xi,yi),yi1,1(1)超平面可以用函数表示:f(x)=wTx+b(2)如果 f(x)为0,样本点落在超平面。当 f(x)超过0 时,y 的值为 1。如果 f(x)的值小于 0,则 y 的值为1。其中 y 只是一个标签,为了便于描述,y 的范围是1,1。wTxi+t+1,yi=+1wTxi+t 1,yi=1(3)当 wTx+t 的值大于 1 或小于 1 时,更支持。空间中任意采样点 X 到超平面的距离用 r 表示:r=|wTx+t|w(4)也就是说,SVM 的最终目标是使分类区间最大化。集成学习是将多个弱分类器结合一定的策略来生成一个强分类器。Bagging 算法是一种基于均匀概率分布对数据集进行重复采样(带放回)的方法。每个新数据集都具有与初始数据集相同的维度。2决策树算法决策树用于衡量特征贡献程度的算法有 3 种,分别为信息增益(ID3)、信息增益率(C4 5)和基尼指数(Gini index)。CAT 采用的是基尼指数最小化准则,即用基尼指数选择最优特征,同时决定该特征的最优二值切分点。基尼指数表示在样本集合中 1 个随机选中的样本被分错的概率,指数越小表示集合中选中样本被分错的概率越小,集合的纯度越高,反之集合越不纯。在分类问题中,假设一共有 M 个类别,样本点属于第 m 类的概率为 pm,则该概率分布的基尼指数为:Gini(p)=Mm=1pm(1 pm)=1 Mm=1p2m(5)式(5)表示概率的不确定性。对于二分类问题,若样本属于其中某一类的概率是 p,则:Gini(p)=2p(1 p)(6)在遍历特征集合寻找各个特征的切分点时,假设数据集被属性划分成了 D1和 D22 个子集,则在属性的条件下数据集的基尼指数计算如下:Gini(D,S)=|D1|DGini(D1)+|D2|DGini(D2)(7)3基于机器学习的故障诊断3.1数据介绍本文的研究数据来自 DC 竞赛轴承故障检测数据集,由 id(样本编号)、6 000 个轴承震动信号以及label 组成。其中,label 指该样本轴承是否出现故障,label 为 0 时为正常,label 为 1 时为故障。整个数据集有 792 个样本,其中正常轴承有 177 个样本,故障轴承有 615 个样本,label 分布如图 1 所示。600500400300200100010样本个数标签图 1label 分布3.2数据处理按照 82 的比例划分训练集与测试集,通过观察 label 分布,可以发现数据存在不平衡的现象,采用SMOTE 过采样方法对训练集进行处理,从而解决类样本不平衡问题,处理完毕后 label 为 0 和 1 的样本均为 492 个。3.3基于 SVM 的轴承故障诊断将训练集输入 SVM 模型进行训练,模型选择SVM SVC,参数均为默认,模型训练完毕后用测试集进行预测,预测情况如混淆矩阵所示(见图 2)。3615010801预测100806040200正确01混淆矩阵图 2SVM 混淆矩阵66技术与市场技术应用2023年第30卷第2期通过观察混淆矩阵可以发现,label 为 0 的样本全部判断正确,label 为 1 的样本有 15 个误判,剩下的 108 个样本判断正确。图 3 为 OC 曲线,OC 曲线图是反映敏感性与特异性之间关系的曲线。横坐标 x 轴为 1 特异性,也称为假阳性率(误报率),x 轴越接近零准确率越高;纵坐标 y 轴称为敏感度,也称为真阳性率(敏感度),y 轴越大代表准确率越好。总的来说,AUC 的值越接近1 效果越好。通过 OC 曲线图可以发现 AUC的值为 0 939,效果较好。0.00.20.40.60.81.0假阳性率AUC=0.939真阳性率1.00.80.60.40.20.0图 3OC 曲线3.4基于决策树的轴承故障诊断将训练集输入决策树模型进行训练,参数均为默认,模型训练完毕后用测试集进行预测,预测情况如混淆矩阵所示(见图 4)。2601预测10080604020正确01混淆矩阵1012111图 4决策树混淆矩阵假阳性率AUC=0.812真阳性率1.00.80.60.40.20.00.00.20.40.60.81.0图 5决策树 OC 曲线通过观察决策树混淆矩阵可以发现,label 为 0的样本中有 10 个误判为 1,剩下的 10 个样本预测正确,label 为 1 的样本有 12 个误判,剩下的 111 个样本判断正确。通过观察 OC 曲线,AUC 的值为0 812,如图 5 所示。3.5模型评估为了进一步评价 SVM 和决策树模型的性能,采用如 下 指 标 对 测 试 集 进 行 评 价,包 括 精 确 率(PE)、召回率(ecall)和准确率(ACC)。指标的定义如下:PE=TPFP+TP(8)ecall=TPTP+FN(9)ACC=TN+TPTN+FN+TP+FP(10)式中:TP 表示正确识别的阳性样本数量;TN 表示正确识别的阴性样本数量;FN 表示错误识别的阳性样本数量;FP 表示识别错误的阴性样本数量。SVM 模型的测试结果如表 1 所示,从以上 4 个评价指标来看,SVM 能起到很好的预测效果。表 1SVM 和决策树模型评估ACC/%ecall/%PE/%AUCSVM9194850 939决策树8681800 81276技术应用TECHNOLOGY AND MAKETVol30,No2,20234结语本文利用轴承振动信号数值特征来进行建模,以实现轴承故障诊断。在建模过程中用 SMOTE 过采样方法来解决训练集不平衡的现象,通过观察 4 个指标,可以发现 SVM 有较好的预测效果,准确率达到了91%,能够对轴承的故障诊断提供有效的参考。参考文献:1 雷亚国,杨彬,杜兆钧,等 大数据下机械装备故障的深度迁移诊断方法 J 机械工程学报,2019,55(7):1 8 2 董绍江,裴雪武,吴文亮,等 基于多层降噪技术及改进卷积神经网络的滚动轴承故障诊断方法 J 机械工程学报,2021,57(1):148 156 3 任胜杰,郭伟超,舒定真,等 时频分析和深度学习相结合的滚动轴承故障诊断J 机械科学与技术,2021(10):1 11 4 陈剑,刘圆圆,黄凯旋,等 基于奇异值分解和独立分量分析的滚动轴承故障诊断方法J 计量学报,2022,43(6):777 785 5 张星星,李少波,柘龙炫,等 基于机器学习算法的滚动轴承故障诊断研究 J 组合机床与自动化加工技术,2020(7):36 39+44 6 张龙,周俊 多模型融合下的滚动轴承故障诊断方法 J 噪声与振动控制,2022,42(3):132 137+149 7 姚德臣,杨建伟,程晓卿,等 基于多尺度本征模态排列熵和 SA SVM 的轴承故障诊断研究 J 机械工程学报,2018,54(9):168 176作者简介:孔祥媖(1998),女,山东临沂人,硕士研究生在读,研究方向:机器学习与人工智能。(上接第 64 页)座在各个试验工况下,发生的应力变化最大值均小于材料的许用应力,强度满足工况要求,未有超出材料许用应力 143 MPa 强度标准值的情况。参考文献:1 胡忠 向家坝水电站7 号机组过速试验中接力器异常开启的受力过程分析 J 水利水电技术,2015(S1):4 2 孙万泉,郑泽知,郭志强 水电机组轴系的形状记忆合金振动控制研究 J 水力发电,2021,47(7):89 94 3 樊涛 大型机组电气启动试验中真机试验方法探讨 J 华电技术,2011,33(1):2 4 高鹏飞 基于子结构法的发动机关键零部件结构优化设计研究 D 太原:中北大学,2018 5 楼少杰 运动部件表面应变的无线监测系统研究 D 上海:华东理工大学,2016 6 张虎 电阻应变式传感器及其在多个力传感器测试技术中的运用 J 实用测试技术,2001(5):2 7 邵乃辰 混凝土应力应变的量测和计算 C 全国大坝安全监测技术信息网 2007 年技术信息交流会,2007 8 丰远,边健,刘慧,等 基于电阻应变效应的惠斯通电桥测量重量实验 J 鸡西大学学报,2020,20(10):45 48作者简介:林非(1973),男,福建三明人,本科,工程师,研究方向:水能动力机械和工程建设。86