分享
联合损失监督的高频工件深度学习识别算法_杨涛.pdf
下载文档

ID:2289166

大小:526.20KB

页数:5页

格式:PDF

时间:2023-05-05

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
联合 损失 监督 高频 工件 深度 学习 识别 算法 杨涛
机械制造杨涛,等联合损失监督的高频工件深度学习识别算法基金项目:四川省重大科技专项(18ZDZX0140)第一作者简介:杨涛(1997),男,四川雅安人,硕士研究生,研究方向为图像处理与识别模式。DOI:1019344/j cnki issn16715276202301007联合损失监督的高频工件深度学习识别算法杨涛1,欧阳1,苏欣2,吴学杰1,李柏林1(1 西南交通大学 机械工程学院,四川 成都 610031;2 中国电子科技集团公司第十研究所,四川 成都 610036)摘要:针对高频工件种类多、类间相似度较高造成的识别准确率低的问题,提出一种联合损失监督的深度学习识别算法。搭建基于卷积神经网络的图像特征向量编码模型,采用角度余量损失替换 SoftMax 损失,以减小工件类内特征之间的距离,完成同类工件的鲁棒性表示;引入隔离损失以增大异类工件特征之间的距离,实现异类工件的良好性区分。实验结果表明:该方法相较于传统的图像识别方法,识别准确率更高;相较于单一的角度余量和隔离损失,识别准确率分别提高了 397%和 1388%。关键词:工件识别;联合损失;监督学习;卷积神经网络中图分类号:TP39141文献标志码:A文章编号:1671-5276(2023)01-0030-04High Frequency Workpiece Deep Learning ecognition Algorithm Based onJoint Loss SupervisionYANG Tao1,OU Yang1,SU Xin2,WU Xuejie1,LI Bailin1(1 School of Mechanical Engineering,Southwest Jiaotong University,Chengdu 610031,China;2 The 10th esearch Institute of CETC,Chengdu 610036,China)Abstract:To improve the low recognition accuracy caused by wide varieties of high frequency artifacts and high similarity betweenclasses,a deep learning algorithm with joint loss supervision is proposed An image feature vector encoding model is built based onconvolutional neural network,and the SoftMax loss is replaced by the angle margin loss to reduce the distance between the featureswithin the workpiece class and complete the robust representation of similar workpieces The isolation loss is introduced to increasethe distance between the features of heterogeneous workpieces and achieve good discrimination of heterogeneous workpieces Theexperimental results show that the recognition accuracy of the proposed method is higher than that of the traditional image recognitionmethod,with the single angle margin increasing by 397%and isolation loss 1388%respectivelyKeywords:workpiece recognition;joint loss;supervised learning;convolutional neural network0引言在中国制造 2025 目标的引领下,随着我国科学技术的发展,制造业实现自动化升级的任务急需完成。高频工件是我国航空航天硬件设备的重要组成部分,不仅种类繁多,而且加工工序较为繁琐。不同高频工件在热处理后对应的加工工序不同,所以需要在热处理后正确识别高频工件,以确保加工质量,保障航空航天设备的安全可靠。目前主要采用人工方式识别热处理后的高频工件,人眼的疲劳会降低工作效率,甚至影响工件图号识别的准确性。所以,迫切需要对高频工件的识别进行自动化升级。图像识别作为一种先进的自动化技术,近年来已广泛应用于工业领域中。图像识别技术可以大致分为基于人工特征的传统方法和基于深度学习的智能方法。传统的图像识别方法中,主要是采用图像编码的方式,手动提取图像特征用于识别。如文献 12,采用局部二值模式(local binary pattern,LBP)和方向梯度直方图(histogram oforiented gradient,HOG)特征来训练支持向量机,最后使用分类器对图像进行识别。传统的图像识别方法虽然能识别类间差别较大的高频工件,但对于类间差异较小的工件,其泛化性能较差,鲁棒性有限。随着深度学习在图像分类3、目标检测4、图像分割5 和人脸识别6 等研究领域的发展和进步,对工业图像的识别也得到了重视和研究。伍锡如等7 和郑健红等8 针对工业机器人抓取目标区域的识别问题,使用特征对神经网络进行训练,最后用训练好的卷积神经网络来对分拣目标进行识别,取得了不错的效果;王一鸣等9 和常海涛等10 针对工件缺陷的问题,采取训练好的卷积神经网络提取目标特征,达到提高缺陷检测率的目的。上述方法检测工件种类较为单一,类间差异较大,无法良好适用于本文研究的高频工件。此外,上述神经网络模型的训练困难,所需存储空间比较大,训练时间长,不适合用在高频工件识别的嵌入式自动化系统中。03机械制造杨涛,等联合损失监督的高频工件深度学习识别算法因此,本文基于角度余弦损失11 可以解决同类工件特征相距太远的问题,以及隔离损失12 可以改善不同类别工件之间的距离情况,提出了在改进深度可分离卷积 MobileNetV2网络13 的基础上,采用角度余弦损失和隔离损失的联合损失函数来监督训练过程的方法,简称为 JLSDL。本文方法的主要贡献包括:1)采用角度余量损失以改善同类工件特征之间的距离,完成类内工件的鲁棒性表示;2)使用隔离损失以实现异类工件的良好性区分;3)相较于传统的图像识别方法和单一损失函数的深度学习模型,有效降低了网络的参数量和计算量,并且识别准确率得到显著提高。1联合损失函数的神经网络训练方法本文提出的高频工件识别模型框架(JLSDL)如图 1所示,其中 是正则化参数,用于调节两个损失的权重,将在实验章节中进行讨论。模型的输入为经过预处理后的高频工件图像,图像的大小为 224224,第二个全连接层后输出工件的识别结果。图 1基于联合损失函数的高频工件识别框架(JLSDL)工业上零件识别一般采用的是 SoftMax 损失函数。SoftMax 损失函数第一步将预测结果转化到指数函数上,保证了概率的非负性。第二步将转化后的结果除以所有转化后结果之和,通过最大化预测概率,将不同类别区分开。SoftMax 损失函数定义为lS=1NNi=1logeWTyixi+byiCj=1eWTjxi+bj(1)式中:xi表示神经网络提取的特征向量;yi表示特征向量所对应的标签;Wj表示神经网络全连接层中第 j 列的权重;bj表示神经网络中的偏置项;N 表示神经网络的批次大小;C 表示类别个数。然而,SoftMax 损失函数对类内差异较大的类别效果不好。图 2 展示了在高频工件数据集上用 SoftMax 损失函数训练网络得到的特征向量经降维后的二维特征分布图,其中高频工件的不同类别用不同的颜色表示。从图 2 红框 1中可以看出,经过 SoftMax 损失函数监督训练之后还是有 3类高频工件没有明显地区分开。由红框 2 和红框 3 可以看出,同一类高频工件由于摆放位置的随机性和光照等原因,类内距离没有减小。从而不能很好地区分高频工件的类别,造成识别准确率低。针对图 2 所示问题,本文提出一种由角度余量损失和隔离损失组成的联合损失函数,由联合损失函数监督网络训练,实现最小化类内距离和最大化类间距离(本刊为黑白印刷,如有疑问请咨询作者)。图 2用 SoftMax 训练网络得到的二维特征可视化11角度余量损失监督同类工件的特征距离在高频工件的识别任务中,由于工件摆放的角度、光线的变化等原因会造成工件类内差别较大。图 3 展示高频工件的类别 C 中不同视角的图像。图 3相同类别工件图像差异大结合图 2 可知,提高识别准确率的首要措施是减小类内距离。本文采用角度余量损失函数来实现,角度余量损失函数的定义为lAC=1NNi=1loges (cosyim)es (cosyim)+nj=1,jyies cosj (2)式中:m 表示余弦余量,用来将神经网络权重 Wj和特征向量 xi的距离调节为 cosyim;S 表示缩放因子;N 表示卷积神经网络的批次大小。角度余量损失是在 SoftMax 损失函数的基础上改进而来的,相比较 SoftMax 损失函数,角度余量损失函数通过 m 约束特征向量之间的距离,可以监督训练到更小的类内距离。12隔离损失监督异类工件的特征距离图 4 展示了不同类别工件的微小差异,其中 A、B、C三类高频工件主要在图中红框标注处存在微小差异。因13机械制造杨涛,等联合损失监督的高频工件深度学习识别算法此,使用角度余量损失函数来减少类内距离时,会不可避免地减少类间的距离。所以,本文采用隔离损失函数来增大类间距离,以提高特征向量的表征能力。隔离损失函数定义如下:lIL=1nni=1xi cyi2+1cjAckAckcjckcjck2cj2+1()(3)式中:cyi表示与第 i 个样本具有相同类别标签的所有样本的中心;A 表示高频工件类别的集合;ck表示具有 L2范数的ck2的第 k 个工件类别中心;cj表示具有 L2范数的cj2的第 j 个工件类别中心;1表示调节因子,用来调节式(3)中前后项的比例。图 4不同类别工件相识度高式(3)在保证工件类内距离小的同时,通过惩罚工件之间的相似性,增大工件类间的距离。因此,本文网络模型采用结合角度余量损失和隔离损失的联合损失函数来监督训练,减小相同类别工件之间的差异,同时增大不同类别工件之间的差异,从而提高工件识别的准确率。联合损失函数定义如下:l=lAC+lIL(4)式中:为正则化参数,用于调整角度余量损失和隔离损失的权重。2实验结果与分析21实验配置本实验使用 GPU(显卡型号为 NVIDA GeForceGTX1660 SUPE)进行训练和测试,训练迭代次数为 5 000 次,批处理大小为 32,初始学习率为 0001,每间隔 1 000 次迭代,学 习 率 衰 减 1/2。在 Windows 10 平 台 上,采 用Pytorch12 框架来搭建本文提出的 JLSDL 高频工件识别模型。本文所采用的卷积神经网络具体设置如表 1 所示。图像的输入大小表示为长宽通道数,Bottleneck1 Bottleneck7 表示 7 种不同的反残差模块,CO表示输出通道数,N 表示在网络中的重复次数,FC 表示全连接层;k 表示工件的类别数。表 1 中的反残差块如图 5 所示,包括 1)膨胀层,用于扩展维度;2)可分离卷积层,用于提取深度特征;3)投影层,用于压缩数据。表 1模型的参数设置输入大小层名称CON步长2242243Con2d321211211232Bottleneck1161111211216Bottleneck2242

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开