分享
城市轨道交通安检危险品的深度学习识别.pdf
下载文档

ID:2744269

大小:1.22MB

页数:5页

格式:PDF

时间:2023-11-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
城市轨道 交通 安检 危险品 深度 学习 识别
现代计算机Modern Computer第 29 卷 第 12 期2023 年 6 月 25 日城市轨道交通安检危险品的深度学习识别令狐蓉*(山西工程职业学院交通工程系,太原 030000)摘要:针对城市轨道交通X射线安检危险品识别,在YOLOv5m基础上,增加了CBAM注意力,分别对通道和空间的特征进行操作。经过实验验证,该方法的mAP50:95、mAP50分别提升了0.6和1个百分点,结果表明改进后的算法能显著提高检测精度。关键词:YOLOv5;CBAM;X射线;危险品识别文章编号:10071423(2023)12001705DOI:10.3969/j.issn.10071423.2023.12.003收稿日期:20230505修稿日期:20230522基金项目:山西省高等学校科技创新项目(2022L707);长安大学中央高校基本科研业务费专项资金资助(300102213515)作者简介:*通信作者:令狐蓉(1989),女,山西运城人,硕士研究生,助教,研究方向为城市轨道交通通信与信号,Email:0引言2008年北京奥运会前夕,北京地铁开始安检,这是世界上第一次在城市地铁道路上进行安检。传统的X光图像中危险品检测算法基本是通过对输入图像进行预处理,随后进行特征提取,然后将提取到的特征输入到分类器,来判断是否包含危险品、确定危险品类别。但是X光安检背景复杂、物品重叠严重、违禁品尺度多样、细节特征和颜色特征丢失严重1,传统的检测算法虽然在一定程度上达到了不错的检测精度,但是应对如此复杂的场景,能力不足,还不能满足人们的预期,不能应用于危险品的实时检测。Akcay 团队将卷积神经网络(convolutionalneural networks,CNN)应用到X光安检危险品图像分类问题,随后比较了Faster RCNN和RFCN的危险品检测能力2。Zhang等3提出了基于特征融合单点多盒检测器-FSSD,对 SSD(SingleShot MultiBox Detector)进行了改进,引入了空洞卷积和残差结构,结果表明:FSSD对于小尺寸目标检测精度有了明显提升。Miao等4基于北京地铁的 X 射线图像公开了一个大规模 SIXray数据集,提出了类平衡层次细化(CHR)的方法,并将其嵌入到多种CNN中,取得了较大的性能提升。Zhao等5从实际场景出发,公开了一个多种对象重叠的 CLCXray 数据集,提出了新的标签感知机制(LA)来解决对象重叠问题,实验结果表明,基于 LA 的改进模型在 OPIXray 和CLCXray上优于SOTA模型。YOLOv56属于一阶段检测算法,一阶段检测算法与双阶段检测算法相比少了中间负样本筛选过程,所以YOLOv5具有一阶段算法实时性的优点,适合小目标检测方面、检测速度快,尤其适用于轨道交通安检系统,来进行危险物品识别。为了兼顾CPU、边缘端的场景和识别准确率,本文选择 YOLOv5m来识别危险物品,并基于 CBAM 注意力模块对其进行改进,结果显示mAP有明显提升。1YOLOv5算法YOLOv5主要包含Input(输入端)、Backbone(主干网络)、Neck(多尺度特征融合网络)和Prediction(检测头)7。Input是行李经过X 光安检后采集到的图像。Backbone 包含多种卷积、17现代计算机2023年CBSConvBNSiLu=CSPCBSRes*NCBS=ConcatCBSCSPCBSCBSCBS=ConcatCBS(a)CBS结构图(b)带有残差组件的CBS结构图(c)不带残差组件的CBS结构图图 2CBS和CSP结构2YOLOv5m算法的改进CBAM(convolutional block attention module)是一种轻量化的注意力模块,通过在通道和空间两个维度进行操作,会更关注识别目标物体,可以提高网络的特征表达能力89。CBAM 模块10如图 3(a)所示,首先将特征输入通过通道注意力模块(channel attention module,CAM)输出通道注意力图,主要聚焦在图像上有用的内容是什么,然后将输出的特征经过空 间 注 意 力 模 块(spartial attention module,SAM),对通道维度进行补充,主要聚焦在信息在哪,形成在空间和通道两个维度的特征图。经过CBAM模块后,新的特征图将得到通道和空间维度上的注意力权重,大大提高了各个特池化、归一化、激活函数等操作,主要是进行图像的特征提取。Neck模块主要是进行多尺度特征融合,增加主干特征的可接受性,丰富上下文信息。Prediction层采用分类、定位、置信度三个分支,用于获取目标的类别、位置和置信度。根据模型深度和模型宽度这两个参数得到了五种结构,分别为n、s、m、l、x。YOLOv5m 架构如图 1 所示。Backbone 网络主要由 CBS、CSP、SPPF结构组成。CBS如图2(a)所示,由卷积、归一化、SiLu 激活函数构成。Backbone 采用的是带有残差组件(Res)的CSP结构,如图2(b)。Neck层采用的是FPN和PAN结构设计,其中的CSP结构是不带Res组件的,如图2(c)。目标检测任务的损失函数由分类损失、定位损失和置信度损失的加权得到。在训练过程中,输入图像采用Mosaic数据增强、自适应锚框计算、自适应图片缩放等提高模型的泛化能力、减少了计算量。CBSCBSCSPCBSCSPCBSCSPCBSCSPSPPFConcatUpsampleConcatCSPCBSCSPCBSConcatCBSCSPConcatUpsampleCBSCSPConvConvConvBackboneNeckPredictionInput图 1YOLOv5m结构 18令狐蓉:城市轨道交通安检危险品的深度学习识别第12期通道注意力模块空间注意力模块输入特征输出特征最大池化平均池化F McF ConvMsabc(a)CBAM模块结构图(c)SAM模块结构图(b)CAM模块结构图征在通道和空间上的联系,更有利于提取目标的有效特征。CAM 模块10如图 3(b)所示,将尺寸为H W C的特征图F分别经过全局最大池化(MaxPool)和全局平均池化(AvgPool)两种不同池化方式的运算,从而获得两个1 1 C的通道特征。将输出的两个特征的元素进行乘积加和操作后,通过 Sigmoid 激活函数可以获得需要的通道注意力图Mc。Mc=()MLP()AvgPool()F+MLP()MaxPool()F(1)SAM模块如图3(c)所示,对输入F的各通道使用均池化和最大池化进行维度上的压缩来聚合通道信息,将获得的两个H W 1大小的通道特征经过一个大小为7 7的卷积层进行融合,最后使用 Sigmoid 激活函数把权重系数和输入的特征F相乘从而得到空间注意力图Ms,如下式所示。Ms=()f7 7()AvgPool()F,MaxPool()F(2)本文将CBAM模块嵌入到Prediction部分之前,即 在 CSP 和 Conv 之 间 添 加,改 进 后 的YOLOv5m如图4所示。3实验结果与分析3 3.1 1数据集数据集本文采用 Zhao 等5公开的 CLCXray(Cuttersand Liquid Containers X-ray Dataset)数 据 集。CLCXray数据集包含 9565 张X光安检图像,有12个类别,包括5种刀具和7种液体容器,5种刀具包括刀片、匕首、刀、剪刀、瑞士军刀,7种液体容器包括易拉罐、纸盒饮料、玻璃瓶、塑料瓶、真空杯、喷罐、锡罐。CLCXray更关注对象和相似背景之间的重叠,以及多个对象之间的重叠。每张 X 光图像平均包含两个以上的潜在危险物品,更符合实际场景。3 3.2 2评价指标评价指标本文采用平均精度均值(mean average precision,mAP)作为模型的评价指标,即所有类别的 平 均 精 度(average precision,AP)的 均 值。图 3CBAM模块结构 19现代计算机2023年mAP综合考虑了精确率(precision,P)和召回率(recall,R),是 P-R(precision-recall)曲线下的面积,评价指标的计算公式如下:P=TPFP+TP(3)R=TPFN+TP(4)AP=01P(R)dR(5)mAP=1nAP(6)3 3.3 3实验结果实验结果YOLOv5m及其加入CBAM模块后的YOLOv5m实验结果如表 1 所示,同时与 Zhao5提出的ATSS模型进行对比。表 1不同模型的识别效果对比算法ATSS+LAregATSS+LAclsYOLOv5mYOLOv5m+CBAMmAP50:95/%58.559.360.561.1mAP50/%70.971.870.671.6表1中,mAP50也可以写为mAP0.5,计算每一类别 IoU 设为 0.5 时的 AP,对所有类别的AP 求平均值;mAP50:95也可以写为 mAP0.5:0.95:在不同阈值(从 0.5 到 0.95,步长 0.05)上的平均mAP。从表1可以看出,YOLOv5m比ATSS+LAreg和 ATSS+LAcls 在 mAP50:95上分别提升了 2 和 1.2个百分点。添加CBAM注意力后的YOLOv5m则分别提升了2.6和1.8个百分点。而YOLOv5m在添加CBAM注意力前后,mAP50:95、mAP50分别提升了0.6和1个百分点。结果表明,基于CBAM注意力改进的YOLOv5m在CLCXray危险品识别中有一定的优越性。采 用 CBAM 改 进 的 YOLOv5m 模 型 对CLCXray数据集中的所有类别进行分析,结果如表2所示。在所有的类别中,knife 的 mAP50达到了99.5%,mAP50:95达到了91.3%,表现出了非常高的 识 别 效 果。但 是 GlassBottle 的 mAP50只 有16.9%,mAP50:95达到了14.0%,效果很不理想。CBSCBSCSPCBSCSPCBSCSPCBSCSPSPPFConcatUpsampleConcatCSPCBSCSPCBSConcatCBSCSPConcatUpsampleCBSCSPConvConvConvBackboneNeckPredictionInputCBAMCBAMCBAM图 4改进后的YOLOv5m结构 20令狐蓉:城市轨道交通安检危险品的深度学习识别第12期表 2所有类别识别结果对比类别allbladescissorsknifedaggerSwissArmyKnifePlasticBottleCansVacuumCupGlassBottleCartonDrinksTinSprayCans数量14213454161917590473211095149114mAP50:95/%61.162.669.691.383.365.471.837.884.714.063.958.031.1mAP50/%71.677.080.699.589.688.684.243.891.916.979.966.240.34结语针对城市轨道交通X射线安检危险品识别,本文在 YOLOv5m 基础上,增加了 CBAM 注意力,分别对通道和空间的特征进行操作。在CLCXray数据集上进行实验验证,结果表明改进后的算法能显著提高检测精度。但是改进后的算法在 GlassBottle、Cans、SprayCans 等类别上检测效果不理想,下一步研究可以围绕增加GlassBottle、Cans、SprayCans三个类别的图像改进。参考文献:1 任健.基于改进 YOLOv5的轻量化违禁物检测技术研究与实践 D.四川:四川师范大学,2022.2 AKCAY S,BRECKON T P.An evaluation of region based object detection strategies within Xraybaggage security imageryCProc

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开