改进
YOLOv4
框架
息肉
检测
吴宇杰
改进 YOLOv4 框架的胃息肉检测吴宇杰,肖满生,范明凯,胡一凡(湖南工业大学计算机学院,株洲412007)通信作者:肖满生,E-mail:摘要:在计算机视觉的内窥胃部息肉检测中,高效提取小型息肉图像特征是设计深度学习的计算机视觉模型一个难点.针对该问题,提出了一种 YOLOv4 改进的 YOLOv4-polyp 检测模型.首先在 YOLOv4 的基础上,引入 CBAM卷积注意力模块增强模型在复杂环境的特征提取能力;其次设计出轻量级 CSPDarknet-49 网络模型,在降低模型复杂度的同时提高检测精度和检测速度;最后根据胃息肉数据集的特点,采用 K-means+聚类算法对胃息肉数据集进行聚类分析,得到优化后的锚框.实验对比结果表明,YOLOv4-polyp 对于经典 YOLOv4 模型在保持检测速率不变的同时,在两个数据集中平均检测精度分别提升了 5.21%和 2.05%,表现出良好的检测性能.关键词:YOLOv4;注意力机制;K-means+;目标检测引用格式:吴宇杰,肖满生,范明凯,胡一凡.改进 YOLOv4 框架的胃息肉检测.计算机系统应用,2023,32(2):250257.http:/www.c-s- YOLOv4 Framework for Gastric Polyp DetectionWUYu-Jie,XIAOMan-Sheng,FANMing-Kai,HUYi-Fan(SchoolofComputerScience,HunanUniversityofTechnology,Zhuzhou412007,China)Abstract:Inendoscopicgastricpolypdetectionbasedoncomputervision,efficientlyextractingthefeaturesofimagesofsmallpolypsisadifficultyinthedesignofadeeplearning-basedcomputervisionmodel.Tosolvethisproblem,thisstudyproposesadetectionmodelbasedonanimprovedyouonlylookonceversion4(YOLOv4),namelyYOLOv4-polyp.Specifically,onthebasisofYOLOv4,thisstudyaddsaconvolutionalblockattentionmodule(CBAM)toenhancethefeatureextractioncapabilityofthemodelincomplexenvironments.Then,alightweightCSPDarknet-49networkmodelisdesignedtobothreducethecomplexityofthemodelandimproveitsdetectionaccuracyanddetectionspeed.Finally,consideringthecharacteristicsofthegastricpolypdatasets,theK-means+clusteringalgorithmisusedfortheclusteranalysisofthegastricpolypdatasetsandtheattainmentoftheoptimizedanchorbox.TheexperimentalcomparisonresultsshowthatcomparedwiththeclassicalYOLOv4model,theproposedYOLOv4-polypachievesfavorabledetectionperformanceonthetwodatasetsasitimprovestheaveragedetectionaccuracyby5.21%and2.05%,respectively,withoutcompromisingthedetectionspeed.Key words:YOLOv4;attentionmechanism;K-means+;targetdetection随着人工智能与目标检测应用技术的发展,使用计算机视觉辅助检测胃部息肉成为一种趋势.利用内窥胃镜采集的图像进行息肉的检测与识别是计算机视觉辅助的重要内容.息肉检测过程中由于光照变化、息肉边缘不明显、视角遮挡、分辨率等问题使得准确识别困难,因此对于计算机视觉辅助检测的准确性和稳定性有很高的需求.根据不同的检测手段,将计算机视觉辅助检测分为传统方法1,2和基于深度学习的目计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(2):250257doi:10.15888/ki.csa.008931http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:湖南省自然科学基金(2021JJ50049,2022JJ50077);湖南省教育厅重点项目(21A0607)收稿时间:2022-06-17;修改时间:2022-07-18;采用时间:2022-08-09;csa 在线出版时间:2022-11-04CNKI 网络首发时间:2022-11-15250软件技术算法SoftwareTechniqueAlgorithm标检测方法.在传统方法中,医生会通过仪器捕捉处理过的画面来快速判断息肉是否存在3.如果画面中息肉特征不明显或有许多干扰,传统方法则无法快速准确判断息肉.基于深度学习的目标检测方法分为一阶段检测算法和二阶段检测算法.一阶段检测算法代表有SSD 系列4和 YOLO 系列5等.二阶段检测算法代表有 R-CNN 系列6和 SPPNet7等.一阶段目标检测算法着重于实时检测方面进行优化.如马燕8基于 SSD 进行改进,在动态肠镜息肉图像实时定位算法中,使用多种 inception 模块代替 SSD 基础特征提取网络结构中的传统卷积层来增加神经网络深度提取能力,最终平均检测精度(mAP)达到 96%;王博等人9在 M2det 基础上进行改进,在提出的基于M2det 内窥镜息肉检测方法中,他们通过 FFMs 模块融合主干网络特征,使图像特征得到了充分利用,以及在SFAM 模块中增加 SENet 注意力机制来保留有效特征,最终 mAP 达到了 98.25%;Laddha 等人10在针对息肉大小不一的基础上,使用 YOLOv3 和 YOLOv3-tiny两种不同规模大小的模型,最终实验得到了 91%和82%的准确率;Cao 等人11在 YOLOv4 的基础上,设计出一个特征提取和融合模块,并将其与 YOLOv4 网络相结合,最终在准确率方面达到了 91.6%.Yu 等人12在 Scaled-YOLOv4 的基础上,设计出 ITH 模块,ITH模块与 YOLO 检测头共享权重以进行快速特征提取,实验结果表明,该模块对比原先提升了 30%的识别速度.二阶段目标检测算法注重于目标检测精度方面进行提升.如 Ta等人13基于 FasterR-CNN 进行改进,首先使用 ResNet-101 替代 VGG16,然后使用基于卷积神经网络的超分辨率(SRCNN)方法提高结肠镜图像的分辨率,最终提升模型的准确率;Cheng 等人14基于MaskR-CNN 进行改进.首先提出了一种可学习的定向导数网络(LOD-Net),计算息肉每个像素的 8 个定向导数,然后用这些导数值构成息肉的候选框,最终提高息肉分割边界预测的准确性.不过二阶段目标检测算法在实时性方面比较差.在实例分割领域,任莉莉等人提出了基于 U-Net 网络改进的 GLIA-NET 网络15,主要特点是在双层卷积后加入交互式注意力卷积模块,引入后检测精度提升 6.7%.这些方法在针对常规息肉检测准确率或实时性上有良好的改进.由于胃部环境复杂,小型息肉具有分辨率低、特征信息不足问题,常规特征提取到的小型息肉特征不足,导致漏检现象发生.针对小型息肉漏检问题,本文在 YOLOv4 的基础上进行了以下改进:(1)对CSPDarknet-53 基础网络上进行改进,设计出一种精简的 CSPDarknet-49 网络,减少网络深度,使得网络能够保留更多的小目标特征信息,同时增加准确率;(2)利用息肉数据集的特点,使用 K-means+聚类算法对数据集进行聚类分析,得到 9 组不同比例大小的锚框,提升模型对小目标的检测精度;(3)在 YOLOv4 的骨干网络中引入卷积注意力模块,使得网络能够在空间和通道两个维度进行特征提取,从而学习到更深层次的特征信息,从而提高小目标的检测能力.1YOLOv4 网络介绍YOLOv4 网络16结构如图 1 所示.YOLOv4 由CSPDarknet53 主干特征提取网络、SPP、PANet 特征融合模块和检测头 YOLOhead 组成.CSPDarknet53由 CBM 和 CSP 模块组成,CSP 模块内部残差网络可以降低网络复杂结构,同时对残差边的信息进行少量处理后与原先提取特征进行堆叠,保留深层次特征同时过滤背景信息.经过主干网络处理后得到输出特征.经过 SPP 最大池化操作后,PANet 模块的上采样,卷积堆叠等操作对于不同层次的特征信息进行特征融合,最后将特征信息传给 YOLOHead 进行预测判断,从而实现目标检测.2YOLOv4 改进相关工作前面介绍了在 YOLOv4 网络模型.由于息肉检测环境复杂,小型息肉分辨率不足和特征信息过少,YOLOv4模型在检测小型息肉时容易发生漏检现象.本文针对上述问题,改进出 YOLOv4-polyp 网络模型.本文从锚框优化,主干网络结构和注意力机制 3 方面对 YOLOv4模型16进行改进,改进后的 YOLOv4-polyp 模型如图 2所示.其中橙色部分为对比图 1 中 YOLOv4 模型改进点.首先结合息肉数据集特点,使用 K-means+聚类算法对息肉数据集得到合适的锚选框.其次为了提高小型息肉的检测能力,在主干网络中引入 CBAM 卷积注意力模块,使得 YOLOv4-polyp 模型能够从通道和空间两个注意力机制增强小型息肉特征提取能力,从而避免发生漏检.为了降低 CBAM 卷积注意力模块的增加导致检测速率的降低,对主干网络 Res 模块层数进行精简,将部分 CBM 替换为 CBL 简化模型复杂度.在保证准确率的同时降低模型复杂度,从而提升模型的检测速率.2023年第32卷第2期http:/www.c-s-计 算 机 系 统 应 用SoftwareTechniqueAlgorithm软件技术算法251PANetn4164163CBMCBM=ConvBNMishResunit=CBM CBMaddResxn=CBMCBMResunitCBMCBMCBMRes1Res2Res8CBAMRes8Res4CBLCBL=ConvBNSPP CBLCBLconvHeadconvHeadconvHeadCBLCBLCBLCBLCBLCBLCBLCBAM=CAM BAM131326265252CBLCBLReLUcon-catcon-catcon-catcon-catcon-catcon-cat图 1YOLOv4 网络结构CBMRes1Res2Res6Res8Res4CBL SPP CBLCBLCBLCBLCBLCBLconvHeadconvHeadconvHeadCBLCBLCBL131326265252CBLCBLPANetn4164163CBM=ConvBNMishResunit=CBM CBMaddResxn=CBLCBLResunitCBLCBLcon-catCBLCBAMCBL=ConvBNCBAM=CAM BAMReLUcon-catcon-catcon-catcon-catcon-cat图 2YOLOv4-