http://bhxb.buaa.edu.cnjbuaa@buaa.edu.cnDOI:10.13700/j.bh.1001-5965.2021.0452基于LGC的反残差目标检测算法张云佐*,李文博,郑婷婷(石家庄铁道大学信息科学与技术学院,石家庄050043)摘要:基于深度学习的目标检测是计算机视觉领域的研究热点,目前主流的目标检测模型大多通过增加网络深度和宽度以获得更好的检测效果,但容易导致参数量增加、检测速度降低的问题。为兼顾检测精度与速度,借鉴Ghost卷积和分组卷积的轻量化思想,提出了一种高效的轻量级Ghost卷积(LGC)模型,以采用更少的参数获得更多的特征图。在该卷积模型的基础上引入反残差结构重新设计了CSPDarkNet53,生成了一种基于LGC的反残差特征提取网络,以提高网络对全局特征信息的提取能力。使用反残差特征提取网络替换YOLOv4的骨干网络,辅以深度可分离卷积进一步减少参数,提出了一种反残差目标检测算法,以提升目标检测的整体性能。实验结果表明:相比于主流的目标检测算法,所提算法在检测精度相当的前提下,模型参数量和检测速度具有明显的优势。关键词:轻量化模型;Ghost卷积;深度可分离卷积;反残差结构;YOLOv4;目标检测中图分类号:TP391文献标志码:A文章编号:1001-5965(2023)06-1287-07目标检测一直是计算机视觉领域的研究热点。目前,深度学习凭借其强大的表征能力和建模能力在目标检测中得到了广泛的应用[1]。基于深度学习的目标检测算法包括one-stage与two-stage两类。其中,以卷积神经网络(convolutionalneuralnetwork,CNN)主干网络和回归网络为核心组件的one-stage算法应用较为广泛,如YOLOv3[2]、YOLOv4[3]、SSD[4]等目标检测算法。该类目标检测算法在很大程度上弱化了光照变化、噪声干扰等对检测效果的影响,但在某些较为复杂的应用场景下,仍存在检测精度不足的问题;此外,其在实际应用中通常被嵌入到可移动设备,使得算法模型的大小受限于硬件条件[5]。检测精度是衡量目标检测算法优劣的重要指标,精度的提升往往通过增加网络模型深度和宽度来实现[6]。例如,Zhou等[7]提出了一种基于深度对齐网络的行人检测方法,在原有检测网络的基础上增加了基于外观模型的深度对齐网络,以校正不准确的检测结果,从而提高对遮挡行人的检出率。崔家礼等[8]提出了一种端到端的人眼检测算法,该算法在网络中引入扩张残差单元以提升小尺度人眼检测的能力,使用尺寸较大的浅层特征图预测更小的人眼目标,使人眼检测不再依赖于人脸检测。这些目标检测算法都有效提高了...