2023年8期创新前沿科技创新与应用TechnologyInnovationandApplication基于注意力机制改进深度神经网络的遮挡目标检测晏超(南京邮电大学通达学院,江苏扬州225127)在实际生活中,目标往往不是完整展示在视觉范围当中,感兴趣目标可能和同类目标发生重叠,也可能会受到不同类目标的遮挡干扰[1]。感兴趣目标的缺失展示给机器完成高准确度目标检测的任务带来很大难度,为了实现复杂环境中被遮挡目标和其他目标的区分,对模型提取特征方面的要求会更高。人类的视觉在观察目标时通常会着重关注目标区域的信息,并且减小关注甚至忽视剩余的信息。在视觉的有限关注力下,关注图像中偏重点的部分,将更多的精力投入到这个部分发掘更多与目标关联紧密且有用的特征信息,抑制无价值的信息,这就是注意力机制。在面向被遮挡目标的检测中引入注意力机制,进一步提升模型提取关键特征信息的性能,以此更加准确地预测被遮挡目标的真实位置。1改进生成特征图的方式1.1SSD目标检测算法SSD(SingleshotMultiBoxDetector)的网络纵深结构主要由主干前置网络VGG16和后续的多个辅助卷积特征层(conv)组成[2],如图1所示。基于多尺度特征图检测的思路,向网络输入300×300尺寸的图片,VGG16网络作为SSD网络的基础网络输出1张特征图,后续的卷积层再输出5张特征图。越往后的卷积层作者简介:晏超(1994-),男,硕士,助教。研究方向为机器视觉。摘要:目标检测是机器视觉领域一个重要的基础性方向,是以标示出图像中感兴趣目标的真实位置为目的的工作,而图像中的部分目标往往处于被遮挡的状态。由于实际环境中目标被遮挡程度和遮挡目标物体性质不同等因素的影响,提高检测被遮挡目标的准确性是一个难点。该文以一步检测法SSD目标检测算法为基础,在部分卷积层结构中添加注意力机制模块CBAM,有目的地关注特征图中的重要信息以较好地检测被遮挡的小目标。还引入Inception-ResNet-v2网络结构改变SSD算法中特征图的生成方式,并嵌入CBAM改进Inception-ResNet-v2的部分结构,更好地提取关键信息以区分被遮挡目标和干扰项。分别从行人和车辆2个不同目标出发,混合开源数据集和自建数据集进行训练,测试结果表明改进后的模型检测被遮挡目标的效果有所提升。关键词:遮挡目标检测;注意力机制;CBAM;Inception-ResNet-v2;SSD中图分类号:TP391.4文献标志码:A文章编号:2095-2945(2023)08-0010-05Abstract:Objectdetectionisanimportantbasicdirectioninthefieldofmachin...