温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
混合
注意力
机制
SAR
图像
目标
识别
算法
史宝岱
引用格式:史宝岱,张秦,李宇环,等 基于混合注意力机制的 图像目标识别算法 电光与控制,():():基于混合注意力机制的 图像目标识别算法史宝岱,张 秦,李宇环,李 瑶(空军工程大学研究生院,西安)摘 要:深度学习算法应用于 图像分类领域时存在模型训练时间较长且精度不够高等问题。对此,提出一种基于混合注意力机制的卷积神经网络模型,该模型基本模块分为主干分支和软分支。主干分支由残差收缩网络和改良之后的通道注意力机制组成,负责提取主要特征;软分支将下采样和上采样相结合,负责提取混合注意力权重,增强从输入到输出的映射能力。该模型在 数据集上取得了 的识别率,且训练时间较短。噪声分析显示:该模型对椒盐噪声具有较强的鲁棒性。关键词:图像;深度学习;卷积神经网络;残差收缩网络;注意力机制中图分类号:文献标志码:():;引言合成孔径雷达(,)作为国际上研究的热点与难点,可以在全天候、全天时情况下对目标进行成像。传统的机器学习方法已经无法满足现实需求,目前主要以深度学习算法为核心,尤其是卷积神经网络(,)因可以完成特征提取与分类的一体化识别而受到青睐。年,邵嘉琪等提出一种两阶段迁移学习方法,并将其用于舰船目标识别;年,任硕良等将预训练的 模型迁移到 数据集上,将识别率提收稿日期:修回日期:基金项目:国家自然科学基金面上项目()作者简介:史宝岱(),男,河北辛集人,硕士生。高到了 。图像与一般光学图像具有共通之处,其算法思想可以引入 图像目标识别,。为了提高 模型的性能,研究者大都从网络深度和网络宽度上着手。网络深度上,从 到;网络宽度上,从 ,到 。但在大数据时代,对网络无论是从深度还是宽度上进行调整,都会大量消耗计算机的计算能力,带来信息过载的问题,尤其是 图像中含有大量噪声,简单堆叠层数只会带来过拟合问题,难以取得好的效果。而注意力机制可以有选择地突出关键信息,抑制冗余信息的传递。在 会议上,卷积块注意模块()被 等提出,该模型将 同时运用于空间域和通道域两个第 卷 第 期 年 月 电 光 与 控 制 维度,在少量增加参数量的基础上提升了网络性能;在 会议上,等提出通过自适应一维卷积实现无降维的局部跨通道交互,在几乎不增加复杂度的情况下,开发出有效的超轻量级通道注意力模块。基于以上论述,本文将注意力机制引入 图像目标识别,提出一种基于混合注意力机制的 图像目标识别算法,在消耗较少计算资源的情况下,提高 数据集的精度,而且为了抑制 图像中所含噪声,将残差收缩网络作为骨干构建网络。所提模型共包含两个基础模块,基础模块又包含主干分支和软分支两部分:主干分支由残差收缩网络和改进后的通道注意力机制组成,具有较强的信息流动性;软分支负责生成混合域的注意力权重,该模型同时实现了识别精度和训练时间的优化。为进一步检测模型在异常情况下的鲁棒性,还对数据集进行了加噪实验。注意力机制注意力机制已经成为提高神经网络性能的重要手段,它可以根据特征的重要性,生成对应的权重,合理地分配计算资源,增强网络处理的效率,其关键在于根据特征的重要程度生成一组新的权重。年,等提出了典型的通道注意力模型,在通道维度上完成了特征的重新标定,主要分为 步:)首先使用全局平均池化(,)得到一维实数表征各通道重要程度;)通过全连接层(,)和激活函数 组成的 进行映射;)最后通过点乘运算把归一化之后的权重加权到原来特征上。其中,个 保证了网络在获得更多的非线性拟合能力的同时,减少了参数量,本文所提模型中 值与文献一致,均设为,此值可以手动调优。虽然实现了通道注意力,但其第一步采用 获取中间特征图是不够准确的,全局平均池化可以很好地保留原始信息,但遇到正负激活值抵消的情况,就会使特征图变模糊。为了对 提出的通道模型进行改进,以 为模型,在其跨越连接上加入通道注意力模块,在流模块上分别采用 种不同的池化方式进行实验,数据集为 数据集,实验结果如表 所示。全局最大池化(,)可以较好地保留图片纹理信息,但会损失背景信息;全局随机池化(,)按概率值大小随机选取特征,泛化性较强;而本文提出的改进池化方式,由以上 种池化方式获得 个一维矢量,再通过多层感知器(,)共享网络拟合通道间的相关性,得到调整过的 个一维矢量,相加之后再通过 函数激活,其余过程与 提出的模型相同,这里不再赘述。由结果可以看出,采用上述 种池化方式的通道注意力实现方式,对模型的提高效果相似,而采用 共享网络对 种池化方式进行拟合得出的权值更加准确,这里 共享网络借鉴了卷积块注意模块(,)的思想,经过改进后的通道注意力模块如图 所示。表 通道注意力对比实验结果 算法参数量识别率 图 通道注意力模块 通道注意力模块如下()()()()()()()()式中:()为通道注意力模块输出;为输入特征图;为 操作;,均为 共享网络的权重。残差收缩网络残差收缩网络()是 等于 年提出的、对残差网络进行改进的网络。实质是在残差连接上嵌入了软阈值设置模块,在网络学习特征时,过滤掉无关信息,减少无关的参数量,具有较强的抗噪能力,单个残差收缩模块结构见图。图 残差收缩模块 其中:为软阈值设置模块的输入;为软阈值函第 卷电 光 与 控 制史宝岱等:基于混合注意力机制的 图像目标识别算法数的输出;为生成的权重。软阈值设置模块主要分为两步:首先由图 中橙色区域提取特征对应的阈值,再通过软阈值函数去除冗余特征。橙色区域借鉴了 等提出的通道注意力的实现方式,上文已做过详细分析。得到归一化权重之后,再与 之后的实数值相乘,就得到了阈值。之后通过软阈值函数把低于这个正阈值的输入数据置,大于阈值的输入数据朝着 的方向进行收缩,过滤掉大量的冗余参数,软阈值函数为 。()此网络最大的特点是可以根据不同的图片设置不同的阈值,实现阈值的自适应调整。针对这个特点,本文主干分支和软分支的主要模块都采用残差收缩网络。模型构造采用合适的注意力机制可以在消耗较少计算资源的情况下达到较好的识别结果。受成像机理影响,图像噪声较高,阻碍 图像目标识别准确度的提高,而残差收缩网络可以有效剔除噪声。为此,本文提出基于混合注意力的卷积神经网络,称为模型,结构见图。图 模型 结构图 模型 包含 个相同的基础模块和前、后期的处理模块:前期处理模块包含卷积层(,()、最大池化()和残差收缩模块;后期处理模块依次包含卷积层(,()和 个残差收缩模块;受残差注意力网络的启发,每个基础模块又分为主干分支和软分支。主干分支以残差收缩网络为基础进行构建,这样做有两个好处:)利用残差收缩网络自适应生成的阈值进行降噪,把高于阈值门限的特征置,而且 函数输出的权重在(,)之间,使得阈值不会太大,避免了把大部分特征置,这样不仅可以提高输入到输出的映射能力,又可以大幅度地减少参数量;)残差收缩网络采用的是文献中的 连接,可以保证原始信息不丢失,避免发生梯度弥散。软阈值函数降噪之后,再利用通道注意力模块对特征权重进行二次调整。由于卷积层本身就含有对空间区域的选择,所以不再额外附加空间注意力模块。软分支采用下采样和上采样相结合的方式来附加混合注意力,从通道和空间两个维度同时进行运算。下采样通过 组残差收缩网络和()完成,搜索全局特征的有效信息,该方法具有速度快、易实现等优点,再利用双线性插值和 个 卷积完成对特征的上采样,使软分支的特征图大小与主干分支的特征图大小相同,最后通过 函数将输出归一化到 之间,得到对应权重。主干分支输出的特征和软分支输出的权重通过点乘的方式实现端到端的训练。即便采用这种方式构建网络,个基础模块也很难完成 图像分类任务,而简单叠加深度又会导致梯度弥散的发生,故本文在基础网络中采用残差网络学习的方式,既可以防止在训练时出现的网络退化问题,也可以避免附加权重之后,对原始信息的破坏,每个基础模块的学习方式为()()()()式中:()为经过主干分支之后的输出;()为经过软分支之后的输出,即使软分支输出信息为,也不会对下一阶段的训练产生影响,增加了网络的容错率。至此,基础模块设置完毕。依然采用 数据集,对基础模块的数量进行仿真,基础模块的具体构成见图,实验结果见表。第 期图 基础模块结构图 表 基础模块数量对比实验结果 基础模块数量参数量识别率 基础模块数量参数量识别率 由表 可以看出,种情况参数量都不高,在数量为 时达到的效果最好,经过 个基础模块之后,用 卷积进行降维,再利用 个残差收缩模块中的阈值进行降噪,最后采用 函数进行分类,最终识别率达到了 。实验 数据集 数据集是美国利用合成孔径雷达对前苏联的静止军事车辆目标进行观测而形成的,自数据集发布以来,一直被用于 图像领域的相关研究。该雷达工作在 波段,分辨率为 ,采用 极化。该数据集包含一个推荐的训练集和测试集,有 类目标,像素为。其中训练集共有 幅图像,测试集共有 幅图像,该数据集 类目标的光学图像和合成孔径图像见图,以 类目标的平均识别率作为观测值。图 类军事目标的光学图像与 图像 图像预处理 图像相干斑噪声较高,但采用传统的滤波方式会增大计算量,而且也会造成一部分特征的损失,因此本文不对图像做去噪处理。数据扩充:将图像由 裁剪成,扩充为 倍,这样既增加了图像数量,又完整地保留了图像中的信息,每类目标中选取 幅用于训练,幅用于验证。训练细节)软件配置:实验采用安装了 的 框架,系统为,版本为 。硬件配置:显卡为,独显,为,内存。)初始学习率为 ,学习率衰减方式为指数衰减,参数设为 ;采用随机梯度下降法,动量参数设为;训练周期()设为,批量大小()设为。本文中,实验的图像预处理和训练细节均采用同一种方式。实验对比和分析 代表数据集被完整训练的次数,合适的训练次数对模型的拟合收敛具有重要意义,尤其是数据过大时,一个 不足以更新权重,而当参数值过大时,还会发生过拟合,本文对 分别为,和 进行仿真,结果见表。表 训练周期对比实验 训练周期识别率 经过实验,设为,最终识别率达到,识别结果对比见表,可见本文提出的通道注意力和混合注意力相结合的方式确实提高了信息的流动,在保证识别准确率的同时,缩短训练时间至。表 不同算法识别结果对比 模型识别率 训练时间 模型 模型鲁棒性测试针对 数据集,本文提出的网络在识别率和实时性都达到了一个较高的水平,但要实际应用,还需进行鲁棒性研究。传统的滤波去噪声方式会增加很大一部分计算第 卷电 光 与 控 制史宝岱等:基于混合注意力机制的 图像目标识别算法量,本文所提模型可以在分类过程中进行降噪,下面对降噪效果进行仿真,选取数据集中,和 共 类目标对其添加椒盐噪声进行实验。该噪声在数字图像中比较常见,一般由图像分割引起,表现为黑白相间的亮暗点。本文实验把亮点像素值设为,暗点像素值设为,二者等概率出现,加噪比例分别设为,和。对 图像进行加噪处理后,可明显看出,目标信号受到大量干扰,保持数据预处理和训练细节不变,本文实验用模型,和 共 种算法对加噪之后的图像进行识别,识别结果见表。表 椒盐噪声识别率 模型加噪比例模型 由表 可以看出,本文提出的模型 鲁棒性较强,当椒盐噪声比例达到 时,依然可以达到 以上的识别率。结语本文针对相关算法精度不高且训练时间长等问题,提出了一种基于混合注意力的卷积神经网络算法,主干分支添加通道注意力,强化了特征的流动,软分支利用混合注意力机制给主干分支附加合适的权重。数据集中的实验显示:与其他算法相比,本文模型取得了较高的识别率,训练时间也较短,而且本模型对椒盐噪声的克制达到了相当的水平。下一步将继续进行注意力机制的研究,并开发出一种效率更高的 图像分类模型。参 考 文 献张红,王超,张波,等 高分辨率 图像目标识别 北京:科学出版社,邵嘉琪,曲长文,李健伟,等 基于 的不平衡 图像舰船目标识别 电光与控制,():任硕良,索继东,佟禹 卷积神经网络结合迁移学习的 目标识别 电光与控制,():邵嘉琦,曲长文,李健伟 卷积神经网络对 目标识别性能分析 雷达科学与技术,():():():():():():():():():():韩春明,郭华东,王长林 图像斑点噪声抑制的本质 遥感学报,():陈永生,喻玲娟