分享
嵌入注意力机制的卷积神经网络水声目标识别_张钇.pdf
下载文档

ID:2325228

大小:2.20MB

页数:8页

格式:PDF

时间:2023-05-07

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
嵌入 注意力 机制 卷积 神经网络 目标 识别
第 41 卷第 6 期2022 年 12 月Vol.41,No.6Dec.,2022声学技术Technical Acoustics嵌入注意力机制的卷积神经网络水声目标识别张 钇1,3,熊水东2,3,马燕新2,3,姚 琼2,3,王付印2,3,郭 微2,3,朱家华2,3(1.国防科技大学前沿交叉学科学院,湖南长沙 410073;2.国防科技大学气象海洋学院,湖南长沙 410073;3.海洋探测技术湖南省重点实验室,湖南长沙 410073)摘要:针对低信噪比水声目标单一特征识别率低,稳健性差的问题,提出一种基于注意力机制和多尺度残差卷积神经网络(Multi-scale Residual CNN with Attention,MR-CNN-A)进行特征融合的识别方法。该方法根据多尺度卷积核与特征图形成多分辨率分析关系,并以此通过注意力机制实现优势特征权值提取与融合,从而提高模型在文中水声数据集上提取目标噪声特征和分类识别的稳健性与抗噪能力。开展了4类舰船噪声和海洋环境噪声的识别试验、水下和水面自主式水下航行器的识别试验,以及不同信噪比条件下目标噪声的识别试验。结果表明:对于文中所涉及的水声目标噪声和人工高斯白噪声干扰,该网络模型识别正确率明显高于支持矢量机与简单卷积神经网络,且对高斯白噪声的抑制能力远强于支持矢量机与简单卷积神经网络,稳健性好,模型复杂度小。关键词:水声目标识别;注意力机制;多尺度残差;卷积神经网络;特征融合;低信噪比;稳健;自主式水下航行器中图分类号:TN911.7 文献标志码:A 文章编号:1000-3630(2022)-06-0796-08Underwater target recognition by CNN with attention mechanismZHANG Yi1,3,XIONG Shuidong2,3,MA Yanxin2,3,YAO Qiong2,3,WANG Fuyin2,3,GUO Wei2,3,ZHU Jiahua2,3(1.College of Advanced Interdisciplinary Studies,National University of Defense Technology,Changsha 410073,Hunan,China;2.College of Meteorology and Oceanology,National University of Defense Technology,Changsha 410073,Hunan,China;3.Hunan Key Laboratory for Marine Detection Technology,Changsha 410073,Hunan,China)Abstract:Because of low recognition rate and poor robustness to a single feature of underwater acoustic target with low signal to noise ratio(SNR),a feature fusion recognition method based on attention mechanism and multi-scale residual convolution neural network(named MR-CNN-A network)is proposed.According to the multi-resolution analysis relationship formed by multi-scale convolution kernel and feature map,and by using the attention mechanism to extract and fuse the dominant feature weights,this method can enhance the robustness and noise immunity of the model on the underwater acoustic data set.Four types of ship noises and the marine ambient noise recognition tests,underwater and surface autonomous underwater vehicle(AUV)recognition tests,and the recognition tests of target noises under different signal to noise ratios are carried out.The results show that:for the interferences of underwater acoustic target noise and artificial Gaussian white noise involved in this paper,the recognition accuracy of the network model is obviously higher than that of support vector machine and simple convolutional neural network.The model is more powerful in suppressing Gaussian white noise than support vector machine and simple convolutional neural network,and has good robustness and low complexity.Key words:underwater acoustic target recognition;attention mechanism;multiscale residuals;convolutional neural network;feature fusion;autonomous underwater vehicle(AUV)0引 言本水声目标识别作为现代化海洋作战或探测的重要手段,主要包括基于传统方法与基于深度学习两种方法。基于传统的识别方法是目前常规所用的,关键在于特征提取与分类器设计。特征提取主要包括时频特征-时频图、听觉特征-Mel倒谱特征(Mel Frequency Cepstrum Coefficents,MFCC)等1-2,分类器则多采用浅层分类器,如支持矢量机(Support Vector Machine,SVM)分类器等3。但传统方法中的特征提取很大程度上依赖于设计者的经验,适用范围有限。与之不同,基于深度学习的识别方法则是数据驱动的,不依赖于任何先验信息,推广性引用格式:张钇,熊水东,马燕新,等.嵌入注意力机制的卷积神经网络水声目标识别J.声学技术,2022,41(6):796-803.ZHANG Yi,XIONG Shuidong,MA Yanxin,et al.Underwater target recognition by CNN with attention mechanismJ.Technical Acoustics,2022,41(6):796-803.DOI:10.16300/ki.1000-3630.2022.06.002收稿日期:2021-04-15;修回日期:2021-06-08基金项目:国防科技大学科研计划项目(ZK20-39,ZK20-35)、国家自然科学基金(62001490)、173 计划项目(2019-JCJQ-ZD026-00)。作者简介:张钇(1997),男,贵州遵义人,硕士研究生,研究方向为水声目标识别。通信作者:马燕新,E-mail:第 6 期张钇等:嵌入注意力机制的卷积神经网络水声目标识别较好。且与手工设计特征相比,深度学习特征包含更高阶项,是具有隐性关系的深层次特征,更能较好地拟合目标信息。目前,关于深度学习水声目标识别方面的研究公开报道较少,研究尚处于起步阶段4-7。如Ferguson等5实现倒谱特征与卷积神经网络(Convolutional Neural Network,CNN)结合识别,取得较高的识别率。为提高识别精度,Yang等8设计了端到端网络-听觉感知深度卷积神经网络,通过多尺度卷积层,将原始时域信号分解为不同频率分量的信号。实验结果表明,该模型能够有效地对舰船辐射噪声信号进行分解、建模和分类。但因直接对一维水声信号进行操作,导致模型复杂,计算量大。Wang等9提出修正的经验模态分解,提取伽玛通频率倒谱 系 数(Gammatone Frequency Cepstral Coecient,GFCC)多维特征,并设计一种降维方法来获取原始水声信号的多维融合特征,最后使用高斯混合模型来修改深度神经网络的结构,减少冗余特征并进一步提高识别精度。但该方法需经800次迭代,才能获得94.3%的识别率,模型复杂。Jiang等10为解决声信号经常被强环境噪声淹没问题,提出水声目标多尺度谱特征提取方法。但该特征均为人工设计,是基于明确物理意义的,如谱峰形心等,较难拟合更高阶信息,具有较大局限性。海洋中目标噪声一般是多声源、多途叠加型复杂声场11-12。水中目标噪声的谱图和听觉特性,携带着目标重要的“声纹”特征,是检测和分类识别该目标的重要依据。水中目标噪声经多径色散海洋信道传输,接收到的目标噪声信号幅度随距离衰减,且产生幅度和相位的起伏、频移和频率模糊等,带有不确定性和非平稳性,在海洋环境噪声干扰背景下,信噪比(Signal to Noise Ratio,SNR)低,尤其远程目标的信噪比更低,给目标检测和分类识别带来诸多困难。因此针对低信噪比的情况,单一特征难以较好地表征目标信息,难以实现较高识别率的问题,本文提出一种融合注意力机制和多尺度残差的卷积神经网络(Multi-scale Residual CNN with Attention,MR-CNN-A)。该网络主要包含多尺度特征提取模块与基于注意力机制的融合模块。其一,通过利用多尺度残差模块形成多分辨率分析,提取高稳健性特征。其二利用注意力机制融合模块突出优势特征进行融合,抑制高强度噪声,最后形成抗低信噪比、高稳健性的模型。首先利用Mel滤波器组对数据集中的声信号进行带通能量求取,最终获得目标的二维特征图。其次利用所设计的多尺度残差卷积模块提取二维多尺度特征,该网络包含三个具有不同卷积核大小的特征学习通道,实现不同分辨率特征的提取。最后将不同尺度特征输入注意力机制的融合模块进行特征融合,接着通过全连接层实现目标识别分类。1网络模型搭建本文提出的模型组成如图1所示,模型分为三部分:(1)MFCC特征提取模块,采用了听觉特征MFCC作为特征描述,因其具有抗低频噪声的性能,可以一定程度地抑制海洋环境噪声突出目标信息。(2)多尺度特征提取模块,采用多尺度残差卷积神经网络实现。(3)加入注意力机制的融合识别模块,采用完全连接层作为分类器层,经过softmax处理后,输出与声信号对应的概率最大的类别标签,得到识别信息。1.1MFCC提取由于水声信号与语音信号具有较多的相似性,声呐兵也均是进行听音判型的,因此本文将语音信号处理的听觉特征提取方法应用于水声目标航行噪声特征前置提取。这里采用Mel倒谱系数MFCC提取11-12,MFCC具有抗低频噪声的性能,可以一定程度地抑制低频水下环境噪声来突出目标信息。MFCC算法具体的数学推导与分析可参考文献13-14,实现步骤如图2所示。图2中,预处理为加汉明窗处理,然后通过傅里叶变换求频谱,对频谱进行平方处理求信号的能量谱,再通过Mel滤波器滤波实现分解信号,最后将其顺序进行对数非线性变换和离散余弦变换即可得到MFCC特征。从提取流程上看,M

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开