北大中文核心期刊国外电子测量技术DOI:10.19652/j.cnki.femt.2204252融合通道与位置信息的ResNet细粒度图像识别*齐爱玲王宣淋(西安科技大学计算机科学与技术学院西安710054)摘要:在细粒度视觉识别(FGVR)领域,由于高度近似的类别之间差异细微,因此图像细微特征的精确提取对识别的准确率有着至关重要的影响。针对该问题,提出了融合通道与位置信息的残差网络(ResNet)细粒度图像识别算法。首先,通过引入超轻量化空间与位置感知注意力模块(ULSLAM)改进的ResNet细粒度图像特征提取网络,提高了细粒度图像特征尺度丰富性与多样性且有效增强了上下文特征非线性依关系;其次,使用融合通道与位置信息特征学习网络,利用权重方差度量获得特征提取网络显著特征以馈送到识别器进行最终有效识别,而后通过抑制因子抑制显著特征用于下阶段特征提取网络对细微特征进行提取。实验结果表明,该算法在数据集CUB-200-211上达到89.60%的top1准确率、98.65%的top5准确率;在数据集StanfordCars上达到94.93%的top1准确率、98.93%的top5准确率;在FGVC-Aircraft数据集上达到93.80%的top1准确率、98.20%的top5准确率。关键词:细粒度识别;细微特征提取;空间注意组件;抑制因子;显著特征中图分类号:TN2文献标识码:A国家标准学科分类代码:520.604ResNetfine-grainedimageidentificationwithfusedchannelandlocationinformationQiAilingWangXuanlin(SchoolofComputerScienceandTechnology,Xi′anUniversityofScienceandTechnology,Xi′an710054,China)Abstract:Inthefieldoffine-grainedvisualrecognition(FGVR),duetothesubtledifferencesbetweenhighlysimilarcategories,theaccurateextractionofimagefinefeatureshasacrucialimpactontheaccuracyofrecogniti...