北大中文核心期刊国外电子测量技术DOI:10.19652/j.cnki.femt.2204394融合注意力和多尺度的优化立体匹配算法研究*谢鑫张博张美灵朱磊(西安工程大学电子信息学院西安710048)摘要:当前基于卷积神经网络的立体匹配方法未充分利用图像中各个层级的特征图信息,造成图像在不适定区域的特征提取能力较差,因此,提出了一种基于PSMNet改进的优化立体匹配算法。在特征提取阶段,全新的特征金字塔模块(SPP)能更好的聚合不同尺度和不同位置的环境信息构建代价体,从而充分利用全局环境信息;在构建匹配代价体时,提出组相关的策略来充分地利用特征中的全局和局部信息;在代价聚合阶段,优化沙漏结构并引入通道注意力机制以便网络来提取具有高表示能力和高质量通道注意力向量的信息特征;为了进一步优化视差图,设计视差优化网络来改善初始的视差估计。在SceneFlow、KITTI2012和KITTI2015立体数据集上评估,所提模型在SceneFlow数据集上平均预测误差EPE降低到0.71pix-els,在KITTI2012和KITTI2015立体数据集上的误匹配率分别下降到1.20%和1.86%,在实验结果表明,方法取得了较优越的性能。关键词:立体匹配;深度学习;注意力机制;卷积神经网络;分组相关量;视差优化中图分类号:TP391文献标识码:A国家标准学科分类代码:510.70Researchonoptimalstereomatchingalgorithmcombiningattentionandmulti-scaleXieXinZhangBoZhangMeilingZhuLei(SchoolofElectronicsandInformation,Xi'anPolytechnicUniversity,Xi'an710048,China)Abstract:ThispaperpresentsanimprovedstereomatchingalgorithmbasedonPSMNet.Inthefeatureextractionstage,thenewSPPfeaturepyramidmodulecanbetteraggregatetheenvironmentalinformationofdifferentscalesanddifferentlocationstoconstructcostvolume,inordertomakefulluseoftheglobalenvironmentalinformation.Whenconstructingthematchingcostvolume,thegroupcorrelationstrategyisproposedtomakefulluseoftheglobalandlocalinformationinfeatures.Inthecostaggregationstage,thehourglassstructureisoptimizedandthechannelattentionmechanismisintroducedsothatthenetworkcanextracttheinformationfeatureswithhighrepresentationabilityandhighqualitychannelattentionvector.Inordertofurtheroptimizethedisparitymap,adisparityoptimizationnetworkisdesignedtoimprovetheinitialdisparityestimation.ThemethodinthispaperisevaluatedonSceneFlow,KIT...