第49卷第2期2023年2月ComputerEngineering计算机工程基于场景对象注意与深度图融合的深度估计温静,杨洁(山西大学计算机与信息技术学院,太原030006)摘要:现有单目深度估计算法主要从单幅图像中获取立体信息,存在相邻深度边缘细节模糊、明显的对象缺失问题。提出一种基于场景对象注意机制与加权深度图融合的单目深度估计算法。通过特征矩阵相乘的方式计算特征图任意两个位置之间的相似特征向量,以快速捕获长距离依赖关系,增强用于估计相似深度区域的上下文信息,从而解决自然场景中对象深度信息不完整的问题。基于多尺度特征图融合的优点,设计加权深度图融合模块,为具有不同深度信息的多视觉粒度的深度图赋予不同的权值并进行融合,融合后的深度图包含深度信息和丰富的场景对象信息,有效地解决细节模糊问题。在KITTI数据集上的实验结果表明,该算法对目标图像预估时σ<1.25的准确率为0.879,绝对相对误差、平方相对误差和对数均方根误差分别为0.110、0.765和0.185,预测得到的深度图具有更加完整的场景对象轮廓和精确的深度信息。关键词:场景对象注意;加权深度图融合;上下文信息;深度估计;三维重建开放科学(资源服务)标志码(OSID):中文引用格式:温静,杨洁.基于场景对象注意与深度图融合的深度估计[J].计算机工程,2023,49(2):222-230.英文引用格式:WENJ,YANGJ.Depthestimationbasedonsceneobjectattentionanddepthmapfusion[J].ComputerEngineering,2023,49(2):222-230.DepthEstimationBasedonSceneObjectAttentionandDepthMapFusionWENJing,YANGJie(SchoolofComputerandInformationTechnology,ShanxiUniversity,Taiyuan030006,China)【Abstract】Theexistingmonoculardepthestimationalgorithmmainlyobtainsstereoinformationfromasingleimage.Thisapproachleadstoblurreddetailsofadjacentdepthedgesandapparentmissingobjects.Amonoculardepthestimationalgorithmbasedonsceneobjectattentionmechanismandweighteddepthmapfusionisproposed.Thesimilarityfeaturevectorbetweenanytwopositionsoffeaturemapiscalculatedbymultiplyingthefeaturematrixtorapidlycapturethelong-distancedependencyrelationship.Thedependencybetweenanytwopositionsintheimagecanenhancethecontextinformationusedtoestimatethesimilardeptharea,thus,solvingtheincompleteobjectdepthinformationinthenaturalscene.B...