基于Transformer的多尺度物体检测.pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 6.57 MB
约6页
2023-08-20
收藏
评论
点赞(0)
海报
举报

2023年第37卷第4期测试技术学报Vol.37No.42023(总第160期)JOURNALOFTESTANDMEASUREMENTTECHNOLOGY(SumNo.160)文章编号:1671-7449(2023)04-0342-06基于Transformer的多尺度物体检测①侯越千,张丽红(山西大学物理电子工程学院,山西太原030006)摘要:目前,Transformer基本模型对同一场景内不同尺寸物体的检测能力不足,其主要原因为各层等尺度的输入嵌入无法提取跨尺度特征,导致网络不具备在不同尺度的特征之间建立交互的能力。基于此,提出一种基于Transformer的多尺度物体检测网络,该网络采用跨尺度嵌入层初步对图像特征进行嵌入处理;利用多分支空洞卷积对输入进行下采样,通过调整并行分支的膨胀率使该结构具有多样的感受野;然后,由残差自注意力模块对输出嵌入结果进行处理,为特征图的局部和全局信息构建联系,使注意力计算融入有效的多尺度语义信息,最终实现多尺度物体检测。模型在COCO等数据集上进行训练,实验结果表明该方法与其他物体检测方法相比具有显著优势。关键词:物体检测;多尺度;Transformer;注意力机制;空洞卷积中图分类号:TP391.4文献标识码:Adoi:10.3969/j.issn.1671-7449.2023.04.011Multi-ScaleObjectDetectionBasedonTransformerHOUYueqian,ZHANGLihong(CollegeofPhysicalandElectronicEngineering,ShanxiUniversity,Taiyuan030006,China)Abstract:ThecurrentTransformerbasicmodelisinadequatefordetectingobjectsofdifferentsizeswithinthesamescene.Themainreasonforthisisthattheequal-scaleinputembeddingofeachlayercannotextractcross-scalefeatures,resultinginanetworkthatdoesnothavetheabilitytoestablishin-teractionsbetweenfeaturesofdifferentscales.Inthispaper,weproposeaTransformer-basedmulti-scaleobjectdetectionnetwork,whichusescross-scaleembeddinglayerstoinitiallyembedimagefea-tures,inwhichtheinputisdownsampledusingmulti-branchnullconvolution,andthestructureismadetohavediversesensoryfieldsbyadjustingtheexpansionrateofparallelbranches.Theoutputembed-dingresultsarethenprocessedbytheresidualself-attentionmoduletoconstructlinksforlocalandglob-alinformationofthefeaturemap,sothattheattentioncalculationincorporateseffectivemulti-scalese-manticinformationandfinallyachievesmulti-scaleobjectdetection.ThemodelsaretrainedondatasetssuchasCOCO,andtheexperimentalresultssho...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容