分享
基于密集编码标签的遥感图像旋转目标检测算法_王彦雅.pdf
下载文档

ID:2253582

大小:1.39MB

页数:7页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 密集 编码 标签 遥感 图像 旋转 目标 检测 算法 王彦雅
第4 0卷第1期2 0 2 3年2月河 北 省 科 学 院 学 报J o u r n a l o f t h e H e b e i A c a d e m y o f S c i e n c e sV o l.4 0 N o.1F e b.2 0 2 3收稿日期:2 0 2 2-1 0-1 0基金项目:河北省高等学校科学研究计划项目(QN 2 0 2 2 0 6 1)作者简介:王彦雅(1 9 9 7-),男,河北廊坊人,硕士研究生,研究方向:深度学习、目标检测.文章编号:1 0 0 1-9 3 8 3(2 0 2 3)0 1-0 0 0 1-0 6基于密集编码标签的遥感图像旋转目标检测算法王彦雅,李卫东,张伟娜(河北经贸大学信息技术学院,河北 石家庄 0 5 0 0 6 1)摘 要:针对现有目标检测算法在遥感图像中检测精度低,容易漏检等问题,提出了一种遥感图像旋转目标检测算法,使用YO L O v 5 m作为基本框架。首先,使用环形平滑标签C S L(C i r c u l a r S m o o t h L a b e l,C S L)将角度回归预测转变为角度分类预测,解决回归预测中的角度周期性和边界可交换性的问题,提升检测精度。其次,使用密集编码标签(D e n s e l y C o d e d L a b e l,D C L)替换稀疏编码标签,大幅减少预测层厚度,提升训练速度。实验表明,使用改进后的算法较基准算法mA P提升4.8 8%,模型训练速度与原模型速度基本相同,证明了算法的有效性。关键词:旋转目标检测;遥感图像;环形平滑标签;密集编码标签中图分类号:T P 3 9 1.4 文献标识码:AR o t a t i n g t a r g e t d e t e c t i o n a l g o r i t h m i n r e m o t e s e n s i n g i m a g e b a s e d o n d e n s e l y c o d e d l a b e lWA N G Y a n-y a,L I W e i-d o n g,Z H A N G W e i-n a(C o l l e g e o f I n f o r m a t i o n T e c h n o l o g y,H e b e i U n i v e r s i t y o f E c o n o m i c s a n d B u s i n e s s,S h i j i a z h u a n g H e b e i 0 5 0 0 6 1,C h i n a)A b s t r a c t:A i m i n g a t t h e p r o b l e m s o f l o w d e t e c t i o n a c c u r a c y a n d e a s y t o m i s s d e t e c t i o n o f e x i s t i n g t a r g e t d e t e c t i o n a l g o r i t h m s i n r e m o t e s e n s i n g i m a g e s,a r e m o t e s e n s i n g i m a g e r o t a t i o n t a r g e t d e t e c t i o n a l g o r i t h m i s p r o p o s e d,u s i n g YO L O v 5 m a s t h e b a s i c f r a m e w o r k.F i r s t l y,t h e c i r c u l a r s m o o t h l a b e l i s u s e d t o t r a n s f o r m t h e a n g l e r e g r e s s i o n p r e d i c t i o n i n t o a n g l e c l a s s i f i c a t i o n p r e d i c t i o n,i n o r d e r t o s o l v e t h e p r o b l e m o f a n g l e p e r i o d i c i t y a n d b o u n d a r y i n t e r c h a n g e a b i l i t y i n t h e r e g r e s s i o n p r e d i c t i o n a n d i m p r o v e t h e d e t e c t i o n a c c u r a c y.S e c o n d l y,d e n s e l y c o d e d l a b e l i s u s e d t o r e p l a c e s p a r s e c o d i n g l a b e l,w h i c h g r e a t l y r e d u c e s t h e t h i c k n e s s o f p r e d i c t i o n l a y e r a n d i m p r o v e t r a i n i n g s p e e d.T h e e x p e r i m e n t s h o w s t h a t t h e i m p r o v e d a l g o r i t h m i s 4.8 8%h i g h e r t h a n t h e b e n c h m a r k a l g o r i t h m mA P,a n d t h e m o d e l t r a i n i n g s p e e d i s b a s i c a l l y t h e s a m e a s t h e o r i g i n a l m o d e l s p e e d,w h i c h p r o v e s t h e e f f e c t i v e n e s s o f t h e a l g o r i t h m.DOI:10.16191/ki.hbkx.2023.01.010河北省科学院学报2 0 2 3年第4 0卷K e y w o r d s:R o t a t i n g t a r g e t d e t e c t i o n;R e m o t e s e n s i n g i m a g e s;C i r c u l a r s m o o t h l a b e l;D e n s e l y c o d e d l a b e l0 引言光学遥感图像是由空中飞行器或卫星对地面进行拍摄的一种俯视角度的图像。遥感图像在军事侦察、地形勘探、目标追踪和工业领域1,2等方面有着重要用途。遥感图像目标检测的对象通常是轮船、汽车、港口和桥梁等差异较大的目标,由于其特殊的俯视视角以及远距离拍摄的原因,图中的目标往往呈现的是物体的顶部样貌,与日常生活的图像差异较大,且有着物体小、分布密集和方向性明显的特点。目前的目标检测算法以检测日常生活中的图片为主,普遍使用水平锚框检测,如S S D3,YO L O4-7系列算法,效果普遍较好。遥感图像是以俯视角度拍摄,目标通常分布较为密集,具有较大的长宽比,并且方向性较为明显。如果使用水平锚框进行标注、训练和检测,会存在较多问题。对于长宽比较大且具有一定角度的目标,标注的背景面积有可能大于真实值的面积,而过多的背景被认为是真实值进行训练,会导致模型精度低且难以收敛。对于长宽比较大,具有一定角度且目标密集的图片,标注框重合严重,一个目标的标注框中甚至可能存在多个其他目标,严重影响模型的学习效率。目标种类多、尺度相差大且方向性明显。针对以上存在的问题,本文以YO L O v 5 m为基础框架,进行以下改进:(1)使用C S L8解决边界可交换性(E x c h a n g e a b i l i t y o f E d g e s,E o E)和角度周期性(P e r i o d i c i t y o f A n-g u l a r,P o A)9问题,将角度预测从回归问题转化为分类问题,提升检测精度。(2)针对C S L预测头厚重的问题,使用D C L1 0替换稀疏编码标签,使训练时间减少,并提升一定的检测精度。1 算法介绍1.1 Y O L O v 5算法介绍YO L O v 5算法由四部分组成。预测图像首先会被预处理成6 4 06 4 0或1 0 2 41 0 2 4大小,超出部分会被压缩,空白部分会被填充。其次,B a c k b o n e部分使用C S P D a r k n e t网络进行特征提取,其中包括F o c u s、C B S(C o n v o l u t i o n-B a t c h N o r m a l i z a t i o n-S i L U)、R e s u n i t、C S P和S P P(S p a t i a l P y r a m i d P o o l i n g)模块。F o c u s是将输入图像进行切片操作,将图片平均切割成四份,宽度与高度变为二分之一,再将切割好的图像进行通道维度拼接,增加通道维度的同时减小空间维度,以减少计算量。C B S是由卷积、批量归一化和S i L U激活函数组成。R e s u n i t 借鉴残差网络的思想,可以使模型维度更深。C S P在B a c k b o n e和N e c k部分分为C S P 1和C S P 2两种结构,C S P 1主要由残差块和C S B组成,C S P 2将残差块换成了C B S结构。S P P通过三次最大池化操作将任意大小的特征图输出固定维度。然后,输出的三种特征图会使用路径聚合网络进行特征融合,最后输出三种尺寸的预测头,如图1所示。1.2 角度回归定义法常见的旋转框定义法包括五参数定义法(x,y,w,h,)和八参数定义法(x1,y1,x2,y2,x3,y3,x4,y4)。其中五参数定义法包括O p e n C V表示法和长边表示法。(1)O p e n C V表示法将x轴逆时针旋转碰到的第一条线定义为w,另一条线为h,角度为x轴碰到w时旋转的角度,区间范围是-2,0),(x,y)是矩形中心点坐标,如图2(a)所示。(2)长边表示法与O p e n C V大致相同,(x,y)表示矩形中心点坐标,角度为x轴与矩形的长边所形成的夹角,区间范围是-2,2),如图2(b)所示。2第1期王彦雅等:基于密集编码标签的遥感图像旋转目标检测算法图1 Y O L O v 5算法框架(3)有序四边形表示法比较直观,设四边形在最小外接矩形左侧边上的点为起始点,顺时针绕矩形框表示其余点,则表示矩形的四个点的坐标依次为(x1,y1),(x2,y2),(x3,y3),(x4,y4),如图2(c)所示。hw(x,y)(x4,y4)-,)x-axis(x,y)(x,y)(x,y)hw(x,y)-,)x-axishw(x,y)-,)x-axishw(x,y)-,0)x-axis(c)有序四边形表示法(b)长边表示法(a)OpenCV表示法图2 旋转框定义法上述三种方法是最早应用于旋转目标检测的回归方法,但使用回归方法的角度预测存在着P o A和E o E的问题,导致回归时函数损失非常大。1.3 引入C S L本文使用C S L将原本的角度回归预测问题转化为分类问题。g(x)表示窗口函数,可使用具有周期性、单调性、对称性、最大值的函数作为窗口函数,使用高斯函数作为窗口函数,见公式(1)和公式(2),r为窗口半径。标签表示方法使用五参数定义法(x,y,w,h,),将角度分为1 8 0个类,可以解决E o E问题

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开