YOLOX
IM_
一种
无人
量化
交通
参数
提取
模型
刘军黎
北大中文核心期刊国外电子测量技术 D O I:1 0.1 9 6 5 2/j.c n k i.f e m t.2 2 0 4 4 4 1Y O L O X-I M:一种无人机航拍视频的轻量化交通参数提取模型*刘军黎 刘晓锋 邱 洁 衣雨玮(天津职业技术师范大学汽车与交通学院 天津 3 0 0 2 2 2)摘 要:在无人机航拍的过程中,背景更广阔,目标的尺寸更小,种类更复杂。提出一种基于YO L O X-s的轻量化无人机航拍目标检测算法YO L OX-I M。首先,为了提高该模型检测小目标的性能,通过使用切片辅助推理(s l i c i n g a i d e d h y p e r i n f e r e n c e,S AH I)算法以及坐标修正矩阵对训练集进行预处理和数据增强。然后,在路径聚合网络(p a t h a g g r e g a t i o n n e t w o r k,P AN)中引入一个浅层特征图以及超轻量级子空间注意模块,并添加一个检测头对小物体进行检测;最后,对边界回归的损失函数进行了优化。在V i s D r o n e 2 0 1 9数据集的消融实验结果表明,所提出的模型检测精度与基础YO L O X-s相比高了8.1 3%;模型体积4.5 5 MB,相较于原模型下降6 7.1 4%。利用该模型在中国天津市渌水道进行实地交通监测的交通参数提取实验,在设定的场景中,当无人机航拍高度为5 0 m时,该模型的交通提取参数精度最高,达到9 6.1 4%。关键词:无人机;车辆检测与跟踪;YO L O X模型;深度学习中图分类号:T P 3 9 1文献标识码:A国家标准学科分类代码:5 2 0.6 0 4Y O L O X-I M:A l i g h t w e i g h t t r a f f i c p a r a m e t e r e x t r a c t i o n m o d e l f o r U A V a e r i a l i m a g e sL i u J u n l i L i u X i a o f e n g Q i u J i e Y i Y u w e i(S c h o o l o f A u t o m o t i v e a n d T r a n s p o r t a t i o n,T i a n j i n U n i v e r s i t y o f T e c h n o l o g y a n d E d u c a t i o n,T i a n j i n 3 0 0 2 2 2,C h i n a)A b s t r a c t:I n t h e p r o c e s s o f UAV a e r i a l p h o t o g r a p h y,t h e b a c k g r o u n d i s b r o a d e r a n d t h e t a r g e t s a r e s m a l l e r i n s i z e.I n t h i s p a p e r,w e p r o p o s e a l i g h t w e i g h t t a r g e t d e t e c t i o n a l g o r i t h m YO L O X-I M f o r UAV a e r i a l p h o t o g r a p h y b a s e d o n YO L O X-s.F i r s t,t o i m p r o v e t h e p e r f o r m a n c e o f s m a l l t a r g e t d e c e c t i o n,t h e t r a i n i n g s e t i s p r e p r o c e s s e d a n d d a t a i s e n h a n c e d b y u s i n g a s l i c i n g a i d e d h y p e r i n f e r e n c e(S AH I)a l g o r i t h m a s w e l l a s a c o o r d i n a t e c o r r e c t i o n m a t r i x.T h e n,a s h a l l o w f e a t u r e m a p a s w e l l a s a n u l t r a-l i g h t w e i g h t s u b s p a c e a t t e n t i o n m o d u l e a r e i n t r o d u c e d i n t h e p a t h a g g r e g a t i o n n e t w o r k(P AN),a n d a d e t e c t i o n h e a d i s a d d e d f o r s m a l l o b j e c t d e t e c t i o n.F i n a l l y,t h e l o s s f u n c t i o n o f t h e b o u n d a r y r e g r e s s i o n i s o p t i m i z e d.T h e e x p e r i m e n t a l r e s u l t s o n t h e V i s D r o n e 2 0 1 9 d a t a s e t s h o w t h a t t h e p r o p o s e d m o d e l h a s 8.1 3%h i g h e r d e t e c t i o n a c c u r a c y c o m p a r e d w i t h t h e YO L O X-s;c o m p a r e d w i t h t h e o r i g i n a l m o d e l,t h e m o d e l v o l u m e i s s i g n i f i c a n t l y r e d u c e d t o 4.5 5 MB,w h i c h i s 6 7.1 4%l o w e r t h a n t h e o r i g i n a l m o d e l.N e x t,t h e m o d e l i s u s e d t o c o n d u c t t r a f f i c p a r a m e t e r e x t r a c t i o n f o r f i e l d t r a f f i c m o n i t o r i n g i n T i a n j i n,L u s h u i r o a d,C h i n a.T h e s t u d y i n d i c a t e s t h a t t h e m o d e l h a s t h e h i g h e s t t r a f f i c e x t r a c t i o n p a r a m e t e r a c c u r a c y o f 9 6.1 4%a t t h e UAV a l t i t u d e o f 5 0 m.K e y w o r d s:u n m a n n e d a e r i a l v e h i c l e;v e h i c l e d e t e c t i o n a n d t r a c k i n g;YO L O X m o d e l;d e e p l e a r n i n g 收稿日期:2 0 2 2-1 0-2 5*基金项目:天津市智能交通技术创新团队重点培养专项(X C 2 0 2 0 2 8)、天津市科技计划(2 2 Y D T P J C 0 0 1 2 0)、天津市高等学校科技发展基金(2 0 2 1 K J 0 1 8)项目资助0 引 言近年来,随着无人机的续航能力、悬停性能、云台平稳性的显著提升,以及高精度定位、高带宽、低延时通信技术的使用,很多学者开展了基于无人机视频的目标检测技术研究。W a n g等1采用一致性目标跟踪、运动背景处理,以951 国外电子测量技术北大中文核心期刊及神经网络目标检测等手段,从无人机视频中进行车辆检测。C h e n等2开发了一个集成检测器来检测目标区域内的车辆,然后采用核化相关滤波器,从无人机视频中跟踪车辆。但在无人机航拍的过程中,视频背景更广阔,且处于动态的变化过程当中,导致传统的视频运动目标检测算法难以适用。深度学习算法具有强大的特征提取能力,可以通过目标结构、色彩等视觉特征描述检测目标,而不依赖于目标运动信息进行目标检测,因此适用于无人机视频的目标检测与跟踪研究,从而实现交通事故的判别。目前,常用的深度学习目标检测算法分为两类,基于感兴趣区域(r e g i o n o f i n t e r e s t,RO I)的方法和基于回归的方法。基于感兴趣区域的方法将目标检测分为提取RO I、进行目标检测分类两个阶段,有代表性的算法有M a s k R-C NN3、F a s t R-C NN4、F a s t e r R-C NN5等。这些双阶段检测算法的优点是目标检测平均精度高、错检率和漏检率低,但也存在着推理时间长、计算量大的缺点,难以达到实时性要求。基于回归的方法又称为单阶段检测算法,以YO L O6、YO L O 9 0 0 07、S S D8、YO L O v 39、YO L O v 41 0、YO L O v 5为代表。YO L O算法不需要提取感兴趣位置,而是直接获得目标位置和类别。具有检测速度快、模型复杂度低等优点,能够满足实时检测的需求。L i u等1 1提出了路径聚合网络(p a t h a g g r e g a t i o n n e t w o r k,P AN),利用低级特征的空间信息进一步提高对小目标的检测性能。彭继慎等1 2在YO L O网络中实现了模型压缩。李仁鹰等1 3在YO L O网络中实现了轻量化处理。E t t e n等1 4提出了一种基于YO L O v 2的卫星图像多尺度目标检测的方法,其使用了一个密集的预测网格来提高网络对密集的小物体的分类能力,并且使用了矩阵旋转和数据增强处理对象方向的多样性。化嫣然等1 5采用YO L O v 3深度学习模型,提出了一种针对遥感图像中的大中型尺寸目标检测的优化YO L O v 3-T i n y算法,但是其对遥感图像中的小目标检测精度有待提高。T a n等1 6基于YO L O v 4深度学习模型,设计了空间注意力机制,提高了车辆的检测精度,但是对小目标、有阴影遮挡的车辆检测时漏检率较高。当前无人机航拍在交通监测领域主要面临如下难题:1)航拍背景下的小目标都处于运动状态,且运动偏移明显,小目标检测难度大。传统目标检测算法都针对中大目标进行建模设计,并且模型体积偏大,收敛速度较慢,对小目标的检测存在漏洞。2)绝大部分算法都是基于公共数据集进行仿真改良,存在以优良结果为导向的过度优化问题。并没有进行实地的交通监测实际应用去检验算法在真实环境下的目标检测能力以及交通参数提取能力。为了解决上述问题,本文提出一种无人机航拍视频的轻量化交通参数提取模型YO L O X-I M。对于航拍图像复杂的背景问题,在P AN中加入了超轻量级子空间注意模块(u l t r a-l i g h t w e i g h t s u b s p a c e a t t e n-t i o n m o d u l e,U L S AM),特别突出了物体的特征,削弱了背景信息。对于无人机航空图像中大量小目标的问题,首先利用切 片 辅