基于
Yolo
ES
垃圾
分类
目标
检测
模型
范金豪
电 子 测 量 技 术E L E C T R ON I CME A S UR EME N TT E CHNO L OG Y第4 6卷 第1期2 0 2 3年1月 D O I:1 0.1 9 6 5 1/j.c n k i.e m t.2 2 1 0 1 2 3基于Y o l o_E S的垃圾分类目标检测模型*范金豪1,2 崔立志1,2(1.河南理工大学电气工程与自动化学院 焦作4 5 4 0 0 0;2.河南理工大学河南省煤矿装备智能检测与控制重点实验室 焦作4 5 4 0 0 0)摘 要:垃圾分类问题目前已被政府和社会广泛关注,面对分拣过程中对垃圾类别实时性和准确性判断的需求,提出了一种Y o l o_E S目标检测算法。该算法以Y o l o v 4为基础网络,首先使用E f f i c i e n t N e t作为主干特征提取网络,实现算法的轻量化;其次通过注意力机制E C A对MB C o n v模块进行重构,筛选出高质量的信息,增强模型的特征提取能力并降低了参数量;同时针对最大池化易丢失细节信息的问题,使用S o f t P o o l对S P P模块中的M a x P o o l层进行替换,保留更多细粒度特征信息。在自制的H P U_WA S T E垃圾分类数据集上进行实验,结果表明,Y o l o_E S模型相比于Y o l o v 4基础网络mA P从9 1.8 1%提升到了9 6.0 6%,模型大小压缩了7 5.4 5%同时每张图片处理时间为5 8 m s;与其他目标检测网络相比,该模型具有更好的鲁棒性和更佳检测性能。关键词:目标检测;Y o l o v 4;轻量化;注意力机制;S o f t P o o l中图分类号:T P 3 9 1.4 文献标识码:A 国家标准学科分类代码:5 2 0.6G a r b a g e c l a s s i f i c a t i o nt a r g e td e t e c t i o nm o d e l b a s e do nY o l o_E SF a nJ i n h a o1,2 C u iL i z h i1,2(1.S c h o o l o fE l e c t r i c a lE n g i n e e r i n ga n dA u t o m a t i o n,H e n a nP o l y t e c h n i cU n i v e r s i t y,J i a o z u o4 5 4 0 0 0,C h i n a;2.H e n a nK e yL a b o r a t o r yo f I n t e l l i g e n tD e t e c t i o na n dC o n t r o l o fC o a lM i n eE q u i p m e n t,H e n a nP o l y t e c h n i cU n i v e r s i t y,J i a o z u o4 5 4 0 0 0,C h i n a)A b s t r a c t:A tp r e s e n t,g a r b a g ec l a s s i f i c a t i o nh a sb e e nw i d e l yc o n c e r n e db yt h eg o v e r n m e n ta n ds o c i e t y.F a c i n gt h ed e m a n df o r r e a l-t i m ea n da c c u r a t e j u d g m e n to fw a s t ec l a s s i f i c a t i o ni nt h es o r t i n gp r o c e s s,aY o l o_E St a r g e td e t e c t i o na l g o r i t h m w a sp r o p o s e d.T h ea l g o r i t h m t a k e s Y o l o v 4a st h eb a s i cn e t w o r k.F i r s t l y,E f f i c i e n t N e ti su s e da st h eb a c k b o n e f e a t u r ee x t r a c t i o nn e t w o r kt or e a l i z et h el i g h t w e i g h to ft h ea l g o r i t h m;s e c o n d l y,t h e MB C o n v m o d u l ei sr e c o n s t r u c t e db y t h e a t t e n t i o nm e c h a n i s mE C At o f i l t e r o u t t h eh i g h-q u a l i t y i n f o r m a t i o n,e n h a n c e t h e f e a t u r e e x t r a c t i o na b i l i t yo f t h em o d e l a n dr e d u c e t h en u m b e ro fp a r a m e t e r s;a t t h es a m et i m e,a i m i n ga t t h ep r o b l e mt h a t i t i se a s yt ol o s ed e t a i l e d i n f o r m a t i o n i nt h em a x-p o o l i n g,t h eS o f t P o o l i su s e dt or e p l a c et h eM a x P o o l l a y e r i nt h eS P Pm o d u l et or e t a i nm o r e f i n e-g r a i n e df e a t u r e i n f o r m a t i o n.T h ee x p e r i m e n t sa r ec o n d u c t e do nt h es e l f-m a d eH P U_WA S T Eg a r b a g ec l a s s i f i c a t i o nd a t a s e t,a n d t h e r e s u l t s s h o wt h a t c o m p a r e dw i t h t h eY o l o v 4b a s i cn e t w o r k,Y o l o_E Sm o d e l i n c r e a s e s t h em a pf r o m9 1.8 1%t o9 6.0 6%,a n dt h em o d e l s i z e i s c o m p r e s s e db y7 5.4 5%.M e a n w h i l e,t h ep r o c e s s i n gt i m eo f e a c hi m a g e i s5 8 m s;C o m p a r e dw i t ho t h e r t a r g e td e t e c t i o nn e t w o r k s,t h i sm o d e lh a sb e t t e rr o b u s t n e s sa n db e t t e rd e t e c t i o np e r f o r m a n c e.K e y w o r d s:o b j e c td e t e c t i o n;Y o l o v 4;l i g h t w e i g h t;a t t e n t i o nm e c h a n i s m;S o f t P o o l 收稿日期:2 0 2 2-0 5-2 5*基金项目:国家自然科学基金(U 1 8 0 4 4 1 7)项目资助0 引 言 随着我国经济快速发展和人民生活水平的不断提高,城市生活垃圾增长迅速。2 0 1 9年上海“最严”垃圾分类条例1发布,使得垃圾分类概念在国内迅速普及并被越来越多人熟知。对垃圾进行有效且正确的划分是垃圾回收分类的前提,但是目前人工分拣垃圾在一致性、稳定性和卫生条件方面难以达到令人满意的效果。因此,将采集到的垃圾图像结合现有技术,采用智能化,自动化的方式进行处理,不仅可以有效降低人工成本,同时还可以提高资源的利用率。061范金豪 等:基于Y o l o_E S的垃圾分类目标检测模型第1期近些年来,随之深度学习迅猛发展,国内外的学者在垃圾检测领域也开展了广泛研究。Z e n g等2针对高光谱图像 垃 圾 检 测 问 题,提 出 了 一 种 多 尺 度 卷 积 神 经 网 络(M S C NN)对H I S(h u e,i n t e n s i t y,s a t u r a t u i n)数据像素进行分类并生成二值化垃圾分割图,在大面积垃圾检测中具有良好性能。Z h a n g等3采集低像素街道垃圾图像作为数据集,使用改进后的F a s t eR_C NN进行训练,模型精度达到了8 2%。L i a n g等4提出了一种基于卷积神经网络的多任务学习架构(MT L A),此架构对图像中垃圾目标进行识别和定位,在实验中准确度达到了8 1.5 0%。M a等5通过对S S D特征融合模块进行改进、使用F o c a lL o s s解决正负样本失衡问题、采用主干网路更换等措施,改进后的模型在精度和速 度 方面 都 有 较大 提 升。陈 智 超 等6使 用 改 进 的M o b i l e N e t_v 2用于垃圾图像分类,通过对M o b i l e N e t_v 2基础网络调节宽度因子、嵌入注意力模块和设计多尺度特征融合,在自制数据集上进行测试,网路推理时间降低的同时准确度为9 4.6%。M a o等7制作了一个基于台湾地区的生活垃圾数据集,使用Y o l o v 3网络进行训练,准确率达到了9 2.1 2%。Z h a n g等8提出一种YO L O_WA S T E垃圾分类模型,以Y o l o v 4网络为基础利用迁移学习进行训练,在自建数据集上取得良好效果。上述方法在一定程度上有效解决了垃圾分类问题,但是仍然存在着垃圾图像单一、数据集种类少以及网络参数过多、模型冗余等缺点。针对这些问题,本文构建了一个多目标生活垃圾数据集,提出了一种基于Y o l o_E S的垃圾分类目标检测模型。1 Y o l o v 4算法 Y o l o v 4目标检测模型主要是由特征提取网络、外加模块和输出三部分组成,结构如图1所示。其原理是将固定大小的图像输入网络,基于回归获得边界框位置和其所属类别,从而实现对目标的检测。图1 Y o l o v 4网络结构 Y o l o v 4主干特征提取网络采用C S P D a r k n e t 5 3,经过8倍、1 6倍和3 2倍下采样输出维度为5 25 22 5 6、2 62 6 5 1 2和1 3 1 3 10 2 4的特征图。输出特征图经过外加模块S P P(s p a t i a lp y r a m i dp o o l i n g)和P AN e t(p y r a m i da g g r e g a t i o nn e t w o r k)处 理。S P P模 块 只 对 残 差 块6(R e s i d u a l b l o c k6)输出特征图进行操作,该特征经过卷积核大小为1 1、55、9 9和1 31 3的最大池化层,将池化后的结果堆叠后再输出。P AN模块对高层信息进行上采样,使得特征图