分享
基于MobileNet-v3与CNN进行垃圾分类_钱嵩橙.pdf
下载文档

ID:2249921

大小:1.43MB

页数:3页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 MobileNet v3 CNN 进行 垃圾 分类 钱嵩橙
本栏目责任编辑:唐一东人工智能Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)基于MobileNet-v3与CNN进行垃圾分类钱嵩橙1,董博文2,樊继午3,牛曌4,蒋欣洳5,方智1.(1.电子科技大学成都学院,四川 成都 610000;2.淮阴工学院交通工程学院,江苏 淮安 223001;3.长春大学 机械与车辆工程学院,吉林 长春130000;4.南京邮电大学通达学院,江苏 南京 225000;5.淮阴师范学院 法律政治与公共管理学院,江苏 淮安 223001)摘要:由于垃圾种类较多,颜色与形状差异大,选用人工分拣垃圾分类存在着非常大的困难,劳动力不足,工作量大,缺乏精准度。文章以MobileNet-V3small网络算法为基础,对垃圾图像进行准确识别和分类,达到速度快、准确度高,借助CNN模型进行光谱特征分析并分类。通过自动化分拣垃圾,实现垃圾分类,大大降低了人工投入量,提高垃圾分类效率。关键词:垃圾;分类;MobileNet-V3;CNN中图分类号:TP18文献标识码:A文章编号:1009-3044(2022)35-0014-02开放科学(资源服务)标识码(OSID):伴随中国经济社会的发展,人们日常生活质量的提高,以及城镇化的迅速深化,生活垃圾生产量持续推高,全球已经面临垃圾危机1。在我国当前城市建设中,目前城建基本定型,其中垃圾中转站的建设也会对环境产生污染,所以垃圾分类的实施不容乐观。在我国,垃圾分类还存在类别不够细致、标准不够清晰,居民的相关分类知识缺乏。因此,自动化智能化的分拣设备被逐渐运用在垃圾分类工作中。另外,由于城市生活废弃物中大多是废弃物和废物,因此人工分类也是废弃物分类中必不可少的关键环节,有利于筛选无法使用传统手段筛选的废弃物以及对废弃物实施质量管理。但是,进行人工垃圾分类将面临工程量大、工作劳动强度大、分类效率低下和工作环境较差的问题,因此,亟须以智能、信息化的分类方式代替传统分拣方式。本课题采用基于 MobileNet-V3与CNN的深度学习分类模型。该模型将常见垃圾分成四种:其中包含可利用垃圾、危险垃圾、厨余废物和一些其他垃圾。该模型将Mobilenet-V3small网络算法为基础(主要设计载体),并使用新搭建的CNN模块对数据集的光谱特征提取垃圾分析和计算,实现对垃圾目标的识别进行分类。1 算法设计在本次的实验中,模型的调用中通过搜集垃圾图片进行整合,每一组图片里有且只有一种垃圾的一个图片,照片的格式统一为jpg,标签格式为txt,在此过程中始终保持两者为一一对应的关系,由于采用的垃圾照片是随机的,光线、尺寸、大小、对比度等不尽相同,其内部数据也很复杂多乱,所以更加符合平时垃圾识别的标准,贴切我们的生活实际情况。在进一步整合之后,添加数据集标签,将垃圾种类分为数类,一个数字对应一个标签即一个类别。根据实验要求,为了合理精准分类出实验所需垃圾图像。采用以MobileNet-V3 small网络算法为基础(此计算为本次实验的主要设计载体),而在此基础上优化该算法,采用CNN来进一步准确提高垃圾分类的效率。CNN 是通过模拟生物神经系统进行特殊设计的一种网络模型,在图像特征提取的过程中不需要人工思考具体特征,其局部链接和权重共享的特性在二维图像处理上有着明显优越性,可以直接作用于图像的像素位置,因此人们能够使用该网络对输入的垃圾像素进行获取特性,完成了对垃圾目标的鉴别和分类。其中,CNN一般包含的内容块有最大注入层、卷积层、最大池化层,全连接层和最大输出层等,而其要使用的基础模块则为最大卷积层(用来获取特征)和最大池化层(用来采样并不会破坏识别结构),对垃圾进行初步识别分类。最后,将已实现精准分类的图像输入MobileNet-V3 small网络,并使用分组卷积减少了网络的计算工作量,同时MobileNet也将分组卷积技术应用至极致,即网络的分组数量和网络的channel数量相当,从而将网站的计算量减少至最小化,并且使用NetAdap技术可以在计算与参量均受限的条件下,实现对不同网络模块的查询,将搜索到的完整网络模块进一步输入收稿日期:2022-08-20作者简介:钱嵩橙(2001),男,江苏连云港人,本科,主要研究方向为计算机科学与技术;董博文(1999),男,江苏连云港人,本科,主要研究方向为电子交通工程;樊继午(2001),男,江苏连云港人,本科,主要研究方向为智能电子信息;牛曌(1995),女,江苏连云港人,本科生,主要从事英语;蒋欣洳(200),女,江苏淮安人,本科,主要从事人力资源研究;方智(1981),女,讲师,主要从事计算机应用研究。E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology电脑知识与技术Vol.18,No.35,December202214DOI:10.14004/ki.ckt.2022.2129人工智能本栏目责任编辑:唐一东Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)platform-aware NAS中,从而进一步微调,在确保精度的前提下大大提高了效率,得到所需的分类结果。图1 基于MobileNet-V3与CNN的垃圾分类总体技术路线2 算法模型2.1 CNN模型CNN 是一个具有卷积构造的深度神经网络。CNN模型的使用能够在保证一定精度的前提下进行高效、迅速地处理二维图像2。CNN的出现,代替了常规全连接神经网络中的矩阵加减法运算,其优点就是在GPU的并行计算能力下,还能有很大的运算效能,最经典的CNN包括输入与输出层、卷积运算层、池化层,全连接层与输入输出层等,实现了提取图形特征功能的内核模块为卷积层和池化层3。卷积层与池化层可以将被提取图像的特征进行从浅到深进行剖析,使原有的特征细节变得更加具体。在卷积运算的过程中,若在核维度为x的图像里,要使上层网络的m-1的输出值1z-m输入下层的m中,此过程的计算公式为4:Zmx=g(lmx zm-1+amx)(1)其中:Zmx代表在上一层卷积运算中,核维度为x的特征图,lmx代表第m层维度为x的权向量,amx代表第m层且维度为x的偏置单元,运算符代表本次卷积运算的操作,g(y)为非线性的激励函数。在经过卷积层的运算后,需要提取的特征图像会在池化层中进行卷积特征降维,其目的在于简化运算,并对特征进一步具体化,从而提取出更加典型的特征。在本次实验中共运用四层CNN模型,先将图片中的数据输入输入层中,其目的是保存图片本身的结构。紧接着通过卷积层滤波的处理进入卷积层中,使用卷积核进行特征提取和特征映射,同时利用卷积层处理公式进行特征处理,使每一个卷积层中的神经元是都对应一个权重。当输入进入池化层时,池化层中的“池化视野(filter)”会对输入的数据进行扫描、计算,进一步进行卷积特征降维。再CNN模型尾部的全连接层主要对输入的特征进行重新整合,避免特征信息的丢失。最后则由输出层输出初步的分类结果。2.2 Mobilenet-v3 模型在深度学习的过程中,使用轻量级网络的优势在于模型参数少、计算量小、测试速度更快,且适用于存储空间和功耗受限的场景。而缩小模型的参数量一直是科研人员的研究努力方向,MobileNet-v1、MobileNet-v2便是其中的佼佼者。而本实验中就使用了结合二者之间优点的生物识别网络 MobileNet-v3。MobileNet-v3的独特创新的地方在于采用了互补搜索技术结构:即在同一网络结构中,它可以通过顺序的原则对每一层进行微小调整,而不是通过试图推断出不精确但整体的体系结构,同时调用NetAdapt技术和platform-aware NAS方法。其中,NetAdapt的普遍应用特点就是能够在计算时间和参量均受限的条件下完成对各个互联网模型的查找,使扩展层使用滤波器的数量达到最佳,并且瓶颈层输出的通道数量也为最佳输出,NAS主要是在查找并确定模块之后完成对互联网层的微调。在MobileNetV2模型中反转残余的误差结构和变量5,采取了1*1卷积算法构造,以便拓展到更高维的特征空间中,而其缺陷则是带来了巨大运算费用和延迟。同时,为在保持低维数约减特性图的前提下减少延迟,可以将平均池化前的层删除并采取1*1逐点卷积来完成特征图。特征生成层被删除后,先前作为瓶颈映射的层不再要求。MobileNet-v3是继承了MobileNet-v1与MobileNet-v2的优点且重在提高精度与检测速度方面。MobileNet-v3集现有MobileNet-v1与MobileNet-v2思想于一体,其中最为关键是使用分段线性函数模拟sigmoid函数激发变量swish进行数值逼近的h-swish触发变量,如公式(2)所示:h-swish x=xReLU6(x+3)/6(2)随着模型参数的不断缩小,应用非线性激活函数的成本逐渐降低。Sigmoid不便于保持数据的准确性需要烦杂的计算过程,其中,采用新的激活函数 h-swish,在确保精度的前提下,也具有诸多的优势,最重要的是实现了ReLU6的优化且能在量化模式下,减少误差、提高精度的同时,也能极大提升速度,这些修改超过了当前的空间搜索范围。当然,使用h-swish还会带来一定部分的延迟,但是量化版的h-swish能够带来精度的提升是值得的,在具体实验中,还可以进一步进行软件优化,在实际计算时,可以减少对内存的访问开销。3 结束语传统的人工垃圾分类方法已经不足以处理人们生活中产生的垃圾,工作量大、工作强度高、分类效率低等问题亟待解决。基于MobileNet-V3和CNN的深度学习分类模型对垃圾图像分类进行研究,根据算法(下转第18页)15本栏目责任编辑:唐一东人工智能Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)similarity=cos=ABAB=i=1nAi Bii=1n()Ai2i=1n()Bi2(4)3.5 利用K-means聚类算法进行聚类(1)随机生成K个聚类中心;(2)计算每个样本与每个聚类中心的距离(余弦相似度),离哪个聚类中心近,就划分到哪个聚类中心所属的集合当中;(3)重新计算每个集合的聚类中心;(4)重复2、3步,直到收敛(聚类中心偏移很小,或者计算聚类中心次数超过阈值);(5)返回所有聚类标签。图7 聚类结果表1 实验结果学校湖北轻工职业技术学院武汉理工大学华中师范大学热点(排名前3)专升本、兼职、单招考研、航海、武理考研、调剂、家教从“百度贴吧”下载湖北轻工职业技术学院、武汉理工大学、华中师范大学下载各1000篇文本,利用本文的方法对文本进行处理,处理完后,发现热点话题如表1所示。4 结束语热点话题发现有助于快速获取网络中的当前热点,能够及时为当局提供快速响应的依据。从实验中可以看出,本文提供的方法可以有效且及时发现网络中的热点话题。不仅在贴吧平台可以使用,在有数据来源的情况下,同样可以作为社会舆论的监测工具。但是本实验中数据量有限,实验结果可能与实际情况存在稍许偏差,后期笔者将重点放在增加实验数据和改进实验方法的工作上。参考文献:1 Allan J.Topic Detection and Tracking:Event-based Information OrganizationM.Boston,MA:Springer US,2002.2 Yu X,Bin Z,Yang O.A method based on sentence embeddingsfor the sub-topics detectionJ.Journal of Physics:ConferenceSeries,2019,1

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开