温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
DeepLabV3
农作物
病害
识别
算法
郝艳艳
基于DeepLabV3+的农作物病害识别算法郝艳艳摘 要:针对自然背景下农作物病害识别效果欠佳的问题,提出一种改进的DeepLabV3+算法来提升在自然背景下农作物病害的识别准确率。论文所做的贡献主要是在DeepLabV3+模型的编码器阶段输出特征图之前加入通道注意力机制,在解码器阶段的输入特征图之前加入空间注意力机制,之后按照卷积神经网络的拼接方法将二者进行拼接,以实现高级特征和低级特征的有效融合。实验结果显示,改进后的算法对实验数据的识别准确率和召回率均有一定成程度的提升,具有较高的实际应用价值。(河南工业贸易职业学院信息工程学院,河南 郑州 450000)关键词:DeepLabV3+;农作物病害;注意力机制中图分类号:TP391.41;TP183 文献标识码:A 文章编号:008-6609(2023)01-0050-03随着深度学习技术的发展,越来越多学者利用深度学习技术来处理农作物病害识别问题。深度学习技术尤其是卷积神经网络可以自动、高效地提取图像特征,且可以大大降低待训练参数的规模,从而有效节约计算资源。戴雨舒等人(2021年)以小麦赤霉病为研究对象,用数码相机采集20张接种了小麦赤霉病的麦田图像,通过对图像进行人工标注、图像分割等手段获得31482张图像,将其输入Deeplabv3+模型并进行调参和优化,并以MobileNet V2作为网络的编码模块,利用空洞卷积技术设计了小麦赤霉病识别及检测模型,模型对小麦测试集的赤霉病的平均识别准确率为96.92%。林建吾等人(2022年)的实验也证明了卷积神经网络在农作物病虫害识别问题上表现突出。农作物病虫害对农作物生产的品质和产量均造成了极大的影响,这直接影响农作物交易市场的交易价格和交易水平,阻碍农产品交易市场的经济发展。河南省作为粮食生产大省,以2022年上半年为例,粮食总种植面积达7600万亩以上,约占河南省总面积的27%。其中玉米、水稻、大豆等主产农作物面积超过7140万亩,占河南省粮食种植总面积的94%。在这样的种植面积基数下,针对河南省主产农作物的病害防治工作尤为重要。卷积神经网络的核心部分是卷积操作,卷积操作可以对原始输入特征图进行若干层的特征提取,再将其送入全连接网络,以减少送入全连接网络的特征数据量和模型的待训练参数的规模,从而减少模型过拟合。卷积操作通常用一个正方形的卷积核遍历原始输入特征图里的每一个像素点,每滑动一个步长,卷积核与输入特征图的部分区域重合,重合区域的对应元素相乘后求和,再加上偏置项,最终得到输出特征图的一个像素点。假设原始输入特征图是单通道的5行5列数据,所使用的卷积核的尺寸是3*3*1,滑动步长是1,则经过卷积计算后的输出数据尺寸为3*3*1。卷积神经网络借助卷积核提取图像特征后送入全连接网络进行识别预测。1 引言2.1 标准卷积空洞卷积的基本操作是在卷积核中间均匀加入零元素(如图1),以便在不增加训练参数的情况下扩大感受野。图中1(a)表示3*3的1Dilated Convolution(这里的1为卷积扩张率,表示卷积核扩张的程度),中间没有空格,其效果与标准卷积操作的效果一样。图1(b)是3*3的2 Dilated Convolution,其实际参与运算的卷积核大小依然是2 相关技术2.2 空洞卷积作者简介:郝艳艳(1987),女,河南郑州人,硕士,讲师,研究方向为神经网络、图像识别。基金项目:2023年度河南省重点研发与推广专项(科技攻关)项目:自然背景下农作物病害自动识别和分级诊断的优化策略研究,项目编号:232102110281;2021年河南工业贸易职业学院校级科研团队“大数据创新与应用科研团队”项目,项目编号:01。电脑与电信501DOI:10.15966/ki.dnydx.2023.z1.0052.3 DeepLabV3+模型3 数据与方法为达到实验效果,为每类实验样本中注入1:1的自然背景的病害图像。在人工采集训练样本时,以实验自然生长下的农田为背景,用手机进行拍摄,背景可包括地面的草地、树干、土壤、其他健康叶面等。在拍摄过程中,为保证训练效果,每张图片尽量以患病叶面为中心,拍摄一片或者两片病害叶片,如图3(c)和图3(d)所示。3*3,但因加入了空洞率(膨胀系数)为1的卷积,即数据点之间加入1个空格,所以对于(b)中蓝色标识的7*7的区域,只有标红点的3*3个权重不为零,其余均为零,从图中可以看出,虽然核尺寸是3*3,但感受野大小已经变为7*7了。同样,对于图1(c),空洞率为3,其感受野已达到15*15。因此空洞卷积可以有效缓解因模型上采样和池化操作带来的特征数据丢失问题。论文将空洞卷积加入到DeepLabV3+模型的编码器阶段,来扩大网络的感受野,以提升模型的特征提取能力。3.1 实验数据3.2 算法设计D e e p L a b V 3+模 型 源 自D e e p L a b系 列 模 型。DeepLabV1模型2014年由谷歌提出后,逐步通过在网络中以并行或者串行方式加入空洞卷积和空间金字塔池化,发展为DeepLabV2、DeepLabV3,最终发展为DeepLabV3+模型。DeepLabV3+模型由编码器和解码器组成,编码器阶段主要通过1*1卷积、不同膨胀系数的空洞卷积以及池化操作来获取输入图像不同尺度感受野的特征图,然后通过拼接和1*1卷积获取图像的高级特征,得到深层次的特征图。解码器部分通过1*1卷积获取输入图像的低级特征。编码器和解码器两部分获得的特征图在解码器阶段分别经卷积操作和上采样操作后进行特征融合,得到同时具备浅层信息和深层信息的特征图。最后,融合拼接后的特征图再经过一次上采样得出最终的输出结果。通过这种方式提取到的输出特征图可以有效缓解模型因深度增加导致的梯度消失问题,可以同时提取到输入图像深层和浅层的特征,更有利于提升模型在处理图像边缘部分的细节处理能力,其基本结构如图2所示。为达到更好的训练效果,需要在现有公共数据集Plant Village的基础上,补充农田自然背景的病害图像。Plant Village数据集中包含健康叶片图像和病害叶片图像共计54303张,按作物类别和病害类别共分为38类,数据集中的图像多以纯色背景为主(如图3(a)和图3(b)。结合实验农田种植的作物种类,便于实验过程中构建复杂背景下病害图像识别的基本需求,论文选用Plant Village数据集中的样本数量较均匀、本省种植较多的番茄、玉米、苹果3类作物作的17类病害为实验样本。注意力机制可以有效获取输入特征图中更多细节和关键信息。在设计的农作物病害识别算法中加入通道注意力(Channel Attention)和空间注意力(Spacial Attention),加强不同通道之间和不同区域之间特征的相关性联系。注意力机制的基本原理可以表示为式(1),其中g(x)抽象地看作是产生注意力(即注意待识别区域)的过程,f(g(x),x)抽象地表示基于attention(g(x)处理输入x。以经典的SENet为例,g(x)可以用式(2)表示,由此可以推出f(g(x),x)的表达式为式(3)。从概念来看,注意力机制的基本原理与自然背景下的农作物病害识别的需求高度吻合,因此在识别模型的合适位置引入注意力机制来加速识别过程,提高识别准确率。电脑与电信51图1 空洞卷积(a)(b)(c)图2 DeepLabV3+模型示意图(a)健康(b)锈病(c)健康(d)锈病图3 纯色背景和自然背景下苹果病害图像4.1 实验设计5 结论4郝艳艳.基于卷积神经网络的小麦病害识别研究J.电脑与电信,2022,308(9):19-21+43.4 实验与分析4.2 模型训练为达到较好的识别效果,需要进行多次实验来寻找模型的最优参数,尤其是超参数的设置,虽然常规经验值可以取得一定的识别效果,但是针对不同的模型和不同的数据集,超参数的细微差别可能给模型识别结果带来较大的波动。在训练过程中以模型设计的损失函数的收敛作为训练终止条件,多次试验后对比损失函数收敛速度、模型识别准确率等指标的情况,确定系统的各个超参数的最优值分别是:学习率learn_rate=0.02、迭代次数epoch=200、单次喂入量bach_size=50、优化器optimizer=adam、是否原始输出metrics=false,然后保存最优情况下的模型参数。4.3 结果分析农作物叶面病害种类多样,论文设计的算法在实验数据集上的表现比较优秀,它的突出贡献是在模型中引入了通道注意力和空间注意力机制,并通过空洞卷积来调节模型的精度和耗时之间的矛盾。此外,一般深度卷积神经网络要求所有输入特征图具有相同的标准尺寸,但是实际应用中,因病害图像中病变区域大小可能是任意变化的,采用固定尺寸的输入就必须对输入特征图进行剪裁或者变形以匹配网络对输入特征图尺寸的要求,为此算法在合适位置引入空间金字塔池化来解决输入特征图固定尺寸的问题,取得了较好的效果。论文设计的基于DeepLabV3+的农作物病害识别算法对DeepLabV3+的编码器阶段进行了改进,首先将农作物图像输入到模型的输入端,分别经由6倍、12倍、18倍的空洞卷积和1个1*1卷积、1个池化操作后进行空间拼接,通过一次1*1卷积缩小模型通道数,此时(即图2中标号1的位置)加入通道注意力机制,通过不同通道之间的加权处理保留和强化具有更多尺度的高阶信息。同时在解码器阶段,为了更好地处理自然背景下的农作物病害图像,需要过滤掉输入图像中复杂的背景噪声,因此在解码器阶段(即图2中标号2的位置)加入空间注意力机制后再进行后续的卷积操作和拼接操作,可以有效过滤背景噪声,突出目标区域的特征,更好地处理边界细节,获得较好的分类效果。1戴雨舒,仲晓春,孙成明,等.基于图像处理和Deeplab v3+模型的小麦赤霉病识别J.中国农机化学,2021,42(9):209-215.2杨贞,彭小宝.基于DeeplabV3Plus的自适应注意力机制图像分割算法J.计算机应用,2022,42(1):230-238.3林建吾,张欣,陈孝玉龙,等.基于轻量化卷积神经网络的番茄病害图像识别J.无线电工程,2022,52(8):1347-1353.为了说明算法的优越性,设计了第一组实验,将改进后的算法分别与经典的图像分割算法进行对比,观察实验结果。同时为了说明算法改进的有效性,设计了第二组实验,分别采用原始的DeepLabV3+算法和改进后的算 法 训 练 实 验 数 据。算 法 实 现 的 实 验 环 境 为6 4位Windows10操作系统,配置八核心十六线程的Intel(R)Core i7-10700K CPU,配置NVIDIA1060显卡(GeForce GTX1060 6G),使用TensorFlow2.0深度学习框架,采用的编辑器为PyCharm Community Edition 2022.1.3。实验共分两组,第一组为了验证DeepLabV3+算法对自然背景下农作物病虫害识别的优越性,第二组为了验证论文对DeepLabV3+算法改进策略的有效性。从表1中第一组实验结果来看,DeepLabV3+算法在识别的准确率和召回率上表现都较为优秀,说明论文选择DeepLabV3+算法作为基准算法是较为合适的。第二组实验中标号4和5分别表示在DeepLabV3+中只加入通道注意力机制和空间注意力机制,标号6表示在DeepLabV3+中同时加入两种注意力机制。从第二组实验结果来看,单独加入某种注意力机制相比原始算法的提升较为有限,但识别效果已经有所改善,同时加入两种注意力机制效果最优,相对原始算法在准确率和召回率上分别提升8.6%和9.8%,可见论文对算法所做的改进对自然背景下农作物病虫害的识别是比较有效的。参考文献:5贾鹤鸣,郎春博.基于轻量级卷积神经网络的植物叶片病害识别方法J.计算机应用,2021,41(6):1812-1819.电脑与电信Attention=f(g(x),x)g(x)=Sigmoid(MLP(GAP(x)f(g(x),x)=g(x)x(1)(2)(3