温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
优化
ResNet
小麦
赤霉病
识别
方法
郝艳艳
电脑与电信电脑与电信基于优化ResNet的小麦赤霉病识别方法郝艳艳摘 要:为提高小麦赤霉病识别的准确率,设计了小麦赤霉病识别的神经网络模型。模型以ResNet结构块为基础搭建了18层的网络结构,然后对模型进行优化调整,加入了全零填充操作提升模型识别能力,在隐藏层中加入了dropout操作缓解模型过拟合情况。实验结果显示这两项优化操作对模型在测试集上的识别准确率的提升有较为明显的效果,可以为小麦生产环境监测提供较好的数据支持。(河南工业贸易职业学院 信息工程学院,河南 郑州 450000)关键词:ResNet;赤霉病;小麦;卷积神经网络中图分类号:TP391.41;TP183 文献标识码:A 文章编号:1008-6009(2022)11-0016-042.1 感受野在利用卷积神经网络对图像数据进行特征提取过程中,输出特征图和输入特征图的尺寸是不一样的,输出特征图的一个像素点映射到原始图像上的区域大小就是4 感受野,也叫Receptive Field。如图1中的两个例子,图1中蓝色框线是将一张5*5的原始图像先后进行2层卷积核尺寸3*3的卷积操作,得到最终输出特征图的尺寸为1*1。图1中绿色框线是直接在5*5的原始图像进行1层卷积核尺寸为5*5的卷积操作,输出特征图尺寸为1*1。这两个输出特征图上的一个像素点映射到原始图像上的区域均为5*5,所以两个例子中输出特征图的感受野均是5,说明2层3*3卷积核和1层5*5卷积核的特征提取能力是一样的。但通过分析发现,两个例子中的待训练参数和计算量是不一样的。设输入特征图边长为x,卷积计算步长为1,则图1中经2层蓝色部分3*3卷积核2的待训练参数有18个,共需要18x-108x+108个乘加计算,图1中经1层绿色框线部分5*5卷积核操作的待训练参2数有25个,共需要25x-200 x+400个乘加计算。因此当输入边长大于10时,经过2层3*3卷积核操作比经过1层5*5卷积核计算的性能好,论文中使用的卷积操作便使用2层3*3卷积核替换1层5*5卷积核来减少模型参数,降低模型时间复杂度。1 引言小麦赤霉病对小麦产量影响重大,因此研究小麦赤1霉病的自动识别问题具有相当重要的实践意义。通过梳理现有研究成果发现,通过卷积神经网络实现病虫害的自动识别是目前该领域的研究热点。以时间顺序为线索分析比较经典的卷积神经网络实现方式的网络深度,最早的LeNet深度为5,随后的AlexNet深度是8,VGG深度是16或者19,InceptionNetV1深度为22,可见学者们在探索利用卷积操作实现特征提取的过程中,通过加深2网络深度的方式取得了越来越好的效果。受生物学中感受野机制启发,现代卷积神经网络通过在模型中引入3跨层直连边等不规则操作来训练更深层的网络,取得了非常不错的训练效果。在一些场景中,神经网络希望保持输入特征图的尺寸5不变,可以通过全零填充,即在输入特征图周围用零填2.2 全零填充2 材料与方法作者简介:郝艳艳(1987),女,河南郑州人,硕士研究生,讲师,研究方向为机器学习、计算机教学。基金项目:2023年度河南省高校重点项目“农作物叶片病虫害识别问题中的边缘计算模型研究”,项目编号:23A520061;2021年河南工业贸易职业学院校级科研团队“大数据创新与应用科研团队”项目,项目编号:01。ResNet是2015年ImageNet竞赛的冠军,top5错误率为3.57%。ResNet的最大贡献是提出了残差跳连,引入了前方信息,缓解了梯度消失,使神经网络层数增加成为可能。其作者何凯明在cifar10数据集上进行实验发现56层卷积网络错误率要高于20层卷积网络的错误率,得出单纯堆叠神经网络层数会使神经网络模型退化,致使后面的特征丢失了前面特征原本的模样。因此他用一根如图2所示的跳连线将前面的特征直接接到了后面,使输出结果H(x)包含堆叠卷积的非线性输出F(x)和跳过这两层堆叠卷积直接连接过来的恒等映射X,让它们的对应元素相加,即矩阵相加。ResNet结构块中有两种情况,一种如图2(b)用实线表示跳连,这种情况下两层堆叠卷积没有改变特征图的维度,即F(x)和X的高、宽和深度都相同,可以直接将F(x)与X相加。一种如图2(a)用虚线表示跳连,这种情况下两层堆叠卷积改变了特征图的维度,需要借助1*1卷积来调整X的维度,使W(x)与F(x)的维度一致之后再相加。其中1*1卷积操作可以通过调整步长改变输入特征图尺寸,通过调整卷积核个数来调整输入特征图的深度。这一操作有效缓解了神经网络模型堆叠导致的退化,使网络可以向着更深层级发展。论文中设计的小麦叶片赤霉病识别模型即是利用这种基本的ResNet结构块搭建的。充的方法来实现。例如对一张5*5*1的原始图像进行全零填充后,再经过1层尺寸为3*3*1卷积核进行步长为1的卷积操作时,其输出特征图尺寸仍为5*5*1。Tensorflow中用tf.karas.layers.Conv2D来实现卷积操作,用其中的padding参数来表示是否使用全零填充。论文中采用padding=SAME表示模型使用了全零填充操作。2.4 小麦叶片赤霉病识别模型2.3 ResNet结构块用ResNet结构块搭建的RestNet18网络结构共有18层,如图3所示。第一层是一个3*3的卷积层,接着是8个ResNet块,每一个ResNet块包含2层卷积,之后是一个全局平均池化层,最后接入全连接层。算法描述如表1。第一层采用64个步长为1,尺寸为3*3的卷积核,并且使用全零填充,采用批标准化操作,激活函数采用Relu。接下来由4组ResNet结构块组成,每一组表示一个ResNetBlock,包含2个基本ResNet结构块,用block表示。其中第一组由两个实线跳连的block组成,第 二、三、四 组 是 由 先 虚 线 再 实 线 跳 连 的 两 个block组成。这由8个block组成的4层ResNetBlock用一个2层的循环结构实现,循环次数由参数列表元素个数决定,在实例化WheatResNet18时设置参数列表赋值是(2,2,2,2)4个元素,表示包含4个ResNet结构块,每个结构块包含2层卷积,因此最外层for循环执行4次,每次内层for循环将执行2次,共执行8次。每次根据当前执行的是第几个元素来选择residual_path的值,r e s i d u a l _ p a t h=T r u e 表 示 为 虚 线 跳 连,residual_path=False表示为实线跳连。最后经过全局平均池化GlobalAveragePooling2D和全连接层Dence来输出结果。在神经网络训练过程中,常把隐藏层的部分神经元按一定比例临时舍弃来缓解过拟合,在使用神经网络时,再把所有神经元恢复到神经网络中,Tensorflow一般用Dropout函数来实现这个训练过程,如表1中的第14行实现随机舍弃20%的神经元进行模型训练。为了使模型具有更好的训练效果,在模型设计中引入断点续训操作。如果每次训练都从零开始,将非常浪费有限的计算资源。断点续训可以对模型进行存取,实时保存模型的最优参数。神经网络训练的目的就是为了获取各层网络的最优参数,只要拿到这些参数,模型将可以在任何图1 感受野示意图图2 ResNet结构块图3 模型网络结构1617DOI:10.15966/ki.dnydx.2022.11.008电脑与电信电脑与电信基于优化ResNet的小麦赤霉病识别方法郝艳艳摘 要:为提高小麦赤霉病识别的准确率,设计了小麦赤霉病识别的神经网络模型。模型以ResNet结构块为基础搭建了18层的网络结构,然后对模型进行优化调整,加入了全零填充操作提升模型识别能力,在隐藏层中加入了dropout操作缓解模型过拟合情况。实验结果显示这两项优化操作对模型在测试集上的识别准确率的提升有较为明显的效果,可以为小麦生产环境监测提供较好的数据支持。(河南工业贸易职业学院 信息工程学院,河南 郑州 450000)关键词:ResNet;赤霉病;小麦;卷积神经网络中图分类号:TP391.41;TP183 文献标识码:A 文章编号:1008-6009(2022)11-0016-042.1 感受野在利用卷积神经网络对图像数据进行特征提取过程中,输出特征图和输入特征图的尺寸是不一样的,输出特征图的一个像素点映射到原始图像上的区域大小就是4 感受野,也叫Receptive Field。如图1中的两个例子,图1中蓝色框线是将一张5*5的原始图像先后进行2层卷积核尺寸3*3的卷积操作,得到最终输出特征图的尺寸为1*1。图1中绿色框线是直接在5*5的原始图像进行1层卷积核尺寸为5*5的卷积操作,输出特征图尺寸为1*1。这两个输出特征图上的一个像素点映射到原始图像上的区域均为5*5,所以两个例子中输出特征图的感受野均是5,说明2层3*3卷积核和1层5*5卷积核的特征提取能力是一样的。但通过分析发现,两个例子中的待训练参数和计算量是不一样的。设输入特征图边长为x,卷积计算步长为1,则图1中经2层蓝色部分3*3卷积核2的待训练参数有18个,共需要18x-108x+108个乘加计算,图1中经1层绿色框线部分5*5卷积核操作的待训练参2数有25个,共需要25x-200 x+400个乘加计算。因此当输入边长大于10时,经过2层3*3卷积核操作比经过1层5*5卷积核计算的性能好,论文中使用的卷积操作便使用2层3*3卷积核替换1层5*5卷积核来减少模型参数,降低模型时间复杂度。1 引言小麦赤霉病对小麦产量影响重大,因此研究小麦赤1霉病的自动识别问题具有相当重要的实践意义。通过梳理现有研究成果发现,通过卷积神经网络实现病虫害的自动识别是目前该领域的研究热点。以时间顺序为线索分析比较经典的卷积神经网络实现方式的网络深度,最早的LeNet深度为5,随后的AlexNet深度是8,VGG深度是16或者19,InceptionNetV1深度为22,可见学者们在探索利用卷积操作实现特征提取的过程中,通过加深2网络深度的方式取得了越来越好的效果。受生物学中感受野机制启发,现代卷积神经网络通过在模型中引入3跨层直连边等不规则操作来训练更深层的网络,取得了非常不错的训练效果。在一些场景中,神经网络希望保持输入特征图的尺寸5不变,可以通过全零填充,即在输入特征图周围用零填2.2 全零填充2 材料与方法作者简介:郝艳艳(1987),女,河南郑州人,硕士研究生,讲师,研究方向为机器学习、计算机教学。基金项目:2023年度河南省高校重点项目“农作物叶片病虫害识别问题中的边缘计算模型研究”,项目编号:23A520061;2021年河南工业贸易职业学院校级科研团队“大数据创新与应用科研团队”项目,项目编号:01。ResNet是2015年ImageNet竞赛的冠军,top5错误率为3.57%。ResNet的最大贡献是提出了残差跳连,引入了前方信息,缓解了梯度消失,使神经网络层数增加成为可能。其作者何凯明在cifar10数据集上进行实验发现56层卷积网络错误率要高于20层卷积网络的错误率,得出单纯堆叠神经网络层数会使神经网络模型退化,致使后面的特征丢失了前面特征原本的模样。因此他用一根如图2所示的跳连线将前面的特征直接接到了后面,使输出结果H(x)包含堆叠卷积的非线性输出F(x)和跳过这两层堆叠卷积直接连接过来的恒等映射X,让它们的对应元素相加,即矩阵相加。ResNet结构块中有两种情况,一种如图2(b)用实线表示跳连,这种情况下两层堆叠卷积没有改变特征图的维度,即F(x)和X的高、宽和深度都相同,可以直接将F(x)与X相加。一种如图2(a)用虚线表示跳连,这种情况下两层堆叠卷积改变了特征图的维度,需要借助1*1卷积来调整X的维度,使W(x)与F(x)的维度一致之后再相加。其中1*1卷积操作可以通过调整步长改变输入特征图尺寸,通过调整卷积核个数来调整输入特征图的深度。这一操作有效缓解了神经网络模型堆叠导致的退化,使网络可以向着更深层级发展。论文中设计的小麦叶片赤霉病识别模型即是利用这