温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
南京农业
病虫害
图像
识别
数据
农业大数据学报 2023,5(2):91-96 Journal of Agricultural Big Data DOI:10.19788/j.issn.2096-6369.230214 收稿日期:2023-06-21 基金项目:农业育种科学数据自主应用软件研发(2022YFF 0712100),中央级公益性科研院所基本科研业务费专项(Y2023LM01)作者简介:王伯元,硕士研究生,研究方向:数据挖掘;E-mail:。通信作者胡林,博士,研究方向:科学数据管理;E-mail:;通信作者王晓丽,博士,研究方向:科学数据管理;E-mail:。2023 年南京农业病虫害图像识别数据集 王伯元1,管志浩1,杨杨1,胡林2,3*,王晓丽2,3*1.南京理工大学计算机科学与工程学院,南京 210094;2.中国农业科学院农业信息研究所,北京 100081;3.国家农业科学数据中心,北京 100081 摘要:农业病虫害对农作物的产量和品质造成了严重的威胁,因此准确、高效地检测和识别病虫害是农业生产中的重要任务。本文介绍了一个综合的农业病虫害数据集,由农业虫害检测数据集、农业病害检测数据集、农业病害分类数据集和水稻表型分割数据集组成,包含 55 个类别、48576 张,共 4.14 GB 的图像样本。从公开数据源和学术论文中收集和整理数据,保证了数据集的多样性和代表性。在数据的筛选、清洗和标注过程中,采用了严格的质量控制和验证措施,以确保数据集的准确性和可靠性。该数据集可用于农业病虫害识别和水稻表型鉴定等农业视觉任务,能够为农业病虫害研究提供有价值的资源,并促进农业生产的可持续发展。关键词:水稻;病虫害;图像;科学数据 引用格式:王伯元,管志浩,杨杨,等.2023 年南京农业病虫害图像识别数据集J.农业大数据学报,2023,5(2):91-96.WANG BoYuan,GUAN ZhiHao,YANG Yang,et al.The Agricultural Pest and Disease Image Recognition Dataset in Nanjing,Jiangsu Province,in 2023 J.Journal of Agricultural Big Data,2023,5(2):91-96.The Agricultural Pest and Disease Image Recognition Dataset in Nanjing,Jiangsu Province,in 2023 WANG BoYuan1,GUAN ZhiHao1,YANG Yang1,HU Lin2,3*,WANG XiaoLi2,3*1.School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China;2.Agricultural Information Institute of Chinese Academe of Agricultural Sciences,Beijing 100081,China;3.National Agriculture Science Data Center,Beijing 100081,China Abstract:Agricultural pests and diseases pose a serious threat to crop yield and quality,making accurate and efficient detection and identification of pests and diseases crucial in agricultural production.In this paper,we propose a comprehensive agricultural pests and diseases dataset,which includes agricultural pest detection dataset,agricultural disease detection dataset,agricultural disease classification dataset,and rice phenotype segmentation dataset.By collecting and curating data from public sources and academic papers,we ensured the diversity and representativeness of the dataset.Rigorous quality control and validation measures were implemented during the data filtering,cleaning,and annotation processes to ensure the accuracy and reliability of the dataset.This dataset can be used for agricultural pest and disease recognition,as well as rice phenotype identification and other agricultural visual tasks.It provides valuable resources for agricultural pest and disease research and contributes to the sustainable development of agricultural production.Key words:rice;pests and diseases;images;scientific data 92 农 业 大 数 据 学 报 第5卷 数据库(集)基本信息汇总表 数据库(集)名称数据库(集)名称 2023 年南京农业病虫害图像识别数据集年南京农业病虫害图像识别数据集 数据作者及分工数据作者及分工 王伯元,分工:数据处理、质量控制及论文撰写;管志浩,分工:数据汇总整理与数据标注;杨杨,分工:数据质量控制;胡林,分工:论文撰写指导;王晓丽,分工:数据汇总整理 通信作者及邮箱通信作者及邮箱 胡林,;王晓丽, 数据时间范围数据时间范围 2023 年 2 月 2023 年 3 月 数据量数据量 4.14 GB/48576 张 数据格式数据格式.jpg 数据服务系统网址数据服务系统网址 http:/dx.doi.org/10.12205/922D87.20230404.32.is.3513 CSTR:17058.11.922D87.20230404.32.is.3513 基金项目基金项目 国家重点研发项目农业育种科学数据自主应用软件研发(2022YFF 0712100);中央级公益性科研院所基本科研业务费专项(Y2023LM01)数据库(集)组成数据库(集)组成 数据集由四部分组成:(1)水稻表型分割数据集共有三类表型,1754 张图像,242 MB;(2)农业虫害检测数据集共有 8 类常见虫害,7839 张图像,2.91 GB;(3)农业病害检测数据集包含 6 类常见病害,1625 张图像,51.2 MB;(4)农业病害分类数据集包含 38 类常见病害,37358 张图像,0.98 GB。1 引言 农业是全球经济的重要支柱,为人类提供了食物、纤维和能源等基本需求。然而,农业生产过程中的病虫害问题一直困扰着农业发展。病虫害不仅会导致农作物产量的大幅度下降,还会影响农产品的品质,甚至可能引发食品安全问题。因此,研究如何有效地识别和治理农业病虫害对保障全球粮食安全和农业可持续发展具有重要的现实意义。图像识别技术在农业领域展现出了巨大的潜力。将计算机视觉和机器学习算法应用于农业病虫害图像的识别和分析中,可以实现对病虫害的准确检测、诊断和监测1;可为农民提供及时的决策支持,帮助他们采取相应的防治措施,减少病虫害对农作物的损害。此外,图像识别技术还可以帮助农业专家和研究人员快速评估病虫害的严重程度、传播速度以及病虫害的类型,为制定科学的防治策略提供重要参考依据2。然而,要实现准确可靠的图像识别,关键在于具备大规模、高质量的农业病虫害数据集。建立这样的数据集既是一项巨大的挑战,也是一个迫切的需求。目前,国内学者在农业病虫害领域的研究取得了显著进展。一方面,研究人员致力于改进图像识别算法以提高病虫害的准确性和鲁棒性,探索不同的深度学习模型和图像处理技术,并提出了一系列创新的方法来解决农业病虫害图像识别中的问题,同时利用大规模的农业病虫害数据集进行模型训练和验证,不断优化算法性能。陈浪浪等3结合迁移学习与坐标注意力机制,提出了一种改进深度卷积神经网络的模型,用于水稻病虫害识别,该模型能够有效识别出 8 种常见的病虫害,为水稻病虫害的诊断提供有力依据。王卫星等4提出了 YOLOv4-GCF荔枝病虫害检测模型,在所构建的荔枝病虫害图像数据集中实现了准确而快速的检测,可为自然环境下复杂、非结构背景的农作物病虫害实时检测研究提供参考。另一方面,研究人员已经开始使用图像分割技术来实现农业病虫害的图像分析和识别,研究基于深度学习的图像分割算法,并将其应用于病害检测等领域。李凯雨等5使用语义分割模型对作物叶部病害病斑进行分割,能够在分割病斑的同时准确地识别病害类别,有较好的泛化性和鲁棒性,实现了在自然场景下对作物叶部病害病斑的识别与分割。王振等6提出一种基于级联卷积神经网络的作物病害叶片图像分割方法,可以在作物病害叶片图像中对病斑区域实现精确分割,该方法能够满足不同环境条件下对作物病害叶片第 2 期 王伯元等:2023 年南京农业病虫害图像识别数据集 93 图像分割需求,可进一步为作物病害识别方法研究提供参考。基于以上背景,本文建立了这一农业病虫害数据集。该数据集包含了农业虫害检测数据集、农业病害检测数据集、农业病害分类数据集以及水稻表型分割数据集。通过对大量图像和视频数据进行采集、整理和标注,并经过数据增强和标注等预处理方法,为图像识别技术在农业病虫害治理中的应用提供数据支撑。2 数据采集与处理方法 2.1 数据来源 从互联网公开数据集以及相关学术论文中获取农业病虫害图像数据和水稻表型图像数据。这些数据集涵盖了不同农作物和不同病虫害类型的样本,以保证数据的多样性和代表性。2.2 数据处理方法 数据筛选与清洗:对收集到的数据进行了初步的筛选和清洗。首先,排除了质量不高、分辨率低、模糊或重复的图像。其次,通过人工检查和算法辅助,去除了包含不完整或缺失关键信息的图像,确保了数据集的质量和可靠性。数据增广:为了增加数据集的多样性和鲁棒性,采用了数据增广的方法。使用了常见的数据增广技术,例如随机缩放、翻转、旋转和亮度调整等,以模拟实际场景中的变化和不确定性,可有效减少过拟合风险,提高模型的泛化能力,并丰富了数据集的内容。数据标注与验证:为了提供更准确的数据标签和用于训练模型的参考标准,对每张图像进行标注。在农业病虫害数据集中,使用 Labelme 软件标注了病虫害的位置和类型;在水稻表型数据集中,使用LabelImg 软件标注了不同表型区域的位置和边界。经过多次验证和审核,以确保标注结果的准确性和一致性。数据整合与标准化:根据研究的需要,将采集到的农业病虫害图像数据按照不同的类别和标签进行整合。针对农业病害分类数据集,按照不同的病害类别对数据进行整合。每个类别包含相应的图像样本,使得数据集具备清晰的类别划分,便于进行农业病害的分类任务。为了便于数据集的使用和对比分析,仿照计算机视觉领域经典数据集 PASCAL VOC 的格式,对农业病害检测、农业虫害检测和水稻表型分割数据集进行整合,使得