随着社会的不断发展和人民物质生活水平的不断提高,消费者及辣椒行业将更加关注辣椒的品质,强化品种多样性和筛选优质种子培育优良辣椒品种,因此需要利用计算机视觉的图像识别技术对辣椒进行筛选。现今的辣椒种植在收获阶段基本依赖人工方式完成,人工采摘工作量大且劳动强度高[1]。而随着人口老龄化严重,使用辣椒采摘机器人在降低人工成本的同时还能有利于开展大规模辣椒种植,提高辣椒产业规模,对我国的辣椒产业未来发展具有重要意义。1基于卷积神经网络的辣椒图像识别卷积神经网络是一种借鉴了人脑视觉皮层结构设计的神经网络模型,已被广泛应用。卷积神经网络与其他神经网络最显著的区别在于其在网络结构上添加了卷积层,并且因为实现了“权共享”策略,让一组神经元使用相同的连接权,节省了神经网络的训练开销。经典的卷积神经网络CNN架构如图1所示:图1经典的卷积神经网络架构卷积层是对初步对输入图像进行处理的图层,卷积层的重要工作是卷积的选择,每个卷积核相当于一个选择器,过滤出合适的条件和信息,并对特征信号进行放大。一般来说,卷积核较大提取的特征效果会更好,因为覆盖的特征值多,但同时卷积核意味着叠加的特征图多,训练参数会变多,训练时间会变长,所消耗的资源更多;反之,训练参数会减少,训练时间会变短,特征准确率会提高,但提取的特征效果往往不理想。池化层是通过对输入图像进行二次采样,以减少计算负担和内存消耗和参数数量,卷积层仅仅只是筛选特征,一般图像经过卷积层之后,图像仍然会存在大量无用信息,因为卷积层卷积会进行零填充,以保证相邻两层拥有相同的高和宽,但是图像填充零后无用信息增多影响到其后的训练速度和处理准确度。为解决该问题,需要设置池化层进行二次采样筛选,也称被为下采样,通过消除无用特征,缩小图像和输入值,重点突出有用信息。本辣椒采摘机器人的图像识别算法采用基于VGGNet的卷积神经网络模型,VGGNet采用了3×3尺寸的卷积核,能提取到更多的特征细节,以便能更好识别辣椒的外部品质,并且卷积神经网络因为权值共享的网络结构更类似生物神经网络,实现了类似人类直接将图像信息输入到网络中,无需进行复杂的特征提取和构建,十分适合应用于目标检测,同时因为其对于迁移学习的适应性较好,可以节省大量的重复训练时间。当然仅仅使用一个神经网络模型是不够的,卷积神经网络的趋势是越来越深和越来越简单,如ResNet,强大并且实用,未来通过融合不同的模型,吸收优点,...