基于树莓派4实现卷积神经网络的植物病害检测
引言
2017年,锡那罗亚州共有1,149,320公顷土地用于耕种。蔬菜种植面积达71,014公顷,占全国总面积的6.18百分比。因此,农业活动是该地区主要的经济上和社会上活动。园艺害虫和疾病的存在如果未能及时处理,可能会造成严重破坏。因此,对作物病害进行及时准确的检测是精准农业的支柱之一。
目标
该研究的主要目标是使用精确率、敏感度、F分数和准确率等指标,比较不同架构的卷积神经网络模型。
- 这项工作的目标之一是通过使用称为深度学习的人工智能子集,来检测在各种作物或温室中发生的疾病。
- 作为附加目标,决定在特定硬件上实现这些模型,以便通过名为 Raspberry-Pi 4的微型计算机进行实时检测。
方法论
该过程分为四个阶段:采集、训练、分类和评估。
采集
在此阶段:进行数据采集和预处理。本研究的采集通过PlantVillage数据集进行,该数据集共包含14种不同作物,涵盖了38个涉及作物病害和健康作物的不同类别。该数据集包含38个类别,共计54,485张图像,此数据集是一个开放仓库,可供所有人访问。
预处理方面:根据网络输入尺寸,所有使用的图像都被调整为 224 × 224或299 × 299像素。数据被分为两组,其中70%的数据用于训练集,剩余30%用于测试集。通常,深度学习神经网络的性能会随着可用数据量的增加而提高。人为执行这种增强称为数据增强,这是数据预处理的主要部分。
对于此项目,执行了三种变换:缩放、图像旋转以及裁剪或裁切。
训练
在此阶段,通过预处理后的图像对卷积神经网络进行训练。为了获得高性能的训练,进行了迁移学习过程,其目的是将一个或多个领域的知识迁移到具有不同目标任务的另一领域中。
在本研究中,使用了深度学习方法来检测疾病。深度学习架构的选择是实现过程中的关键问题。因此,评估了五种不同的深度学习网络架构:VGG16、InceptionV3、MobileNetV2、Xception 和 ResNet50V2。对于这些深度学习网络,训练和验证是在配备Intel i7-7700处理器和8GB显存的 NVIDIA GTX1070Ti显卡的计算机上完成的。
超参数也被标准化,以实现不同架构之间的公平比较。训练过程使用 Python 3.7.6、Keras (2.2.4) 和 TensorFlow (1.15.0) 完成,这些工具提供了设计和实现卷积神经网络的框架。通过 matplotlib 库开发了应用程序和图形,以帮助可视化网络激活并监控网络训练进度。
分类
分类输出层的数目等于类别数量。由于这类模型在训练阶段具有自动学习特征的能力,因此对于输入图像,每个输出具有不同的概率;模型选择最高概率作为其类别预测。最后,在此步骤中,使用预训练集(Durmus, Gunes, &kircy, 2017)确定叶片上存在的疾病。
评估
通过使用各种指标比较预训练模型来评估性能。预训练学习模型的性能通常通过评估测试数据集来完成。使用的评估指标有:准确率、召回率、F分数和准确率。
精确率,由(1)定义,关乎正确性,即评估算法的预测能力。精确率表示在预测的正例中,模型的判断有多“精确”,以及其中真正为正例的比例是多少。
召回率指的是正例的精确程度,表示正类中有多少实例被正确标注;这应通过公式(2)计算,其中TP表示真正例,即为实际为正且被正确识别的实例数量,FN表示假负例,即实际为正但被错误分类为负的实例数量。
F1分数由准确率和召回率的调和平均数定义,如公式(3)所示。它专注于正类的评估。该指标的值越高,表明模型在正类上的表现越好。
通常,准确率是用于确定排序性能的常用指标。该指标计算测试中成功排序的百分比,如公式(4)所示:
在特定硬件上的实现
由于微型计算机提供的功能,植物分类和图像处理选择了树莓派4型号微型计算机。得益于该设备能够使用官方的树莓派相机模块(Pi-Camera)拍摄实时图像,从而实现对相同内容的分类。
结果
本研究对预训练模型在PlantVillage数据集的不同类别上进行植物病害预测任务的评估。结果和训练时间如表 VII所示。
每种迁移学习架构都在树莓派4微型计算机上实现,每隔几秒进行一次分类,因此测试了多个类别以验证这些卷积神经网络在其内部的正常运行。
结论
开发一个移动应用程序,利用VGG16模型对PlantVillage数据集进行植物病害自动诊断,可能具有重要意义,这样缺乏或没有相关知识的用户或农民也能有效使用该应用来检测PlantVillage类别的植物。
主要建议如下:
1) 针对使用农业来源图像结合卷积神经网络和Keras库进行分类任务的方法论,用于模型训练的不同类别。
2) 第二个贡献集中在比较和分析VGG16、InceptionV3、MobileNetV2、ResNet50V2和 Xception在4种不同性能指标下的性能。此类模型的比较具有以下优势:卷积神经网络不需要任何繁琐的预处理,因为其最后几层可以进行调整,以使其适用于我们想要预测的类别;同时,它们的收敛速度以及训练性能均被认为较高。
3) 通过迁移学习,为预测PlantVillage数据集中不同类别的作物疾病选择最合适的模型。所使用的每个模型都能够对来自14种不同作物的38个类别进行分类,其中包括26种疾病和12个健康类别。
993

被折叠的 条评论
为什么被折叠?



