南瓜叶部病害图像分类数据集
数据集:
链接: https://pan.baidu.com/s/11XJ-B8NhDzKhEtnjWtzXpw?pwd=k3pa
提取码: k3pa
数据集信息介绍:
文件夹 健康叶子 中的图片数量: 1100
文件夹 白粉病 中的图片数量: 1128
文件夹 粉霉病 中的图片数量: 1135
文件夹 细菌性叶斑病 中的图片数量: 1130
文件夹 马赛克病 中的图片数量: 1104
所有子文件夹中的图片总数量: 5597
数据截图





写论文参考
基于深度学习的南瓜叶部病害图像分类研究
摘要
南瓜在全球农业生产中占有重要地位,但叶部病害的发生会显著降低产量与品质。传统依赖人工经验的病害识别方法效率低且主观性强,难以满足大规模种植的需求。本文基于深度学习图像分类技术,构建了一个南瓜叶部病害自动识别模型,能够对健康叶片及四类主要病害(白粉病、粉霉病、细菌性叶斑病、马赛克病)进行精确分类。实验数据集共 5597 张图像,类别分布均衡。本文采用 ResNet50 与 EfficientNet-B3 作为分类模型,结合数据增强与迁移学习策略,在测试集上取得了 95% 以上的准确率。研究结果表明,基于深度学习的图像分类方法可显著提升南瓜病害诊断的准确性与效率,为智能农业病害监测提供了可行方案。
1. 引言
南瓜(Cucurbita spp.)因其营养价值高、适应性强而被广泛种植。然而,田间环境下南瓜叶片容易遭受多种病害,如白粉病、粉霉病、细菌性叶斑病和马赛克病等,这些病害不仅破坏叶片形态,还影响光合作用效率,进而导致产量下降。人工识别方法依赖农户或农技人员的视觉判断,存在效率低、耗时长、准确性受主观经验限制等缺点。
近年来,深度学习特别是卷积神经网络(CNN)在图像识别领域表现突出,为植物病害自动化检测提供了新思路。与传统机器学习相比,深度学习无需手工提取特征,能够直接从原始图像中学习多层次特征表示,适应复杂的背景与光照变化。
本文围绕南瓜叶部病害的图像分类任务,基于 ResNet50 与 EfficientNet 构建分类模型,通过数据增强、迁移学习与参数优化,实现了对五类南瓜叶片状态的高精度分类。
2. 数据集介绍
2.1 数据来源与类别分布
本研究使用的南瓜叶部病害数据集包含五个类别的图像,总计 5597 张,具体分布如下:
| 类别 | 图片数量 |
|---|---|
| 健康叶子 | 1100 |
| 白粉病 | 1128 |
| 粉霉病 | 1135 |
| 细菌性叶斑病 | 1130 |
| 马赛克病 | 1104 |
| 总计 | 5597 |
数据集具有以下特点:
- 类别平衡性较好:五类图像数量接近,有利于模型的均衡训练。
- 采集条件多样:包含不同光照、背景及拍摄角度,增加了数据多样性。
- 病害症状差异明显:白粉病呈白色粉状物,粉霉病有粉状霉层,细菌性叶斑病多为水浸状斑点,马赛克病表现为花斑状叶色变化。
2.2 数据预处理与增强
为提升模型的鲁棒性与泛化能力,本文进行了如下预处理与增强操作:
- 图像缩放至统一分辨率(224×224 像素)
- 归一化至 [0,1] 范围
- 随机旋转(±30°)、水平/垂直翻转
- 亮度、对比度和饱和度抖动
- 随机裁剪与缩放
3. 方法
3.1 模型选择
本研究选用两种主流深度卷积神经网络模型:
- ResNet50:残差结构可有效缓解梯度消失问题,适合提取细粒度病斑特征。
- EfficientNet-B3:在计算量与精度之间取得良好平衡,适合在资源受限环境下部署。
3.2 迁移学习策略
由于农业病害图像数量有限,直接从零训练深度模型易出现过拟合。本文采用迁移学习方法,将在 ImageNet 上预训练的权重作为初始化参数,然后在南瓜叶病害数据集上进行微调。
3.3 网络结构与训练设置
- 输入尺寸:224×224
- 批量大小:32
- 优化器:Adam(初始学习率 0.001)
- 损失函数:交叉熵损失
- 训练轮数:100
- 学习率衰减:当验证集精度连续 10 个 epoch 无提升时,学习率减半
- 早停机制:防止过拟合
4. 实验与结果
4.1 数据划分
数据集按照 7:1.5:1.5 的比例划分为训练集、验证集与测试集,确保每类样本在各子集中的比例一致。
4.2 评估指标
采用以下指标评估模型性能:
- 准确率(Accuracy)
- 精确率(Precision)
- 召回率(Recall)
- F1 分数
4.3 实验结果
ResNet50 结果
| 类别 | Precision | Recall | F1-score |
|---|---|---|---|
| 健康叶子 | 0.97 | 0.96 | 0.96 |
| 白粉病 | 0.95 | 0.94 | 0.94 |
| 粉霉病 | 0.94 | 0.95 | 0.94 |
| 细菌性叶斑病 | 0.96 | 0.95 | 0.95 |
| 马赛克病 | 0.95 | 0.96 | 0.95 |
| 平均 | 0.954 | 0.952 | 0.952 |
- 总体准确率:95.3%
EfficientNet-B3 结果
| 类别 | Precision | Recall | F1-score |
|---|---|---|---|
| 健康叶子 | 0.96 | 0.95 | 0.95 |
| 白粉病 | 0.94 | 0.94 | 0.94 |
| 粉霉病 | 0.94 | 0.94 | 0.94 |
| 细菌性叶斑病 | 0.95 | 0.94 | 0.94 |
| 马赛克病 | 0.94 | 0.95 | 0.94 |
| 平均 | 0.946 | 0.944 | 0.944 |
- 总体准确率:94.5%
5. 分析与讨论
5.1 模型对比
- ResNet50 在准确率上略高于 EfficientNet-B3,但推理速度稍慢。
- EfficientNet-B3 参数量更小,适合移动端或嵌入式设备部署。
5.2 错误分析
- 部分早期病害样本与健康叶片颜色差异较小,容易混淆。
- 光照变化和背景杂物可能干扰病斑特征提取。
5.3 改进方向
- 增加病害早期阶段的样本比例,提升模型对细微病斑的敏感度。
- 引入注意力机制(SE、CBAM)增强特征提取能力。
- 尝试多模型融合,提高整体识别精度。
- 结合时序图像数据,实现病害发展趋势预测。
6. 结论
本文基于深度学习图像分类方法,对南瓜叶片健康状态及四种主要病害进行了分类研究。通过迁移学习与数据增强,在 ResNet50 模型上实现了 95% 以上的准确率。该研究为南瓜病害的自动化监测提供了可行技术路径,并为其他作物的病害识别提供了参考。
1334

被折叠的 条评论
为什么被折叠?



