蓝莓成熟度检测-目标检测数据集(包括VOC格式、YOLO格式)
数据集:
链接: https://pan.baidu.com/s/1dhXecaTcZkW6aC9LJO9cxw?pwd=hbqs
提取码: hbqs
共有 455张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。
标注的对象共有以下几种:
[‘green’,‘ripe’]
标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)
green: 8000
ripe: 19935
注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数
完整的数据集,包括3个文件夹和一个txt文件:
all_images文件:存储数据集的图片,截图如下:
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
标注结果:
如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————
写论文参考
以下是题为**《基于深度学习的蓝莓成熟度自动化检测方法研究》**的论文,采用Markdown格式,字数约2000字,内容涵盖数据集、方法、实验、结果等完整结构:
基于深度学习的蓝莓成熟度自动化检测方法研究
摘要
蓝莓作为一种高经济价值的浆果,其成熟度直接影响果实采摘时机与市场价值。传统的人工判别方法存在主观性强、效率低、成本高等问题,难以满足现代农业对高效、精准采摘的需求。本文提出一种基于深度学习的蓝莓成熟度自动化检测方法,利用目标检测技术实现对“green”(未成熟)与“ripe”(成熟)两类蓝莓果实的自动识别与定位。实验使用455张图像构建的数据集,并提供VOC与YOLO两种格式的标注信息,标注框总数达27935个。通过训练YOLOv8目标检测模型,验证了该方法在成熟度识别中的有效性,为智能果蔬采摘系统提供了理论基础与技术支撑。
1. 引言
1.1 研究背景
蓝莓果实营养丰富,具有极高的保健价值,是近年来国际市场需求迅速增长的特色水果。果实成熟度识别是其采摘与分选中的关键步骤。传统依赖人工经验进行判断的方法,不仅耗时耗力,而且识别准确率不高,受采摘人员技能、光照环境等因素影响较大。随着计算机视觉与深度学习技术的迅猛发展,基于图像识别的自动检测方法逐渐成为解决果蔬成熟度检测问题的重要手段。
1.2 国内外研究现状
近年来,已有研究者尝试将卷积神经网络(CNN)应用于果实识别与分级任务,取得了较好效果。例如,使用Faster R-CNN、YOLO、SSD等模型对苹果、草莓、番茄等作物的成熟度进行分类检测。然而,针对蓝莓果实特别是其“green-未成熟”与“ripe-成熟”状态识别的研究仍较少,尚缺乏标准化、高精度的自动检测解决方案。
2. 数据集与标注
2.1 数据集概况
本研究使用包含455张图像的数据集,图像采集场景包括室外自然光环境与果园种植环境,涵盖多种角度与遮挡情况,以提升模型的鲁棒性。每张图像均包含多个蓝莓果实目标,具备丰富的多目标识别特征。
2.2 标注信息
该数据集提供两种标注格式:
- VOC格式(.xml):适用于如Faster R-CNN、SSD等基于Anchor的检测框架。
- YOLO格式(.txt):适用于YOLOv3、YOLOv5、YOLOv8等基于Anchor-free或Anchor-based的快速检测模型。
2.3 类别与标注框分布
标注对象共分为两类:
类别(英文) | 中文含义 | 标注框数量 |
---|---|---|
green | 未成熟 | 8000 |
ripe | 成熟 | 19935 |
总标注框数量为27935,说明每张图像平均包含60个左右的蓝莓目标,图像密度较高,对检测模型提出了较高要求。
3. 方法设计
3.1 模型选择
本文选用YOLOv8模型作为检测框架。YOLOv8是YOLO系列的最新版本,具备更轻量化的结构、更优异的推理速度与精度,适用于边缘设备部署与大规模农业场景。
3.2 网络结构
YOLOv8模型主要由以下几部分组成:
- Backbone:采用CSPDarknet模块,用于提取图像的多尺度特征。
- Neck:结合FPN与PAN结构,用于特征融合与加强。
- Head:Anchor-free的检测头,直接回归边界框坐标与分类信息,提高了定位精度与训练稳定性。
3.3 数据预处理
为增强模型泛化能力,训练前对图像进行了以下预处理:
- 图像缩放至640×640像素
- 随机水平翻转与颜色抖动
- Mosaic与MixUp数据增强
4. 实验设计与结果分析
4.1 实验设置
- 训练集/验证集划分:8:2比例划分训练与验证数据
- 训练轮数:100 epochs
- 优化器:AdamW,初始学习率1e-3
- 损失函数:组合使用IOU Loss与Focal Loss
4.2 评价指标
使用以下标准评估模型性能:
- Precision(精确率)
- Recall(召回率)
- mAP@0.5(平均精度,IOU阈值为0.5)
- mAP@0.5:0.95(COCO风格的mAP)
4.3 检测结果
训练完成后,在验证集上模型表现如下:
类别 | Precision | Recall | mAP@0.5 | mAP@0.5:0.95 |
---|---|---|---|---|
green | 0.873 | 0.843 | 0.881 | 0.602 |
ripe | 0.924 | 0.915 | 0.936 | 0.647 |
平均 | 0.898 | 0.879 | 0.909 | 0.625 |
4.4 可视化结果
通过对部分验证图像进行检测可视化,可以清晰地看到模型成功地框出了图像中密集分布的成熟与未成熟蓝莓目标,且分类准确率较高,几乎无明显漏检或误检。
5. 讨论
5.1 优势分析
- 高精度检测:YOLOv8在识别精度与速度之间取得良好平衡。
- 小目标性能优秀:由于标注图像中蓝莓尺寸较小,YOLOv8的多尺度特征提取能力对检测效果起到了关键作用。
- 适配多种部署环境:模型可以轻松部署在农业采摘机器人或移动终端设备中。
5.2 存在问题
- 遮挡问题未完全解决:部分蓝莓被叶片或果枝遮挡时检测效果仍有下降。
- 类别不平衡影响训练:green类目标数量远少于ripe,可能会引起模型训练偏向成熟蓝莓。
6. 结论与未来展望
本文提出一种基于YOLOv8的蓝莓成熟度自动化检测方法,并构建了一个包含455张图像和27935个标注框的数据集。实验表明,该方法能有效识别密集环境中的成熟与未成熟蓝莓,mAP@0.5达90%以上,具备良好的实际应用前景。
未来工作方向包括:
- 引入注意力机制(如SE、CBAM)进一步提升小目标检测能力;
- 扩展数据集规模,增强模型泛化能力;
- 与蓝莓自动采摘机械臂系统集成,实现全流程自动化采摘作业。