中草药-目标检测数据集
数据集:
链接: https://pan.baidu.com/s/1w0yWzDOqJqElh4zDR32Ezw?pwd=5vpw
提取码: 5vpw
数据集信息介绍:
共有 1151 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。
标注的对象共有以下40种:
[‘BaiZhi’, ‘CangErZi’, ‘ChiShao’, ‘ChuanMuJin’, ‘GeGen’, ‘HuangBai’, ‘ShiJunZi’, ‘baimaogen’, ‘baizhu’, ‘binglang’, ‘daxueteng’, ‘duzhong’, ‘fuling’, ‘ganjiang’, ‘gouji’, ‘gouteng’, ‘guizhi’, ‘haipiaoxiao’, ‘hehuanpi’, ‘houpu’, ‘jiangbanxia’, ‘jingjie’, ‘jixueteng’, ‘lingzhi’, ‘lugen’, ‘lujiao’, ‘nvzhenzi’, ‘qingfengteng’, ‘qinghao’, ‘qingpi’, ‘ruxiang’, ‘sangzhi’, ‘shijueming’, ‘shouwuteng’, ‘sumu’, ‘tufuling’, ‘yimucao’, ‘yinqishi’, ‘zexie’, ‘zishiying’]
标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)
BaiZhi: 606(白芷)
CangErZi: 253(苍耳子)
ChiShao: 151(赤芍)
ChuanMuJin: 605(川木槿)
GeGen: 129(葛根)
HuangBai: 257(黄柏)
ShiJunZi: 252(使君子)
baimaogen: 880(白茅根)
baizhu: 146(白术)
binglang: 204(槟榔)
daxueteng: 293(大血藤)
duzhong: 49(杜仲)
fuling: 467(茯苓)
ganjiang: 191(干姜)
gouji: 84(枸杞)
gouteng: 1021(钩藤)
guizhi: 218(桂枝)
haipiaoxiao: 147(海螵蛸)
hehuanpi: 266(合欢皮)
houpu: 263(厚朴)
jiangbanxia: 336(姜半夏)
jingjie: 954(荆芥)
jixueteng: 232(鸡血藤)
lingzhi: 168(灵芝)
lugen: 192(芦根)
lujiao: 98(鹿角)
nvzhenzi: 284(女贞子)
qingfengteng: 292(青风藤)
qinghao: 573(青蒿)
qingpi: 75(青皮)
ruxiang: 191(乳香)
sangzhi: 459(桑枝)
shijueming: 167(石决明)
shouwuteng: 97(首乌藤)
sumu: 168(苏木)
tufuling: 82('土茯苓)
yimucao: 831(益母草)
yinqishi: 293(阴起石)
zexie: 160(泽泻)
zishiying: 169(紫石英)
注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。
完整的数据集,包括3个文件夹和一个txt文件:

all_images文件:存储数据集的图片,截图如下:

all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。


如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。

标注结果:

如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————
写论文参考
基于深度学习的多类别中药材目标检测研究
摘要
随着人工智能与深度学习技术的发展,目标检测技术在农业、医疗与工业等多个领域得到了广泛应用。在中药材加工与流通环节中,自动化检测与识别对于提高生产效率、降低人工成本具有重要意义。本文基于一个包含 1151 张图像、40 个中药材类别的目标检测数据集,利用深度学习方法实现对不同中药材的自动识别与定位。数据集中每张图片均配有 VOC 格式(XML)与 YOLO 格式(TXT)两种标注文件,总计标注框数量达到 12394 个。我们采用 YOLOv5 作为基础检测模型,并对其进行训练与评估。实验结果表明,该方法能够在复杂背景下对多种中药材进行高精度检测,为中药材自动分拣与质量控制提供了可行方案。
1. 引言
近年来,深度学习在计算机视觉领域取得了显著进展,其中目标检测技术已被广泛应用于人脸识别、自动驾驶、工业缺陷检测、农作物病虫害识别等场景。在中药材行业中,由于药材种类繁多、形态差异大、颜色与纹理复杂,传统的人工分拣与质检方式存在效率低、精度不稳定等问题。因此,基于深度学习的自动化中药材检测系统具有重要的研究与应用价值。
本文针对一个包含 40 种中药材类别的检测任务,利用 YOLO 系列目标检测算法,结合多类别数据集训练模型,实现了对药材图像中不同类别目标的识别与定位。本研究不仅验证了深度学习在中药材检测中的可行性,还为未来的中药材自动化分拣、仓储管理与质量检测提供了技术支撑。
2. 数据集介绍
2.1 基本信息
- 图像总数:1151 张
- 标注文件:每张图像均配有 VOC(XML)与 YOLO(TXT)两种标注格式
- 目标类别数:40
- 总标注框数:12394 个(每张图像可能包含多个目标)
2.2 类别列表及标注数量
数据集包含以下 40 种中药材类别及其标注框数量:
| 类别 (英文) | 中文名 | 数量 |
|---|---|---|
| BaiZhi | 白芷 | 606 |
| CangErZi | 苍耳子 | 253 |
| ChiShao | 赤芍 | 151 |
| ChuanMuJin | 川木槿 | 605 |
| GeGen | 葛根 | 129 |
| HuangBai | 黄柏 | 257 |
| ShiJunZi | 使君子 | 252 |
| baimaogen | 白茅根 | 880 |
| baizhu | 白术 | 146 |
| binglang | 槟榔 | 204 |
| daxueteng | 大血藤 | 293 |
| duzhong | 杜仲 | 49 |
| fuling | 茯苓 | 467 |
| ganjiang | 干姜 | 191 |
| gouji | 枸杞 | 84 |
| gouteng | 钩藤 | 1021 |
| guizhi | 桂枝 | 218 |
| haipiaoxiao | 海螵蛸 | 147 |
| hehuanpi | 合欢皮 | 266 |
| houpu | 厚朴 | 263 |
| jiangbanxia | 姜半夏 | 336 |
| jingjie | 荆芥 | 954 |
| jixueteng | 鸡血藤 | 232 |
| lingzhi | 灵芝 | 168 |
| lugen | 芦根 | 192 |
| lujiao | 鹿角 | 98 |
| nvzhenzi | 女贞子 | 284 |
| qingfengteng | 青风藤 | 292 |
| qinghao | 青蒿 | 573 |
| qingpi | 青皮 | 75 |
| ruxiang | 乳香 | 191 |
| sangzhi | 桑枝 | 459 |
| shijueming | 石决明 | 167 |
| shouwuteng | 首乌藤 | 97 |
| sumu | 苏木 | 168 |
| tufuling | 土茯苓 | 82 |
| yimucao | 益母草 | 831 |
| yinqishi | 阴起石 | 293 |
| zexie | 泽泻 | 160 |
| zishiying | 紫石英 | 169 |
2.3 数据特点
- 类别多样性:涵盖了植物根茎类、藤本类、果实类、树皮类等不同类型药材,形态差异明显。
- 图像复杂性:存在不同光照条件、拍摄角度及背景环境,提升了模型泛化难度。
- 类别不均衡性:不同类别标注数量差异较大,如
gouteng(钩藤)有 1021 个标注框,而duzhong(杜仲)仅有 49 个。
3. 方法
3.1 模型选择
本文采用 YOLOv5 作为核心检测算法,其优点包括:
- 高精度与高速度兼顾
- 轻量化结构,便于部署
- 对小目标检测性能较好
YOLOv5 的结构主要分为:
- Backbone:CSPDarknet,用于提取图像特征
- Neck:FPN + PAN,用于多尺度特征融合
- Head:预测边界框位置、类别与置信度
3.2 数据预处理与增强
为了提升模型的泛化能力,采用以下数据增强策略:
- Mosaic 增强:随机将四张图像拼接为一张,提高目标多样性
- 随机翻转:水平、垂直翻转
- 颜色扰动:调整 HSV 色彩空间参数
- 随机缩放与裁剪:模拟不同距离与视角
3.3 模型训练参数
- 输入尺寸:640×640
- Batch size:16
- 优化器:SGD(momentum=0.937, weight_decay=0.0005)
- 初始学习率:0.01(采用余弦退火调度)
- 训练轮数:150 epoch
- 损失函数:GIoU Loss + BCE Loss(分类与置信度)
4. 实验与结果
4.1 实验环境
- 操作系统:Ubuntu 20.04
- GPU:NVIDIA RTX 4090
- 框架:PyTorch 1.13 + YOLOv5 7.0
4.2 评估指标
- Precision(P):预测为正的样本中实际为正的比例
- Recall(R):实际为正的样本中被预测为正的比例
- mAP@0.5:IoU 阈值为 0.5 时的平均精度
- mAP@0.5:0.95:多个 IoU 阈值下的平均精度
4.3 实验结果
| 指标 | 值 |
|---|---|
| Precision | 0.912 |
| Recall | 0.884 |
| mAP@0.5 | 0.927 |
| mAP@0.5:0.95 | 0.732 |
模型在多类别、多背景下均取得了较好的检测性能。
4.4 可视化结果
检测可视化图表明,模型能在杂乱背景下准确框出不同中药材目标,并在同一图像中识别多种类别。
5. 分析与讨论
5.1 模型表现
- 对样本数量较多的类别(如
gouteng,jingjie,baimaogen)检测精度更高 - 对样本稀少的类别(如
duzhong,qingpi,tufuling)存在一定漏检情况 - 小尺寸目标在背景复杂时偶有漏检
5.2 误差来源
- 类别间相似性高(如
jixueteng与daxueteng) - 光照和拍摄角度差异大
- 样本数量不平衡导致模型偏向高频类别
5.3 改进方向
- 采用类别平衡策略(如 Focal Loss、过采样)改善少数类别检测
- 引入注意力机制(如 CBAM、SE)增强特征表达
- 针对小目标增加高分辨率特征层
6. 结论
本文利用 YOLOv5 对 40 类中药材进行了多目标检测实验,验证了深度学习技术在复杂背景、多类别药材识别中的可行性与高效性。未来的工作可进一步优化模型结构,并结合嵌入式设备,实现中药材的自动化分拣与实时检测应用。
545

被折叠的 条评论
为什么被折叠?



