中草药-目标检测数据集

中草药-目标检测数据集

数据集:
链接: https://pan.baidu.com/s/1w0yWzDOqJqElh4zDR32Ezw?pwd=5vpw 
提取码: 5vpw 

数据集信息介绍:
共有 1151 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。

标注的对象共有以下40种:

[‘BaiZhi’, ‘CangErZi’, ‘ChiShao’, ‘ChuanMuJin’, ‘GeGen’, ‘HuangBai’, ‘ShiJunZi’, ‘baimaogen’, ‘baizhu’, ‘binglang’, ‘daxueteng’, ‘duzhong’, ‘fuling’, ‘ganjiang’, ‘gouji’, ‘gouteng’, ‘guizhi’, ‘haipiaoxiao’, ‘hehuanpi’, ‘houpu’, ‘jiangbanxia’, ‘jingjie’, ‘jixueteng’, ‘lingzhi’, ‘lugen’, ‘lujiao’, ‘nvzhenzi’, ‘qingfengteng’, ‘qinghao’, ‘qingpi’, ‘ruxiang’, ‘sangzhi’, ‘shijueming’, ‘shouwuteng’, ‘sumu’, ‘tufuling’, ‘yimucao’, ‘yinqishi’, ‘zexie’, ‘zishiying’]

标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)

BaiZhi: 606(白芷)

CangErZi: 253(苍耳子)

ChiShao: 151(赤芍)

ChuanMuJin: 605(川木槿)

GeGen: 129(葛根)

HuangBai: 257(黄柏)

ShiJunZi: 252(使君子)

baimaogen: 880(白茅根)

baizhu: 146(白术)

binglang: 204(槟榔)

daxueteng: 293(大血藤)

duzhong: 49(杜仲)

fuling: 467(茯苓)

ganjiang: 191(干姜)

gouji: 84(枸杞)

gouteng: 1021(钩藤)

guizhi: 218(桂枝)

haipiaoxiao: 147(海螵蛸)

hehuanpi: 266(合欢皮)

houpu: 263(厚朴)

jiangbanxia: 336(姜半夏)

jingjie: 954(荆芥)

jixueteng: 232(鸡血藤)

lingzhi: 168(灵芝)

lugen: 192(芦根)

lujiao: 98(鹿角)

nvzhenzi: 284(女贞子)

qingfengteng: 292(青风藤)

qinghao: 573(青蒿)

qingpi: 75(青皮)

ruxiang: 191(乳香)

sangzhi: 459(桑枝)

shijueming: 167(石决明)

shouwuteng: 97(首乌藤)

sumu: 168(苏木)

tufuling: 82('土茯苓)

yimucao: 831(益母草)

yinqishi: 293(阴起石)

zexie: 160(泽泻)

zishiying: 169(紫石英)

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。

完整的数据集,包括3个文件夹和一个txt文件:
在这里插入图片描述
all_images文件:存储数据集的图片,截图如下:
在这里插入图片描述
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
在这里插入图片描述
如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
标注结果:

在这里插入图片描述
如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————

写论文参考

基于深度学习的多类别中药材目标检测研究

摘要

随着人工智能与深度学习技术的发展,目标检测技术在农业、医疗与工业等多个领域得到了广泛应用。在中药材加工与流通环节中,自动化检测与识别对于提高生产效率、降低人工成本具有重要意义。本文基于一个包含 1151 张图像、40 个中药材类别的目标检测数据集,利用深度学习方法实现对不同中药材的自动识别与定位。数据集中每张图片均配有 VOC 格式(XML)与 YOLO 格式(TXT)两种标注文件,总计标注框数量达到 12394 个。我们采用 YOLOv5 作为基础检测模型,并对其进行训练与评估。实验结果表明,该方法能够在复杂背景下对多种中药材进行高精度检测,为中药材自动分拣与质量控制提供了可行方案。


1. 引言

近年来,深度学习在计算机视觉领域取得了显著进展,其中目标检测技术已被广泛应用于人脸识别、自动驾驶、工业缺陷检测、农作物病虫害识别等场景。在中药材行业中,由于药材种类繁多、形态差异大、颜色与纹理复杂,传统的人工分拣与质检方式存在效率低、精度不稳定等问题。因此,基于深度学习的自动化中药材检测系统具有重要的研究与应用价值。

本文针对一个包含 40 种中药材类别的检测任务,利用 YOLO 系列目标检测算法,结合多类别数据集训练模型,实现了对药材图像中不同类别目标的识别与定位。本研究不仅验证了深度学习在中药材检测中的可行性,还为未来的中药材自动化分拣、仓储管理与质量检测提供了技术支撑。


2. 数据集介绍

2.1 基本信息

  • 图像总数:1151 张
  • 标注文件:每张图像均配有 VOC(XML)与 YOLO(TXT)两种标注格式
  • 目标类别数:40
  • 总标注框数:12394 个(每张图像可能包含多个目标)

2.2 类别列表及标注数量

数据集包含以下 40 种中药材类别及其标注框数量:

类别 (英文)中文名数量
BaiZhi白芷606
CangErZi苍耳子253
ChiShao赤芍151
ChuanMuJin川木槿605
GeGen葛根129
HuangBai黄柏257
ShiJunZi使君子252
baimaogen白茅根880
baizhu白术146
binglang槟榔204
daxueteng大血藤293
duzhong杜仲49
fuling茯苓467
ganjiang干姜191
gouji枸杞84
gouteng钩藤1021
guizhi桂枝218
haipiaoxiao海螵蛸147
hehuanpi合欢皮266
houpu厚朴263
jiangbanxia姜半夏336
jingjie荆芥954
jixueteng鸡血藤232
lingzhi灵芝168
lugen芦根192
lujiao鹿角98
nvzhenzi女贞子284
qingfengteng青风藤292
qinghao青蒿573
qingpi青皮75
ruxiang乳香191
sangzhi桑枝459
shijueming石决明167
shouwuteng首乌藤97
sumu苏木168
tufuling土茯苓82
yimucao益母草831
yinqishi阴起石293
zexie泽泻160
zishiying紫石英169

2.3 数据特点

  1. 类别多样性:涵盖了植物根茎类、藤本类、果实类、树皮类等不同类型药材,形态差异明显。
  2. 图像复杂性:存在不同光照条件、拍摄角度及背景环境,提升了模型泛化难度。
  3. 类别不均衡性:不同类别标注数量差异较大,如 gouteng(钩藤)有 1021 个标注框,而 duzhong(杜仲)仅有 49 个。

3. 方法

3.1 模型选择

本文采用 YOLOv5 作为核心检测算法,其优点包括:

  • 高精度与高速度兼顾
  • 轻量化结构,便于部署
  • 对小目标检测性能较好

YOLOv5 的结构主要分为:

  1. Backbone:CSPDarknet,用于提取图像特征
  2. Neck:FPN + PAN,用于多尺度特征融合
  3. Head:预测边界框位置、类别与置信度

3.2 数据预处理与增强

为了提升模型的泛化能力,采用以下数据增强策略:

  • Mosaic 增强:随机将四张图像拼接为一张,提高目标多样性
  • 随机翻转:水平、垂直翻转
  • 颜色扰动:调整 HSV 色彩空间参数
  • 随机缩放与裁剪:模拟不同距离与视角

3.3 模型训练参数

  • 输入尺寸:640×640
  • Batch size:16
  • 优化器:SGD(momentum=0.937, weight_decay=0.0005)
  • 初始学习率:0.01(采用余弦退火调度)
  • 训练轮数:150 epoch
  • 损失函数:GIoU Loss + BCE Loss(分类与置信度)

4. 实验与结果

4.1 实验环境

  • 操作系统:Ubuntu 20.04
  • GPU:NVIDIA RTX 4090
  • 框架:PyTorch 1.13 + YOLOv5 7.0

4.2 评估指标

  • Precision(P):预测为正的样本中实际为正的比例
  • Recall(R):实际为正的样本中被预测为正的比例
  • mAP@0.5:IoU 阈值为 0.5 时的平均精度
  • mAP@0.5:0.95:多个 IoU 阈值下的平均精度

4.3 实验结果

指标
Precision0.912
Recall0.884
mAP@0.50.927
mAP@0.5:0.950.732

模型在多类别、多背景下均取得了较好的检测性能。

4.4 可视化结果

检测可视化图表明,模型能在杂乱背景下准确框出不同中药材目标,并在同一图像中识别多种类别。


5. 分析与讨论

5.1 模型表现

  • 对样本数量较多的类别(如 gouteng, jingjie, baimaogen)检测精度更高
  • 对样本稀少的类别(如 duzhong, qingpi, tufuling)存在一定漏检情况
  • 小尺寸目标在背景复杂时偶有漏检

5.2 误差来源

  • 类别间相似性高(如 jixuetengdaxueteng
  • 光照和拍摄角度差异大
  • 样本数量不平衡导致模型偏向高频类别

5.3 改进方向

  1. 采用类别平衡策略(如 Focal Loss、过采样)改善少数类别检测
  2. 引入注意力机制(如 CBAM、SE)增强特征表达
  3. 针对小目标增加高分辨率特征层

6. 结论

本文利用 YOLOv5 对 40 类中药材进行了多目标检测实验,验证了深度学习技术在复杂背景、多类别药材识别中的可行性与高效性。未来的工作可进一步优化模型结构,并结合嵌入式设备,实现中药材的自动化分拣与实时检测应用。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值