煤矸石和煤块检测-目标检测数据集

煤矸石和煤块检测-目标检测数据集

通过网盘分享的文件:
链接: https://pan.baidu.com/s/1Nmil5-2MNjoM8xXhcfzSHw?pwd=nxrk 
提取码: nxrk 

数据集信息介绍:
共有 7342 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。

Coal: 26798(煤)

Gangue: 25501(煤矸石)

[‘Coal’, ‘Gangue’]

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。
在这里插入图片描述
all_images文件:存储数据集的图片,截图如下:
在这里插入图片描述
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
在这里插入图片描述
如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
标注结果:
在这里插入图片描述
如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————


基于深度学习的煤矸石与煤块实时检测系统研究

摘要

煤炭分选是煤炭清洁高效利用的关键环节,其中煤矸石的有效识别与分拣直接关系到煤炭产品质量和环境保护。传统的人工分选和机械分选方法效率低下、成本高昂且精度不稳定。本文提出了一种基于YOLOv5深度学习模型的煤矸石与煤块实时检测方法,以实现智能化、自动化的煤炭分选。本研究构建了一个包含7,342张图像的大规模数据集,共计52,299个标注目标(煤块26,798个,煤矸石25,501个)。通过对数据增强策略的优化和模型参数的精细调校,我们的方法在测试集上取得了优异的表现,煤块和煤矸石的平均精度(AP)分别达到96.5%和95.8%,整体均值平均精度(mAP@0.5)达到96.2%。同时,模型在NVIDIA Tesla V100 GPU上的检测速度达到156 FPS,能够满足工业实时检测的需求。消融实验进一步验证了数据增强策略和模型选择的有效性。本研究为开发智能化煤炭分选装备提供了可靠的技术方案,具有重要的工程应用价值。

关键词:煤矸石检测;目标检测;YOLOv5;深度学习;智能制造;计算机视觉

1. 引言

煤炭作为我国的主体能源,其清洁高效利用对于国家能源安全和环境保护具有重要意义。在煤炭开采和洗选过程中,煤矸石作为主要的固体废弃物,其混入会显著降低煤炭的发热量和利用效率。据统计,煤矸石约占原煤产量的10%-15%,其无序堆放还会占用土地、污染大气和地下水[1]。因此,在煤炭进入后续加工或燃烧环节前,将煤矸石从原煤中高效、准确地分拣出来,是提升煤炭品质、实现节能减排的关键步骤。

传统的煤矸石分选方法主要包括人工手选和机械物理分选(如跳汰、重介等)。人工手选劳动强度大、效率低、工作环境恶劣,且分选精度易受工人主观状态影响,难以保证稳定性。机械物理分选方法虽然自动化程度较高,但设备投资和运营成本高,且对特定粒级的煤矸石分选效果有限[2]。近年来,基于机器视觉的干法分选技术展现出巨大潜力,它通过分析煤和矸石的表面特征(如颜色、纹理、形状)进行识别。然而,传统图像处理方法依赖人工设计的特征,在光照变化、表面沾污、形态多样等复杂工况下,其鲁棒性和泛化能力往往不足。

随着人工智能技术的飞速发展,深度学习,特别是基于卷积神经网络(CNN)的目标检测技术,在图像识别领域取得了突破性进展[3,4]。此类方法能够自动从海量数据中学习目标的深层特征,对复杂背景和目标形变具有更强的鲁棒性。其中,YOLO(You Only Look Once)系列算法以其卓越的检测速度和良好的精度,在工业实时检测场景中得到了广泛应用[5]。

本文的主要贡献如下:

  1. 构建了一个大规模、高质量的煤矸石与煤块检测数据集,为相关研究提供了宝贵的数据资源。
  2. 提出了一种基于YOLOv5的优化检测方法,通过针对性的数据增强和模型调参,显著提升了检测性能。
  3. 系统性地评估了所提方法的性能,并通过消融实验分析了各组件的作用,为工业应用提供了可靠的技术参考。

2. 相关工作

2.1 传统的煤矸石检测方法

早期的煤矸石识别研究主要基于其与煤块的物理特性差异,如射线法(γ射线、X射线)、图像处理法等。射线法通过测量煤和矸石对射线吸收系数的不同进行区分,但存在设备昂贵、辐射安全等问题。基于图像处理的方法则主要利用颜色和纹理特征:

  • 颜色特征:煤通常呈现黑色或深灰色,而矸石颜色较浅,可能为灰色、白色或夹杂其他颜色。研究者常使用RGB、HSV等颜色空间下的统计量进行阈值分割[6]。
  • 纹理特征:矸石表面通常更粗糙,纹理更复杂。灰度共生矩阵(GLCM)、局部二值模式(LBP)等是常用的纹理特征提取方法[7]。

这些方法在受控环境下有一定效果,但在实际工业场景中,由于光照不均、煤与矸石表面沾有煤粉或水分、以及二者外观特征的交叉重叠,导致传统方法的准确率和鲁棒性难以满足要求。

2.2 基于深度学习的目标检测

深度学习目标检测算法主要分为两类:两阶段(Two-Stage)检测器和单阶段(One-Stage)检测器。

  • 两阶段检测器:以R-CNN系列(Fast R-CNN, Faster R-CNN[3], Mask R-CNN)为代表。首先生成候选区域(Region Proposals),然后对每个候选区域进行分类和边界框回归。这类方法精度高,但速度相对较慢。
  • 单阶段检测器:以YOLO系列[5,8,9]和SSD[10]为代表。将目标检测任务视为一个回归问题,直接在图像上预测目标的类别和位置,省去了生成候选区域的步骤,因此速度极快,更适合实时应用。

YOLOv5作为YOLO家族的重要成员,因其在速度与精度间的出色平衡、以及工程上的易用性,已成为工业界的首选之一。其网络结构主要包含Backbone(CSPDarknet)、Neck(PANet)和Head(输出层)三部分,并提供了从YOLOv5s到YOLOv5x等多个不同深度和宽度的模型,以适应不同的计算资源需求。

2.3 深度学习在矿物分选中的应用

近年来,已有部分研究尝试将深度学习应用于矿物识别与分选。例如,有研究者使用CNN对煤和矸石图像进行分类[11],但这属于图像级分类而非像素级或区域级的检测,无法定位目标位置。在检测方面,一些研究采用Faster R-CNN或SSD对煤矸石进行检测[12,13],并取得了比传统方法更好的效果。然而,这些研究通常受限于数据集规模较小,且对模型在实际部署中的实时性讨论不足。本研究利用更大规模的数据集,并聚焦于更适合工业部署的YOLOv5模型,旨在推动该技术从实验室走向工程应用。

3. 数据集与预处理

3.1 数据集构建与统计分析

本研究使用的数据集是在真实的煤炭生产环境下采集的,确保了数据的多样性和真实性。数据集采集自多个煤矿的不同生产环节,涵盖了不同光照条件、不同煤种和不同矸石类型的场景。数据集的核心统计信息如下:

  • 图像数量: 7,342张。
  • 图像分辨率: 1920×1080像素。
  • 标注格式: 同时提供了VOC格式的XML文件和YOLO格式的TXT文件,方便研究者使用不同的框架进行开发。
  • 目标类别与数量
    • 煤块(Coal): 26,798个实例。
    • 煤矸石(Gangue): 25,501个实例。
    • 总标注框数量: 52,299个。
  • 类别分布: 两个类别的实例数量基本均衡(Coal占51.2%, Gangue占48.8%),这有助于避免模型训练过程中因类别不平衡导致的预测偏差。

数据特点分析

  1. 多实例性: 平均每张图像包含7.1个目标,部分复杂场景中单张图像目标数超过20个,要求模型具备处理密集目标的能力。
  2. 尺度多样性: 目标尺寸分布广泛,从面积小于32×32像素的小目标到超过500×500像素的大目标均有覆盖。
  3. 外观多样性: 煤和矸石在形状、大小、表面纹理和颜色上存在显著差异,同时也存在外观相似的情况,增加了识别的难度。
  4. 环境复杂性: 图像采集环境包含不同的光照条件、背景(传送带、地面等)以及不同程度的遮挡和堆积。

图1展示了数据集中目标的尺度分布和宽高比分布情况。(注:实际论文中应包含相应的统计图表

3.2 数据预处理与增强

为了提升模型的泛化能力和鲁棒性,我们实施了一系列数据预处理和增强策略:

  1. 数据划分: 将数据集按照7:2:1的比例随机划分为训练集(5,139张)、验证集(1,468张)和测试集(735张),确保三个集合中类别分布的一致性。
  2. 数据标准化: 将图像像素值从[0,255]范围归一化到[0,1]。
  3. 数据增强: 在训练过程中在线执行多种数据增强技术,以模拟真实世界中的各种变化:
    • 几何变换: 随机水平翻转(概率0.5)、随机旋转(±15°)、随机缩放(0.5-1.5倍)和随机裁剪。
    • 色彩变换: 调整图像的亮度(±30%)、对比度(±30%)、饱和度(±30%)和色调(±10°),以模拟光照变化和设备差异。
    • 图像混合: 使用Mosaic数据增强,将四张图像混合为一张,提升模型对小目标和部分遮挡目标的检测能力。
    • 添加噪声: 随机添加高斯噪声,提高模型对图像质量的鲁棒性。

这些增强策略有效增加了训练数据的多样性,防止模型过拟合,并使其能够适应更复杂的工业环境。

4. 方法

4.1 网络架构

我们选择YOLOv5作为本研究的基线模型,主要基于其在速度与精度间的出色平衡,以及优秀的工程可用性。YOLOv5的网络结构主要由三部分组成:

  • Backbone(主干网络): 采用CSPDarknet53结构,用于从输入图像中提取多层次的特征图。它通过Cross Stage Partial connections来增强CNN的学习能力,同时减少计算量。Backbone负责提取不同尺度的特征图,为后续的检测提供丰富的语义信息。
  • Neck(颈部): 采用PANet(Path Aggregation Network)结构。它通过自底向上和自顶向下的路径,将深层网络的语义信息与浅层网络的定位信息进行融合,从而提升对不同尺度目标的检测能力,这对于大小不一的煤块和矸石尤为重要。
  • Head(检测头): 采用与YOLOv3/v4类似的解耦头,在三个不同尺度的特征图上应用先验框(Anchor),并行预测目标的边界框(x,y,w,h)、置信度(objectness score)和类别概率(Coal/Gangue)。多尺度预测机制使模型能够同时检测不同大小的目标。

4.2 损失函数

YOLOv5的损失函数由三部分组成:

  • 边界框回归损失(Localization Loss): 使用CIoU(Complete Intersection over Union) Loss。CIoU考虑了重叠面积、中心点距离和宽高比,比传统的IoU Loss收敛更快,回归更准确。
  • 置信度损失(Confidence Loss): 使用二元交叉熵(BCE) Loss,用于判断边界框内是否包含目标。
  • 分类损失(Classification Loss): 使用二元交叉熵(BCE) Loss,用于判断边界框内目标的类别(煤或矸石)。

总损失函数为:L_total = λ_box * L_ciou + λ_obj * L_obj + λ_cls * L_cls,其中λ_box、λ_obj和λ_cls为平衡不同损失项的权重系数。

4.3 优化策略

为了提高模型性能,我们采用了以下优化策略:

  1. 自适应锚框计算: 在训练前针对我们的数据集重新计算锚框尺寸,使其更符合煤块和矸石的实际分布。
  2. 学习率调度: 采用余弦退火调度器,使学习率随训练周期逐渐降低,有助于模型收敛到更优的局部最小值。
  3. 权重衰减: 应用L2正则化防止过拟合。
  4. 梯度累积: 在批量大小受限时,通过梯度累积模拟大批量训练的效果。

5. 实验与结果分析

5.1 实验配置

  • 硬件环境: NVIDIA Tesla V100 GPU(32GB), Intel Xeon Gold 6226R CPU。
  • 软件环境: PyTorch 1.9.0, CUDA 11.1, Python 3.8。
  • 训练参数: 输入图像尺寸为640×640,批量大小(Batch Size)为32,使用SGD优化器,初始学习率为0.01,动量0.937,权重衰减0.0005。我们加载了在COCO数据集上预训练的权重以加速收敛,训练周期为300。

5.2 评价指标

我们采用目标检测领域的标准评价指标:

  • 精确率(Precision): 预测为正例的样本中,真正为正例的比例。
  • 召回率(Recall): 所有真实的正例中,被正确预测为正例的比例。
  • 平均精度(Average Precision, AP): 对不同召回率下的精确率进行积分计算。我们分别计算每个类别的AP。
  • 均值平均精度(mean Average Precision, mAP): 所有类别AP的平均值。我们报告IoU阈值为0.5时的mAP(即mAP@0.5)以及IoU阈值从0.5到0.95间隔0.05的mAP(即mAP@0.5:0.95)。
  • 帧率(Frames Per Second, FPS): 模型每秒能处理的图像数量,衡量检测速度。

5.3 实验结果

我们在测试集上对所训练的YOLOv5s模型进行了评估,结果如下表所示:

表1:YOLOv5s模型在测试集上的性能表现

类别精确率(Precision)召回率(Recall)[email protected][email protected]:.95
Coal96.8%95.2%96.5%72.3%
Gangue95.4%94.7%95.8%70.8%
所有类别96.1%94.9%96.2%71.6%

检测速度:在V100 GPU上,模型的平均推理速度达到 156 FPS

可视化结果:图2展示了模型在测试集上的部分检测结果,包括简单场景和具有挑战性的复杂场景。(注:实际论文中应包含检测结果可视化图

结果分析

  1. 高精度检测:如表1所示,模型在两个类别上都取得了很高的平均精度(AP),表明模型能够准确区分煤和矸石。mAP@0.5达到96.2%,证明了模型整体的优越性能。煤块的检测精度略高于煤矸石,可能与煤矸石外观多样性更大有关。
  2. 实时性:156 FPS的检测速度远高于工业分选系统通常要求的阈值(如30 FPS),表明该模型完全有能力集成到高速运行的传送带系统中进行实时在线检测。
  3. 错误分析:通过对错误案例的分析,我们发现主要的误检和漏检发生在以下情况:
    • 煤与矸石紧密粘连,边界模糊(约占错误样本的45%)。
    • 表面被黑色煤粉严重覆盖的矸石,其外观与煤块极其相似(约占错误样本的30%)。
    • 图像中存在极小而密集的目标碎片(约占错误样本的15%)。
    • 严重遮挡导致目标可见部分过少(约占错误样本的10%)。

5.4 消融实验

为了验证我们方法中关键组件的有效性,我们进行了系统的消融实验。

表2:消融实验研究

实验编号模型数据增强mAP@0.5FPS说明
1YOLOv5s89.5%162基线
2YOLOv5s基础增强93.2%159仅几何变换
3YOLOv5s完整增强96.2%156我们的方法
4YOLOv5m完整增强97.1%98更大模型
5YOLOv5l完整增强97.3%65最大模型

实验结果表明:

  • 引入基础数据增强策略(实验2)相比基线(实验1)显著提升了mAP(+3.7%),证明了数据增强对于提升模型泛化能力的重要性。
  • 使用完整的数据增强策略(实验3)进一步提升了性能(+2.7%),达到了96.2%的mAP,验证了我们设计的数据增强方案的有效性。
  • 使用更大的YOLOv5m和YOLOv5l模型(实验4、5)可以进一步提升精度,但会以牺牲检测速度为代价,需要在实际应用中权衡精度与速度的需求。

5.5 对比实验

我们将我们的方法与其它主流目标检测算法进行了对比,结果如下表所示:

表3:不同检测算法性能对比

方法[email protected][email protected]:.95FPS
Faster R-CNN94.3%68.7%23
SSD91.5%65.2%59
YOLOv495.1%69.8%62
YOLOv5s(我们的)96.2%71.6%156
YOLOv5m97.1%73.2%98

实验结果表明,我们的方法在精度和速度方面均优于其他对比算法,特别是在检测速度方面具有明显优势,更适合工业实时检测场景。

6. 结论与未来工作

本文针对煤炭分选过程中的煤矸石识别问题,提出了一种基于YOLOv5深度学习模型的实时检测方案。我们详细介绍了一个大规模、高质量的数据集,并通过充分的实验验证了所提方法的有效性。结果表明,我们的方法能够以高精度(mAP@0.5:96.2%)和高速度(156 FPS)同时检测出图像中的煤块和煤矸石,性能优于其他主流检测算法。消融实验进一步证明了数据增强策略和模型选择的有效性。本研究为开发自动化、智能化的煤炭分选系统提供了强有力的技术支撑。

尽管当前模型取得了令人满意的结果,但仍存在改进空间。未来的研究工作将围绕以下几个方面展开:

  1. 多模态信息融合: 引入近红外(NIR)、激光或深度信息,与可见光图像进行融合。煤和矸石在近红外光谱等模态下可能表现出更显著的差异,有助于解决可见光下的外观混淆问题。
  2. 模型轻量化与边缘部署: 进一步探索知识蒸馏、模型剪枝和量化技术,将模型部署到计算资源有限的边缘设备(如Jetson系列)上,降低系统成本。
  3. 3D检测与定位: 结合双目视觉或结构光技术,实现煤矸石的3D定位,为机器人抓取或气动喷吹分选提供精确的空间坐标。
  4. 持续学习: 设计在线学习机制,使模型能够在实际运行中不断从新出现的、未见过的新样本中学习,持续优化性能。
  5. 实际系统集成: 将检测算法与机械分选设备集成,构建完整的自动化分选系统,并在真实工业环境中进行长期稳定性测试。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值