缺陷检测公开数据集大全

本文综述了多个工业领域的光学检测数据集,包括光学缺陷、轧钢表面、油污硅钢、磁砖、PCB、面料、布匹与铝型材瑕疵,以及铁路和道路裂缝数据。重点介绍了弱标签数据集的挑战与应用,以及深度学习在解决这些任务中的关键作用。

一、弱监督学习下的工业光学检测(DAGM 2007)

数据下载链接:https://hci.iwr.uni-heidelberg.de/node/3616

数据集简介:

  •  主要针对纹理背景上的杂项缺陷。

  •  较弱监督的训练数据。

  •  包含十个数据集,前六个为训练数据集,后四个为测试数据集。

  • 每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像。每个数据集由不同的纹理模型和缺陷模型生成。

  • “无缺陷”图像显示的背景纹理没有缺陷,“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。

  • 所有数据集已随机分为大小相等的训练和测试子数据集。

  •  弱标签以椭圆形表示,大致表示缺陷区域。         

注意:这里需要注册申请下才可以下载数据~

二、轧钢表面缺陷数据库

数据下载链接:http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html

图片

数据集介绍:

由东北大学(NEU)发布的表面缺陷数据库,收集了热轧钢带的六种典型表面缺陷,即轧制氧化皮(RS),斑块(Pa),开裂(Cr),点蚀表面( PS),内含物(In)和划痕(Sc)。该数据库包括1,800个灰度图像:六种不同类型的典型表面缺陷,每一类缺陷包含300个样本。对于缺陷检测任务,数据集提供了注释,指示每个图像中缺陷的类别和位置。对于每个缺陷,黄色框是指示其位置的边框,绿色标签是类别分数。

电力设备缺陷检测数据集 一、基础信息 • 数据集名称:电力设备缺陷检测数据集 • 图片数量: 训练集:1100张图片 验证集:312张图片 测试集:160张图片 总计:1572张实际场景图片 • 训练集:1100张图片 • 验证集:312张图片 • 测试集:160张图片 • 总计:1572张实际场景图片 • 分类类别:26个电力设备状态类别(涵盖绝缘子破损、电缆损伤、设备老化等多种缺陷类型) • 标注格式:YOLO格式,支持目标检测和实例分割任务 • 数据特性:真实电力场景采集,包含复杂环境下的设备状态变化 二、适用场景 1. 电力设备智能巡检系统开发: 支持构建自动识别电力设备缺陷的AI模型,应用于输电线路、变电站等场景的智能巡检。 1. 设备安全预警平台建设: 集成至电力监控系统,实时检测设备异常状态,预防电力事故。 1. 设备维护决策支持: 提供缺陷定位和分类能力,辅助制定精准的设备维护计划。 1. 电力行业AI研究: 支持计算机视觉在电力设备状态监测领域的算法创新和应用研究。 三、数据集优势 • 缺陷覆盖全面: 包含26类电力设备常见缺陷状态,涵盖绝缘子破损、电缆损伤等关键故障类型。 • 标注专业精准: 采用YOLO格式精细标注,每个缺陷区域都有精确的定位标识。 • 场景真实多样: 数据采集自实际电力环境,包含不同光照、角度和复杂背景场景。 • 任务适配性强: 同时支持目标检测和实例分割任务,兼容主流深度学习框架。
焊接缺陷检测是工业计算机视觉中的一个重要任务,尤其是在制造业和质量控制领域。尽管公开可用的焊接缺陷数据集相对较少,但以下是一些已知且可用于研究和开发的公开数据集: ### 常见焊接缺陷检测公开数据集 1. **Welding Defects Dataset (Ultrasonic Testing Images)** 该数据集包含用于超声波检测的焊接图像,涵盖了多种焊接缺陷类型,如气孔、夹渣、未熔合等。这些图像通常来源于工业检测设备,并以灰度图形式提供。该数据集适用于图像分类与目标检测任务。 2. **COCO-Weldx** COCO-Weldx 是在 COCO 数据集基础上扩展的焊接缺陷子集,包含标注的焊接区域和缺陷类别信息。它支持目标检测、实例分割等任务,并兼容 COCO 的标注格式,便于使用现成的目标检测框架进行训练[^2]。 3. **X-ray Welding Image Dataset** 这是一个基于 X 射线图像的焊接缺陷数据集,广泛应用于无损检测领域。该数据集包括正常焊接样本和多个缺陷类别的样本(如裂纹、气孔、未焊透等),图像分辨率较高,适合深度学习模型训练。 4. **OpenCV Extra Test Data - Welding Samples** OpenCV 官方的 extra 测试数据集中包含少量焊接图像,虽然数量有限,但可作为初步测试或演示用途。图像多为二值化或边缘提取后的结果,适合算法原型验证。 5. **Public Industrial Inspection Dataset (PIID)** 该数据集包含多个工业场景下的缺陷图像,其中也包括焊接缺陷样本。PIID 提供了统一的标注格式和划分好的训练/验证/测试集,便于复现实验结果。 6. **自建扩充数据集(参考文献2)** 在实际项目中,由于公开数据量不足(例如原始数据仅约1k张),常通过数据增强手段扩充样本,如左右倒置、上下翻转、旋转(90°、180°、270°)等方式,最终获得 5670 张样本的【扩充数据集】,显著提升了模型泛化能力[^2]。 ### 数据预处理建议 - **图像增强**:包括亮度调整、对比度增强、高斯滤波去噪等,有助于提升模型对不同光照条件的鲁棒性。 - **标准化与归一化**:将图像像素值归一化到 [0,1] 或 [-1,1] 区间,加速模型收敛。 - **标注一致性检查**:确保每张图像对应的标注文件准确无误,避免标签错误影响训练效果。 ### 示例代码(使用 PyTorch 加载图像) ```python import torch from torchvision import datasets, transforms transform = transforms.Compose([ transforms.Resize((256, 256)), transforms.ToTensor(), ]) dataset = datasets.ImageFolder(root='path/to/welding_dataset', transform=transform) dataloader = torch.utils.data.DataLoader(dataset, batch_size=32, shuffle=True) ```
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI炮灰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值