【表面缺陷检测】表面缺陷检测数据集汇总

本文汇总了16个用于表面缺陷检测的机器视觉数据集,涵盖钢铁、铝型材、磁瓦、PCB等多个领域,包括图像分类、目标检测和图像分割任务。这些数据集对于提升工业自动化生产中表面质量检测的效率和准确性至关重要。

一.导读

  在工业界,大批量的工业自动化生产过程中,用人工进行表面质量检测存在诸多弊端,例如漏检率较高、实时性较差、劳动强度大、效率低、受人工经验和主观因素的影响大。
  随着计算机技术,人工智能和数据科学的发展,以及工业界、学术界研究的深入,出现了基于机器视觉技术的表面缺陷检测技术。这种技术应用于生产环境,可以为企业降本增效,也是企业数字化转型的必由之路。基于机器视觉技术应用于企业产品表面缺陷检测,可以提高企业生产作业的效率,避免工人作业在复杂的工作环境、主观因素导致的不准确性、疲劳导致的漏检等。
  基于机器视觉技术的表面缺陷检测的应用范围很广泛,目前已在钢材、纺织、食品、包装、建材、电子、塑胶、印刷、化工等行业得到了广泛的应用。产品表面缺陷检测属于机器视觉技术的一种,就是利用计算机视觉模拟人类视觉的功能,从图像采集、图像处理、计算、输出结果、反馈结果。及时发现含有缺陷的产品,从而有效控制产品质量,还可以根据检测结果分析生产工艺中存在的某些问题,从而杜绝或减少缺陷产品的产生,提高产品良品率。

二.数据集

  本文收集整理了16个表面缺陷检测相关的数据集,并对每个数据集的特点进行了简单的介绍。

1.东北大学带钢表面缺陷数据集

数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷,每种缺陷300张,图像尺寸为200×200。数据集包括分类和目标检测两部分,不过目标检测的标注中有少量错误,需要注意。

2.谢韦尔钢铁公司带钢缺陷数据集

谢韦尔钢铁公司(Severstal)原名为切烈波维茨钢铁股份有限公司,位于沃洛格州伏尔加河上游、雷客斯克水库北部,是俄罗斯大型钢铁公司之一。该数据集中提供了4种类型的带钢表面缺陷。训练集共有12568张,测试集5506张。图像尺寸为1600×256。

3.UCI带钢缺陷数据集

UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库共有550多个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。UCI带钢缺陷数据集包含了7种带钢缺陷类型。这个数据集不是图像数据,而是带钢缺陷的28种特征数据,可用于机器学习项目。钢板缺陷的7种类型为:装饰、Z_划痕、K_划痕、污渍、肮脏、颠簸、其他故障。

4.天池铝型材表面缺陷数据集

数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

5.磁瓦缺陷数据集

中国科学院自动所一个课题组收集的数据集,是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像,并做了语义分割的标注。

6.RSDDs铁轨表面缺陷数据集

RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的"I"型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的"II"型RSDDs数据集,其中包含128个具有挑战性的图像。两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

7.印刷电路板(PCB)瑕疵数据集

这是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,老鼠咬坏,开路,短路,毛刺,杂散铜),用于检测、分类和配准任务。

8.DAGM 2007数据集

该数据集主要针对纹理背景上的杂项缺陷,为较弱监督的训练数据。包含10个数据集,前6个为训练数据集,后4个为测试数据集。每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像,每个数据集由不同的纹理模型和缺陷模型生成。“无缺陷”图像显示的背景纹理没有缺陷,“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。所有数据集已随机分为大小相等的训练和测试子数据集。弱标签以椭圆形表示,大致表示缺陷区域。

9.Kylberg 纹理数据集

在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难度大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约8000张;花色布数据约12000张。

10.KTH-TIPS 纹理图像数据集

KTH-TIPS 是一个纹理图像数据集,在不同的光照、角度和尺度下拍摄的不同材质表面纹理图片。类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共10类。

11.AITEX数据集

该数据集由7个不同织物结构的245张4096 x 256像素图像组成。数据集中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。数据集还包含所有具有缺陷的图像的分割mask,使得白色像素表示缺陷区域,其余像素为黑色。



12.水泥路面裂纹检测数据集

路面裂纹检测数据集(CrackForest数据集)是一个带注释的道路裂缝图像数据集,可用于分类、分割和检测。

13.太阳能电池板表面缺陷数据集

该数据集包含了2624张300x300的太阳能电池板缺陷图像。

14.金属表面缺陷数据集

该数据集包含399张图片,52张有缺陷的图片和347张无缺陷的图片。图片宽度500,图片高度1240到1270。

15.混凝土表面裂纹缺陷数据集

数据集包含带有和不带有裂纹的各种混凝土表面的图像。图像数据在单独的文件夹中分为负样本(无裂纹)和正样本(有裂纹)两部分,用于图像分类。每个类别有2万张图像,总共4万张图像,每张图像是227x227像素的RGB通道图像。

16.桥梁裂缝缺陷数据集

该数据集包括2000多张图片,主要用于桥梁裂缝检测。

总结

  上面介绍的数据集,部分可以用于图像分类、目标检测、图像分割,根据需要选择相应数据集进行建模研究。当然,还有一系列其他的缺陷检测数据集,由于篇幅限制,不在此文章中进行介绍。

数据集获取

关注微信公众号:AIexplore。

参考资料

[1]https://www.vicos.si/resources/kolektorsdd/
[2]https://zhuanlan.zhihu.com/p/195699093
[3]https://github.com/Eatzhy/Surface-defect-Detection-dataset
[4]https://zhuanlan.zhihu.com/p/371208491
[5]https://www.cvmart.net/dataSets
[6]https://blog.youkuaiyun.com/qq_27871973/article/details/84974231

<think>好的,我现在需要帮助用户寻找关于凸轮轴缺陷或钢类表面缺陷的ImageNet数据集。首先,我得确认用户的具体需求是什么。用户提到“ImageNet数据集中是否有凸轮轴缺陷检测或钢材表面缺陷相关的数据集”,所以核心是确认ImageNet是否包含这些特定工业缺陷的数据。 根据我的知识,ImageNet是一个大型通用图像数据库,主要用于计算机视觉研究,尤其是对象识别。它包含了超过1400万张标注图像,涵盖2万多个类别,比如动物、日常物品、场景等。但ImageNet的主要焦点是自然图像,而不是工业或专业领域的缺陷检测。 接下来,我需要验证这个信息是否准确。根据用户提供的引用内容,引用[4]提到了铝型材表面缺陷检测数据集,使用的是YOLO算法,但这是否属于ImageNet呢?引用[4]中并没有提到ImageNet,而是单独的数据集,可能属于专业领域的数据。而引用[3]讨论了工业检测方法,如涡流检测,但同样没有涉及ImageNet。 进一步思考,用户可能需要的是类似ImageNet那样的大规模数据集,但专门用于工业缺陷。因此,正确的方向应该是推荐其他专业数据集,而不是局限于ImageNet。例如,NEU Surface Defect Database、DAGM 2007、KolektorSDD等,这些可能更符合用户的需求。 另外,用户可能对如何获取或处理这些数据有疑问,所以需要提供相关资源和处理方法,比如数据增强、迁移学习等。同时,需要确保回答结构清晰,分点说明,并引用提供的资料中的相关内容,如引用[4]提到的YOLO算法应用,可以建议用户参考类似的方法来处理自己的数据集。 最后,生成相关问题时要围绕用户的需求展开,比如替代数据集、处理方法、数据增强技术等,帮助用户进一步解决问题。</think>根据现有信息分析,**ImageNet数据集中尚未明确收录凸轮轴缺陷或钢材表面缺陷的专用数据集**。ImageNet主要面向通用物体识别任务,其类别集中在自然图像(如动物、日常物品),而非工业领域的表面缺陷检测[^1][^4]。以下是具体建议和替代方案: --- ### 一、ImageNet数据集的特点与局限性 1. **通用性定位**:ImageNet包含超过1400万标注图像,涵盖2万多个类别,但核心目标为支持通用图像分类研究,缺乏针对工业缺陷的细粒度标注。 2. **工业缺陷数据稀缺性**:凸轮轴或钢材表面缺陷属于高度专业化领域,需结合具体工艺参数(如纹理、形状、电磁特性)进行标注[^3][^4]。此类数据通常由企业或研究机构私有化保存。 --- ### 二、替代数据集推荐 以下为工业表面缺陷检测的公开数据集及获取途径: | 数据集名称 | 适用场景 | 特点 | |---------------------------|--------------------------|----------------------------------------------------------------------| | NEU Surface Defect Database | 钢材表面缺陷(裂纹、夹杂等) | 包含6类缺陷共1800张灰度图像,标注清晰[^1] | | DAGM 2007 | 纺织、金属表面缺陷 | 合成数据与真实数据结合,适合算法验证 | | KolektorSDD | 工业产品表面缺陷 | 包含裂缝图像及标注,适用于小目标检测 | | 铝型材表面缺陷数据集[^4] | 金属材料表面缺陷 | 提供XML标签文件,支持YOLO等深度学习模型训练 | --- ### 三、自定义数据集的构建方法 若需针对性解决凸轮轴缺陷检测问题,可通过以下步骤构建数据集: 1. **数据采集**:使用高分辨率工业相机或涡流检测设备获取图像[^3],需覆盖不同光照、角度及缺陷类型。 2. **标注工具**:采用LabelImg、CVAT等工具标注缺陷区域,生成PASCAL VOC或COCO格式标签。 3. **数据增强**:通过旋转、噪声添加、对比度调整扩充样本量,提升模型鲁棒性。 --- ### 四、迁移学习方案 借助ImageNet预训练模型进行特征提取: ```python import torch from torchvision import models # 加载ResNet预训练模型(基于ImageNet) model = models.resnet50(pretrained=True) # 冻结卷积层参数 for param in model.parameters(): param.requires_grad = False # 替换全连接层用于缺陷分类 model.fc = torch.nn.Linear(2048, num_defect_classes) ``` 此方法可利用ImageNet的通用特征提升小样本缺陷检测精度[^4]。 ---
评论 24
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值