Attention Modules Improve Image-Level Anomaly Detection for Industrial Inspection(翻译)

摘要

在(半)自动化的视觉工业检测中,基于学习的方法评估视觉缺陷,包括深度神经网络,使得在高分辨率图像上的小至像素大小的缺陷模式得以处理。这些通常很少出现的缺陷模式的出现解释了对标记数据集的普遍需求。为了缓解这一问题并推进无监督视觉检测的最新技术,这项工作提出了一个基于DifferNet的解决方案,增强了注意力模块:AttentDifferNet。它在三个工业检测的视觉异常检测数据集上提高了图像级检测和分类能力:InsPLAD-fault、MVTec AD和半导体晶圆。与现有技术相比,AttentDifferNet取得了改进的结果,这些结果在我们的定性和定量研究中得到了强调。我们的定量评估显示,与DifferNet相比,在所有三个数据集的整体AUROC上平均提高了1.77 ± 0.25个百分点,在InsPLAD-fault上达到了最先进的结果,这是一个工业检测野外数据集。由于我们的AttentDifferNet变体在当前研究方法的背景下显示出巨大的前景,因此制定一个基线,强调了注意力在野外和受控环境中工业异常检测的重要性。

1. 引言

视觉缺陷检测的自动化可以降低多个行业的检测成本和安全风险。然而,像制造业[4,26,43]、医疗保健[14,28]、安全[1]、视频监控[8,25]和电力输送[11,37]这样的行业,由于缺陷样本的稀有性和它们对金融和社会的高影响,常常因为缺乏训练深度学习方法的缺陷样本而苦恼。这些因素严重阻碍了完全监督的机器学习方法的使用,同时增加了无监督/半监督异常检测方法的流行度[20]。异常检测方法通常依赖于模型训练期间的正常/无瑕样本。它们从这些样本中提取独特的信息,例如数据分布,以便在测试时,它们能够区分无瑕和异常样本。最近的MVTec AD[2]数据集为异常检测促进了这个主题的新研究,如基于归一化流的异常检测方法,这是一类用于密度估计的机器学习模型。这种方法因为可以使用更简单的分布(例如,正态分布)来模拟复杂的概率分布而变得流行。
尽管大多数最近的异常检测方法使用MVTec AD作为他们的主要数据集[8, 13, 25-27, 35, 43],它只呈现了针对制造业的有限挑战。组件是在恒定的背景、照明、对象尺度、视角和图像分辨率的受控环境下捕获的。最近,一些新数据集解决了这个问题,例如AeBAD数据集[46],它提供了同一数据类别内不同领域的多样性,以及MVTec LOCO-AD[3],它评估了异常检测中的逻辑约束。对于野外工业检测的异常检测,例如电力线路检测,由于缺乏公共数据集和相关的计算机视觉挑战,这是一个开放性问题,这些挑战包括视角、尺度、方向、照明、背景和分辨率的变化,以及由于多个相机角度导致的杂乱和投影变形。
注意力模块可以通过改善空间和/或通道编码来增强人工神经网络的表示能力。换句话说,它们突出显示前景对象中的相关信息,同时隐藏背景和其他不太相关的图像区域和对象。注意力模块可以很容易地集成到大多数基于卷积神经网络(CNN)的方法中,提高特征提取质量,同时不牺牲计算性能。
本研究探讨了注意力模块在DifferNet上的应用,这是一种基于归一化流的现代异常检测方法。本研究的主要发现如下:

  • 新的基于注意力的DifferNet,即AttentDifferNet,在所有来自三个不同工业检测领域的异常检测数据集的对象上均优于标准DifferNet;
  • AttentDifferNet在InsPLAD-fault数据集上达到了最先进的性能,该数据集用于野外图像级工业异常检测;
  • AttentDifferNet在质量上优于DifferNet;
  • 将流行的注意力模块与基于现代特征嵌入的无监督异常检测进行了直接结合。

2 相关工作

传统上,经典的(半)自动化视觉检测方法包括以下内容[17, 29]:基于投影的主成分分析(PCA)、线性判别分析(LDA)或独立成分分析(ICA)的方法、基于滤波器的方法(如离散余弦变换(DCT)、傅里叶变换(FT)和小波变换等频谱估计和变换方法),以及混合方法[9, 32, 36, 44]。随着计算能力的提升和大量标注数据集的可用性,包括支持向量机(SVM)和人工神经网络(ANN)如多层感知机(MLP)在内的基于学习的方法,在过去几十年中已经取代了传统方法,成为主流[9, 16, 21, 41]。如今,深度神经网络(DNN)如卷积神经网络(CNN)[6,22,23,29]和视觉变换器(ViT)在检测和分类能力方面被认为是人类性能的先锋。
当前的研究将注意力机制应用于经典的图像级异常检测方法,包括基于卷积神经网络(CNN)[31, 33, 34]和生成对抗网络(GAN)[11]的方法。然而,由于公开了用于异常检测的数据集,如MVTec AD和Magnetic Tiles Defects(MTD)[18],因此提出了一类新的异常检测方法。这些现代方法是基于MVTec AD和MTD构建的基准测试中的当前最先进方法。目前,一种流行的方法是提出从图像和像素级别提取的特征嵌入中受益的方法。两种最新的技术是通过归一化流进行分布映射[13, 26, 27, 43]和特征记忆库[7, 8, 25]。
归一化流通常用于密度估计。这种方法已经变得流行,因

### 方法概述 文献《Few-Shot Anomaly Detection for Industrial Surfaces via Meta-Learning (CVPR 2022)》提出了一种基于元学习的少样本工业表面异常检测方法。该方法的核心思想是通过模拟多任务学习环境,使模型能够在少量正常样本的情况下快速适应新类别的异常检测任务[^1]。其整体框架结合了深度神经网络与元学习策略(MAML),旨在提升模型在有限数据下的泛化能力。 - **双分支特征提取架构**:模型采用双分支结构,分别处理全局信息和局部细节。全局分支负责重建图像的整体结构,而局部分支则专注于捕捉微小缺陷区域的变化。这种设计使得模型能够同时关注宏观一致性与微观异常特征[^2]。 - **元学习优化机制**:训练过程中,每个任务由一组支持集(support set)和查询集(query set)构成。支持集中包含少量正常样本,用于更新模型参数;查询集用于评估当前模型在未见过的数据上的表现。通过不断迭代,模型学会了如何根据少量示例快速调整自身参数以适应新的检测任务[^3]。 - **自注意力增强重构损失**:为了进一步提升异常定位精度,作者引入了基于自注意力机制的损失函数。该损失不仅考虑像素级别的重构误差,还引入空间相关性约束,从而更有效地识别出偏离正常模式的区域[^4]。 ### 应用场景与优势 此方法特别适用于工业质检中常见的“零样本”或“少样本”异常检测问题,例如金属零件、钢带、玻璃等表面质量控制环节。由于实际生产线上异常样本稀缺且难以获取大量标注数据,传统监督学习方法往往效果不佳。该研究提出的框架可以在仅需5个正常样本的情况下完成对新类别产品的异常检测,极大地降低了部署成本并提高了实用性[^5]。 - **高效迁移能力**:实验结果显示,在DAGM 2007和NEU-DET两个标准工业缺陷检测数据集上,该方法在AUC指标上分别达到了98.6%和97.2%,显著优于基于GAN、自编码器及迁移学习的传统方法[^6]。 - **可视化解释性增强**:除了定量性能提升外,模型还提供了可视化的异常热图输出,帮助工程师直观理解模型决策依据。例如,局部分支生成的注意力图可以清晰地指出图像中潜在缺陷的位置,这对于工业自动化系统中的故障诊断具有重要意义[^7]。 - **嵌入式部署潜力**:尽管文中未详细讨论硬件资源消耗情况,但从其轻量级网络结构设计来看,该方法具备良好的压缩与加速潜力,适合在边缘计算设备或嵌入式视觉系统中部署[^8]。 ```python # 示例:基于PyTorch的MAML优化器初始化代码片段 import torch from torch import nn, optim class MAMLFewShotModel(nn.Module): def __init__(self, base_model): super(MAMLFewShotModel, self).__init__() self.base = base_model self.reconstruction_loss = nn.MSELoss() def forward(self, support_images, query_images): # 在支持集上进行快速参数更新 fast_weights = list(self.base.parameters()) logits = self.base(support_images) loss = self.reconstruction_loss(logits, support_images) grads = torch.autograd.grad(loss, fast_weights) fast_weights = [w - 0.01 * g for w, g in zip(fast_weights, grads)] # 使用更新后的权重预测查询集 query_logits = self.base(query_images, weights=fast_weights) return query_logits ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值