Combining GANs and AutoEncoders for Efficient Anomaly Detection

该论文提出了一种名为CBiGAN的新型模型,用于改善无监督异常检测。相较于传统的VAE和BiGAN,CBiGAN通过在编码器和解码器上添加正则化项解决了图像重建模糊或错位的问题。损失函数包括L1重构误差和鉴别器误差,以优化重建精度。实验表明,CBiGAN在MVTec数据集上的性能显著提高,特别是在纹理类别的检测上,与基准模型相比有超过40%的提升,且整体效果与其它网络相当或更优。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这篇论文是一个无监督的异常检测

作者他们说像VAE这样的自动编码器的生成模型会为逼真的图像生成模糊重建,而他们参考的模型BiGAN虽然将自编码器和GAN进行了结合,但是重建的样本往往是错位的,因为鉴别器只关注重建出来的图像是否像真实的,而不会保证精确地重建它,所以作者他们在BiGAN上做了改进,并提出了CBiGAN

这个模型中,首先右边输入图像x,经过编码器得到E(x),然后左边z是随机潜在变量,经过解码器得到G(z),然后就得到了两组数据,输入到鉴别器中,来判断数据是从E中产生的还是从G中产生的
在这里插入图片描述
在这里插入图片描述

然后至于两边分别加上了一个E和G,是作者加入了一个正则化项

然后下边是三个模块的损失函数,训练时交替进行优化然后A(x)是异常分数,它由两部分组成,基于像素的L1重构误差Lr(x),基于特征的鉴别器误差LfD(x),λ是一个平衡超参数
在这里插入图片描述
在这里插入图片描述

但是对于异常检测来说,BiGAN训练过程没有对E和G添加约束,导致重建的图像会有轻微的旋转,使得异常分数变高,所以作者他们在E和G上加入了正则化项Lc来使E和G对齐,这样新的损失函数就变成了这样,α用来控制权重
在这里插入图片描述

下边是他们在MVTec上的一个实验结果,这个EGBAD就是作者他们参考的那个BiGAN,然后从效果上来说,作者改进过的模型的性能在基本在每个类别上相比原来都有提升,最高提升了40%以上,而与其他网络相比,整体效果基本相当或者略微下降。而且他们的模型在纹理方面的平均性能是比较好的。
在这里插入图片描述

最后是他们的一个效果图,作者他们和他们参考的网络做了对比,左边是数据集中的有缺陷的图,然后是重建图像以及重建和原图的对比,可以看到EGBAD虽然能够重建图像,但是和原图的差距还是比较明显的,而作者他们重建的图像都比较精确
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值