Self-Supervised Anomaly Detection A Survey and Outlook

原创已于 2023-06-08 10:21:08 修改 · 1.1k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能 #深度学习

于 2022-08-29 15:50:31 首次发布

Survey Paper 同时被 3 个专栏收录

278 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

Graph Neural Network

25 篇文章

订阅专栏

Anomaly Detection

9 篇文章

订阅专栏

本文是异常检测综述的另一篇文章，针对《Self-Supervised Anomaly Detection: A Survey and Outlook》进行翻译。

摘要

在过去几年中，异常检测是机器学习的一个子领域，主要关注罕见事件的检测，随着深度学习模型的空前增长，异常检测得到了极大的改进。
最近，自监督学习的出现引发了新的异常检测算法的发展，其精度大大超过了最先进的水平。本文旨在回顾自监督异常检测的现有方法。我们介绍了常用方法的技术细节，并讨论了它们的优缺点。我们还将这些模型的性能与其他最先进的异常检测模型进行了比较。最后，我们讨论了改进现有算法的各种新方向。

1. 引言

异常检测（AD）的任务是识别与大多数数据显著不同的样本，并经常表现成不规则、虚假、罕见或欺诈性观察的信号。在文献中，也使用了其他术语，如异常值、新颖性、分布外和偏差，而不是异常。异常检测在训练期间无法定义所有现有类的情况下特别有用。这使得AD算法可用于广泛的应用，包括但不限于网络安全中的入侵检测、金融和电信中的欺诈检测、声学新颖性检测、股票市场分析、地球科学领域中的事件检测、物理学、天文学，医学诊断和疾病检测、生物信息学和遗传学。
在过去的几十年里，为异常检测开发了一系列机器学习模型。核密度估计（KDE）、一类支持向量机（OCSVM）和孤立森林（IF）是异常检测中流行的经典（非深度）方法。这些算法仍然广泛用于解决异常检测任务，但在高维问题中其精度会下降。
近年来，深度模型已变得流行，并在大范围的应用中得到广泛应用。这些方法可以显著优于传统的基于非深度学习的算法，并在诸如对象识别和机器翻译等任务实现近乎人类水平的准确度。深度模型的一个关键优势在于，它们能够从原始数据中自动学习低维表示。因此，它们通常用于代替传统机器学习框架中使用的手动特征提取过程。
基于深度学习的AD模型可以大致分为三类