时序数据异常检测算法简述与分类
摘要:异常检测是目前时序数据分析最成熟的应用之一,有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的日常维护。本文主要对目前主流的异常检测算法进行汇总并将其分为基于统计的异常检测、基于预测的异常检测等类别,介绍各自的优缺点并寻找适合时序数据的异常检测算法。
关键词:异常检测,时序数据分析
1 引言
异常检测是目前时序数据分析最成熟的应用之一,有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的日常维护。本文主要对目前主流的异常检测算法进行汇总并将其分为基于统计的异常检测、基于预测的异常检测等类别,介绍各自的优缺点并寻找适合时序数据的异常检测算法。
1.1 异常类型
异常大致分为三种类型:点异常、上下文异常和集合异常。它们常见的表现形式如下:
(1)点异常:离群点、孤立点、异常值;
(2)上下文异常:值无异常,但在上下文环境中呈现异常(如时序数据);
(3)集合异常:单点无异常,但子集相对于全集呈现异常;
2 异常检测算法类别
现有的异常检测算法大致可以分为以下四类:
(1)基于统计的异常检测算法:通过历史同期的数据分布来确定当前数据的合理波动范围。例如基于3σ准则的异常检测算法。
(2)基于预测的传统异