ANOMALY DETECTION IN UNIVARIATE TIME-SERIES: A SURVEY ON THE STATE-OF-THE-ART
- 异常:偏离整个数据集的正态分布的数据点
异常和离群值
- 一方面,异常值和离群值等价;(本文认为两者是可交换的)
- 另一方面,有一些定义将异常值视为一个更广泛的概念,除了异常还包括噪声;
- 其他人认为离群值是数据中的损坏,而异常是不规则的点,但有特定的模式
异常的类型
- 点异常:如果一个点与其他数据明显偏离,则被认为是点异常
- 集体异常:有个别点没有异常,但一系列点被标记为异常的情况
- 上下文异常:某些点在特定的上下文中可以是正常的,而在另一个上下文中则被检测为异常
时序模式
- 趋势:时间序列的平均值不是恒定的,随着时间的推移而增加或减少
- 季节性
- 周期
- 水平:时间序列水平等于该序列的平均值
- 平稳性
- 均值恒定,时间序列不存在趋势性。
- 时间序列具有恒定的方差。
- 随着时间的推移,存在一个恒定的自相关。
- 时间序列不具有季节性,即不存在周期性波动。
- 噪声