时间序列的无监督学习方法
1. 时间序列无监督学习概述
时间序列与其他类型数据的主要区别在于对时间轴的依赖,同一相关结构在不同时间点可能包含截然不同的信息。而且,时间序列通常包含大量噪声且具有高维度。
为了减少噪声和降低维度,可以采用降维、小波分析或信号处理技术,如滤波(例如傅里叶分解)。这些技术常是异常检测和变化点检测的基础。
1.1 异常和变化点示例
- 温室气体排放与全球变暖 :在相关研究中,分析了基于社会动态的温室气体排放变化如何使各国转变为碳中和社会。研究预测了不同情景下的全球变暖情况,在2010年和2020年代初左右存在转折点(即变化点)。
- 工业革命与全球气温 :全球气温在冰河期和温暖期之间循环,每个周期约数万年。但自工业革命开始,由于大量燃烧化石燃料,全球气温上升了约1°C,因此工业革命开始可视为全球气温的一个变化点。
对于人类而言,在拥有完整历史数据时,识别变化点或异常相对容易,但自动检测则有多种不同方法。在实际应用中,需谨慎平衡检测率和误报率。
2. 异常检测
异常检测旨在识别与序列其余部分显著不同的序列。异常或离群值有时可能是测量误差或噪声的结果,但也可能表明被观察系统的行为发生了变化,可能需要紧急处理。
2.1 异常的定义
根据D.M. Hawkins的定义,离群值是与其他观测值显著偏离的数据点,可能由不同机制生成。
超级会员免费看
订阅专栏 解锁全文
3200

被折叠的 条评论
为什么被折叠?



