利用自编码器进行时间序列中无监督可解释模式发现
1. 引言
在时间数据中进行无监督模式发现是一个重要的数据挖掘课题,在金融、生物、视频分析等众多领域都有应用。在一些应用中,模式仅作为分类特征,分类准确率是唯一标准;而在另一些应用中,模式还可用于数据分析、数据理解以及新奇或异常检测。
本文关注的是多元时间序列,其观测值是不同重复现象组合的结果,这些现象可能会重叠,例如交通视频中多辆车的活动导致的图像序列,或总功耗中多种电器的混合使用。我们的目标不是列出数据中所有重复模式及其频率,而是通过有限且未知数量的重复模式及其在数据中的出现时间来重建整个时间文档,即对多元时间序列进行解混,以恢复其如何由重复的时间结构模式分解而成。我们将时间模式称为主题(motif),将输入的多元时间序列称为时间文档。
人工神经网络(或深度学习架构)在过去十年中变得非常流行,特别是自编码器,它是一种用于学习数据压缩、分布式表示的人工神经网络,通常用于降维。由于数据的时间性质,我们的模式发现任务本质上是卷积性的,因此我们将重点放在卷积自编码器上。然而,标准卷积自编码器捕获的模式往往缺乏可解释性且存在相关性。
本文的贡献如下:
- 证明标准卷积自编码器的可解释性有限。
- 引入自适应修正线性单元(AdaReLU),使隐藏层能够清晰捕获主题的出现。
- 提出受组套索启发的正则化方法,自动选择卷积神经网络中的滤波器数量。
- 通过对合成数据和真实数据的实验,展示这些元素如何帮助恢复可解释的主题。
2. 相关工作
2.1 时间序列中的无监督模式发现
传统的无监督时间序列处理方法旨在提取序列中有趣
超级会员免费看
订阅专栏 解锁全文
1726

被折叠的 条评论
为什么被折叠?



