论文笔记 -- Learning Representations for Time Series Clustering

最新推荐文章于 2024-05-18 12:43:38 发布

原创

最新推荐文章于 2024-05-18 12:43:38 发布 · 3.2k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #人工智能 #数据挖掘

该研究提出了一种名为DTCR的无监督时间序列聚类模型，结合时间重建和k-means目标。DTCR使用双向扩张递归神经网络学习捕捉时间动态和多尺度特征，并通过分类任务和假样本生成增强编码器能力。实验表明DTCR在多个数据集上表现出最先进的性能，且其表示对聚类任务具有高鲁棒性和有效性。

Learning Representations for Time Series Clustering

原文： Learning Representations for Time Series Clustering (neurips.cc)

出处： NeurIPS-2019 （Neural Information Processing Systems）

摘要： 在类别信息不可用的情况下，时间序列聚类是一种基本的无监督技术。它已广泛应用于基因组数据，异常检测，以及模式识别等重要的领域。虽然基于特征的时间序列聚类方法对噪声和异常值具有鲁棒性，并且可以降低数据的维数，但它们通常依赖于领域知识来手动构建高质量的特征。seq2seq模型可以通过设计适当的学习目标，如重建和上下文预测，以无监督的方式从序列数据中学习表示。当将seq2seq应用于时间序列聚类时，获得一个有效表示序列时间动态、多尺度特征和良好聚类特性的表示仍然是一个挑战。如何最好地提高编码器的能力仍然是一个悬而未解决的问题。在本文中，我们提出了一种新的无监督时间表示学习模型，即深度时间聚类表示(DTCR)，它将时间重建和k-means目标集成到seq2seq模型中。这种方法改进了聚类结构，从而获得了特定于聚类的时间表示。此外，为了提高编码器的能力，我们提出了一种假样本生成策略和辅助分类任务。在大量的时间序列数据集上进行的实验表明，与现有的方法相比，DTCR是最先进的。可视化分析不仅显示了特定于聚类的表示的有效性，并且不会受k-means错误的影响，显示了学习过程的稳健性。