本文属于数据增强系列综述的文章,针对《Time Series Data Augmentation for Deep Learning: A Survey》的翻译。
Time Series Data Augmentation for Deep Learning: A Survey
摘要
深度学习最近在许多时间序列分析任务中表现出色。深度神经网络的优越性能在很大程度上依赖于大量的训练数据,以避免过拟合。然而,许多现实世界时间序列应用的标记数据可能会受到限制,例如医学时间序列中的分类和AIOps中的异常检测。作为一种提高训练数据大小和质量的有效方法,数据增强对于深度学习模型在时间序列数据上的成功应用至关重要。在本文中,我们系统地回顾了时间序列的不同数据增强方法。我们提出了综述方法的分类法,然后通过强调它们的优势和局限性为这些方法提供了结构化回顾。我们还实证比较了不同任务的不同数据增强方法,包括时间序列异常检测、分类和预测。最后,我们讨论并强调了五个未来方向,以提供有用的研究指导。
1. 引言
深度学习在许多领域取得了显著的成功,包括计算机视觉(CV)、自然语言处理(NLP)和语音处理等。最近,深度学习越来越多地被用于解决时间序列相关任务,包括时间序列分类、时间序列预测和时间序列异常检测。深度学习的成功在很大程度上依赖于大量的训练数据,以避免过拟合。不幸的是,许多时间序列任务没有足够的标记数据。作为增强训练数据大小和质量的有效工具,数据增强对于深度学习模型的成功应用至关重要。数据增强的基本思想是生成覆盖未探索输入空间的合成数据集,同时保持正确的标签。数据增强已在许多应用中显示出其有效性,例如AlexNet用于ImageNet分类。
然而,对于寻找更好的数据增强方法,特别是针对时间序列数据的方法,关注较少。在这里,我们强调了时间序列数据的数据增强方法带来的一些挑战。首先,当前的数据增强方法没有充分利用时间序列数据的固有特性。时间序列数据的一个独特特性是所谓的时间依赖性。与图像数据不同,时间序列数据可以在频

本文系统回顾了时间序列数据增强方法,包括时域、频率域和时频域的增强技术,以及基于分解、统计生成模型和学习方法的高级增强策略。数据增强对于深度学习在时间序列分析任务中的成功至关重要,尤其是在有限的标记数据情况下。通过实证比较,证实了数据增强在异常检测、分类和预测任务中的有效性。未来研究方向包括时频域增强、高斯过程增强、深度生成模型的应用和不平衡类数据增强的结合策略。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



