-
论文链接:https://arxiv.org/pdf/2410.17159
-
代码链接:https://github.com/Levi-Ackman/LiNo
时间序列数据,作为连续时间点的数据集合,广泛存在于医疗、金融、气象、交通、能源(电力、光伏等)等多个领域。有效的时间序列预测模型能够帮助我们理解数据的动态变化,预测未来趋势,从而做出更加精准的决策。然而,时间序列数据通常包含复杂的线性和非线性模式,这些模式往往相互交织 (见下图 Fig.1),给预测模型的设计和优化带来了巨大挑战。
Fig.1 现实世界的时间序列往往是多种线性和非线性的交叠。上图中红色的序列可以被表征为其下方的两种线性和两种非线性模式的加和。
现有的模型依赖于 Autoformer 中提出的基于残差的 Trend (线性) 和 seasonal (非线性) 分解 —— 先使用一个运动平均核 (Auto/FEDformer,DLinear) 或者可学习卷积 (Leddam) 来获取 Trend 项,然后使用原始序列减去 Trend 得到 Seasonal 项。但是这样只能获取简单的线性模式,而且得到的非线性模型或者说 Seasonal 项事实上是由未充分提取的线性模型,待提取的非线性模式,以及序列中的噪声所组成的,应该被称为 Residual(残差),而不是 Seasonal。
Fig.2 LiNo 在电力数据集中最后一个变量上的预测可视化,LP 指线性预测,NP 指非线性预测。左侧的 Prediction(预测值)被划分为 General 的线性和非线性预测,中间和右侧,线性和非线性预测进一步被划分为更细致的多种模式。
Fig.3 Fig2 中用于预测各个线性和非线性分量的抽象权重的可视化。可以看到每种模式的预测权重是各有差异的。
同时,观察 Fig2&3,我们可以看到线性模式更多关注序列的长期模式,而非线性更多关注短期浮动。另外,用于预测线性和非线性的权重,以及用于预测不同线性或者不同非线性的权重之间均存在差异。因此,高效地对这些线性和非线性模式进行分离,不仅可以帮助理解时间序列内部的特质,得到更具有解释性的预测结果,还能帮助我们设计更高效更鲁棒的预测算法。
正是在这样的背景下,北京大学联合