全球时间序列预测中处理概念漂移的方法
1. 引言
在当今众多企业和行业的决策制定与战略规划中,准确的时间序列预测至关重要。预测模型通常基于历史数据进行训练,但在大多数应用场景下,数据分布并非静止不变,而是会随时间发生变化。这会使训练好的模型过时,降低预测准确性,这种现象被称为概念漂移。因此,确保训练好的模型能够在训练数据之外实现良好的泛化,并在数据分布发生变化时仍能提供准确的预测,显得尤为重要。
转移学习可用于增强模型对分布变化的鲁棒性。一般来说,转移学习是解决一个问题,并将获得的相关知识应用于解决另一个相关问题的方法。在时间序列预测领域,转移学习模型通常在大量序列上进行训练,在预测时,可对以下两种情况进行未来预测:一是模型未曾见过的新序列;二是数据分布随时间变化的训练序列。本文主要聚焦于转移学习的第二个子问题,即对用于训练模型的一组序列进行未来预测,且这些序列的数据分布并非静止不变。
传统的预测方法,如指数平滑法(ETS),能够处理常见的非平稳性,如趋势和季节性,并且在其他类型的非平稳性下也具有一定的鲁棒性。ETS 会给最近的观测值赋予更高的权重,因此能较好地适应分布变化。然而,全球预测模型(GFM)近年来在预测领域展现出了巨大潜力,它们在 M4 和 M5 预测竞赛中获胜,相比传统的单变量预测模型,能提供更准确的预测结果。与传统的单变量预测模型为每个序列单独构建模型不同,GFM 会在多个序列上构建一个单一模型,从而使模型能够学习序列间的交叉信息。通过在多个序列上构建单一模型,模型有更多的数据用于训练,并且可以采用更复杂的结构。因此,机器学习方法,如神经网络和梯度提升树,通常是全球建模的首选方法。但与 ETS 等传统预测方法不同,机器学习方法通常缺乏处理底层分布变化的内在机制。因
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



