2023 南京大学
论文地址:https://arxiv.org/pdf/2304.05206v1.pdf
1. 简介
多元时间序列预测问题中,从多变量建模方法的维度有两种类型,一种是独立预测(channel independent,CI),指的是把多元序列当成多个单变量预测,每个变量分别建模;另一种是联合预测(channel dependent,CD),指的是多变量一起建模,考虑各个变量之间的关系。二者的差异如下图。
2. CI 和 CD
2.1 多元时序预测MTSF(Multivariate Time Series Forecasting)
形式化定义如下:
X
∈
R
L
∗
C
=
>
Y
∈
R
H
∗
C
X \in R^{L * C} => Y \in R^{H * C}
X∈RL∗C=>Y∈RH∗C
L为历史窗口个数,C为变量个数或channel个数,H为预测的窗口个数(forecast horizon)
2.2 CD (Channel Dependent Strategy)
CD策略表示建模时同时考虑多个channel或变量的历史数据,预测多个channel未来值。
2.2 CI (Channel Independent Strategy)
3. 实验
实验得到的一个核心结论是:CI方法在大多数任务上表现的更好,并且效果方差也更小。下面这张图中可以看到,CI的MAE、MSE等指标在各个数据集上基本都小于CD,同时效果的波动也更小一些。
从下面的实验结果可以看到,CI相比CD,在绝大多数预测窗口长度和数据集上,效果都是提升的
为什么CI方法在实际应用中比CD效果更好、更稳定呢?文中进行了一些理论证明,核心的结论是:真实数据往往存在Distribution Drift,而使用CI方法有助于缓解这个问题,提升模型泛化性。下面这张图,展示了各个数据集trainset和testset的ACF(自相关系数,反映了未来序列和历史序列之间的关系)随时间变化分布,可以看到Distribution Drift在各个数据集上是广泛存在的(也就是trainset的ACF和testset的ACF不同,即两者的历史与未来序列的关系不同)