【论文阅读】The Capacity and Robustness Trade-off: Revisiting the Channel Independent Strategy for Multiva

文章对比了多元时间序列预测中的CI(独立预测)和CD(联合预测)方法。实验显示CI在多数任务上表现出更好的性能和稳定性,其原因是CI能有效缓解DistributionDrift问题,增强模型的泛化能力。CI方法的MAE和MSE指标通常低于CD,并且效果波动较小。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
2023 南京大学
论文地址:https://arxiv.org/pdf/2304.05206v1.pdf

1. 简介

多元时间序列预测问题中,从多变量建模方法的维度有两种类型,一种是独立预测(channel independent,CI),指的是把多元序列当成多个单变量预测,每个变量分别建模;另一种是联合预测(channel dependent,CD),指的是多变量一起建模,考虑各个变量之间的关系。二者的差异如下图。
在这里插入图片描述

2. CI 和 CD

2.1 多元时序预测MTSF(Multivariate Time Series Forecasting)

形式化定义如下:
X ∈ R L ∗ C = > Y ∈ R H ∗ C X \in R^{L * C} => Y \in R^{H * C} XRLC=>YRHC
L为历史窗口个数,C为变量个数或channel个数,H为预测的窗口个数(forecast horizon)

2.2 CD (Channel Dependent Strategy)

CD策略表示建模时同时考虑多个channel或变量的历史数据,预测多个channel未来值。
在这里插入图片描述

2.2 CI (Channel Independent Strategy)

在这里插入图片描述

3. 实验

实验得到的一个核心结论是:CI方法在大多数任务上表现的更好,并且效果方差也更小。下面这张图中可以看到,CI的MAE、MSE等指标在各个数据集上基本都小于CD,同时效果的波动也更小一些。
在这里插入图片描述
从下面的实验结果可以看到,CI相比CD,在绝大多数预测窗口长度和数据集上,效果都是提升的
在这里插入图片描述
在这里插入图片描述
为什么CI方法在实际应用中比CD效果更好、更稳定呢?文中进行了一些理论证明,核心的结论是:真实数据往往存在Distribution Drift,而使用CI方法有助于缓解这个问题,提升模型泛化性。下面这张图,展示了各个数据集trainset和testset的ACF(自相关系数,反映了未来序列和历史序列之间的关系)随时间变化分布,可以看到Distribution Drift在各个数据集上是广泛存在的(也就是trainset的ACF和testset的ACF不同,即两者的历史与未来序列的关系不同)
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值