EVARS - GPR:应对季节性时间序列输出尺度变化的高效算法
1. 现有算法的局限性与新算法的提出
在时间序列预测领域,GP - NBC 算法存在一定局限性,它需要一定数量的新样本才能训练新模型,这可能导致在变化点出现后反应延迟。而新提出的 INTEL 算法,先利用离线数据学习模板模型,再基于此构建具有不同超参数的候选模型集,最后结合所有模型进行预测。不过,目前 INTEL 算法仅限于单变量数据,且在线阶段的可能变化需要先验假设。
2. 问题定义
我们将多变量时间序列 $D = {x_t, y_t} n$ 定义为 $n$ 个样本的序列,其中 $x_t \in R^d$ 是 $d$ 维解释变量(协变量),$y_t \in R$ 是时间步 $t$ 对应的目标值。目标值 $y_t$ 服从分布 $p_i(y|x_t)$,即依赖于协变量 $x_t$。在本文中,我们关注季节性数据,即具有一定周期长度 $n {seas}$ 的数据。目标变量 $y$ 和至少部分协变量 $X$ 都具有周期性。目标变量 $y_t$ 可分解为季节性分量 $s_t$ 和残差 $r_t$,即 $y_t = s_t + r_t$,且 $s_t \approx s_{t - k \cdot n_{seas}}$($k \in N \setminus {0}$)。协变量 $x_t$ 或其子集 $\chi_t \subseteq x_t$ 也可类似分解为 $s_{\chi,t}$ 和 $r_{\chi,t}$,即 $\chi_t = s_{\chi,t} + r_{\chi,t}$。
利用 $n_{off}$ 个样本的 $D$,可以通过交叉验证离线训练一个高斯过程回归模型 $M$