时间序列预测方法之 DeepState

最新推荐文章于 2025-02-11 20:15:51 发布

虚胖一场

最新推荐文章于 2025-02-11 20:15:51 发布

阅读量5.5k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：时间序列预测与分析文章标签：机器学习深度学习 tensorflow 神经网络

本文链接：https://blog.youkuaiyun.com/weixin_45073190/article/details/104951808

本文介绍了将深度学习与状态空间模型结合的 DeepState 方法，用于时间序列预测。DeepState 通过循环神经网络学习状态空间模型参数，兼顾大量序列的模式学习和模型可解释性。对比 DeepAR，DeepState 在理论和鲁棒性上有优势，但可能受限于线性高斯模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文链接：个人站 | 简书 | 优快云
版权声明：除特别声明外，本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

最近打算分享一些基于深度学习的时间序列预测方法。这是第二篇。

今次介绍的是 Amazon 在 NIPS 2018 上发表的文章 Deep State Space Models for Time Series Forecasting。

状态空间模型（State Space Models）起源于控制工程领域，典型的应用包括卡尔曼滤波等。时间序列分析中的一些经典方法，如 ARIMA、Holt-Winters’ 等，都可以改写成状态空间模型。状态空间模型对每个时间序列单独建模，无法利用序列之间相似的模式，因而对历史数据较少的序列往往无能为力。

DeepState 将状态空间模型与深度学习结合起来。先用循环神经网络将特征映射为状态空间模型的参数，再使用状态空间模型预测序列在每个时间步上取值的概率分布。所有的时间序列共享网络本身的参数，而每个时间序列都有独立的状态空间参数。这样一来，既能从大量的序列和特征中学习到相似的模式，又能使模型具有一定的可解释性。

Model

通常来说，状态空间模型包含一个状态转移方程和一个观测模型，前者描述了隐藏状态随时间变化的规律 $p(l_t|l_{t-1})$ ，后者概括了给定隐藏状态下观测值的条件概率分布 $p(z_t|l_t)$ ，其中隐藏状态 $l_t \in \mathbb R^L$ 。

DeepState 使用的是线性高斯状态空间模型，其状态转移方程形如¹

$l_t = F_tl_{t-1} + w_t\varepsilon_t,\qquad \varepsilon_t\sim N(0, 1)$
观测模型形如
$z_t = H_t l_t + b_t+v_t\epsilon_t, \qquad \epsilon_t\sim N(0, 1)$
其中 $F_t\in\mathbb R^{L\times L}$ 为状态转移矩阵， $w_t\in\mathbb R_+^L$ 是状态转移噪声的强度， $H_t\in\mathbb R^{1\times L}$ 和 $b_t\in\mathbb R$ 是观测模型的权重和偏置， $v_t\in\mathbb R_+$