TimeMixer：用于时间序列预测的可分解多尺度混合模型

原创

已于 2025-03-10 16:40:15 修改 · 2.9k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #深度学习 #时序预测

于 2025-03-10 16:34:20 首次发布

TimeMixer：用于时间序列预测的可分解多尺度混合模型

在时间序列预测领域，准确捕捉复杂的时间变化是关键挑战。本文介绍的“TimeMixer: Decomposable Multiscale Mixing for Time Series Forecasting”提出了创新的TimeMixer模型，在长短期预测任务中均展现卓越性能。

一、研究背景

时间序列预测应用广泛，但现实中的时间序列变化复杂，给预测带来困难。当前主流方法如序列分解和多周期性分析有一定效果，但仍需新的思路。研究发现时间序列在不同采样尺度下呈现不同变化模式，这为多尺度分析提供了依据，TimeMixer正是基于此提出的新模型。

二、模型架构

（一）多尺度混合架构

在这里插入图片描述

TimeMixer通过平均池化将过去观测值下采样为多个尺度，获取多尺度时间序列。假设输入的过去观测值为 $\in \mathbb{R}^{P \times C}$ ，经过平均池化后得到 $M$ 个尺度的时间序列 $\{x_0, \cdots, x_M\}$ ，其中 $xm∈R⌊P2m⌋×Cx_m \in \mathbb{R}^{\lfloor\frac{P}{2^{m}}\rfloor \times C}$ ， $\in \{0, \cdots, M\}$ ， $C$ 表示变量数。这一步的目的是将原始时间序列在不同尺度下进行表示，最低层序列 $x_0 = x$ 包含最精细的时间变化，最高层序列 $x_M$ 表示宏观变化。

然后通过嵌入层将这些多尺度序列投影为深度特征 $x^0 = Embed(X)$ 。接着，利用堆叠的Past - Decomposable - Mixing（PDM）块混合不同尺度的过去信息，对于第 $l$ 层，其输入为 $x^{l - 1}$ ，PDM的过程可形式化表示为：
$,L}x^l = PDM(X^{l - 1}), l \in \{0, \cdots, L\}$
其中 $L$ 是总层数，