用 Python 的 Darts 库玩转时间序列预测：从入门到实战

萧鼎

于 2025-04-14 11:11:41 发布

阅读量796

点赞数 22

分类专栏： python基础到进阶教程文章标签： python 开发语言

本文链接：https://blog.youkuaiyun.com/liaoqingjian/article/details/147213412

版权

python基础到进阶教程专栏收录该内容

183 篇文章

订阅专栏

在人工智能和数据分析领域，时间序列预测 是一个极其重要的分支，它贯穿了金融、能源、医疗、交通、零售等多个行业。从预测股票价格、能源消耗，到销售量、疾病传播趋势，时间序列建模已成为数据科学家必须掌握的核心技能。

而在 Python 生态中，有一个优雅且功能强大的时间序列预测库正在迅速流行起来，它就是——Darts。

本文将深入解析 Darts 库的设计理念、核心组件、使用方法和典型应用案例，帮助你快速掌握这一工具并将其用于实际项目中。

什么是 Darts？
安装与基本配置
时间序列数据结构与预处理
多种模型接口：ARIMA、Prophet、RNN、Transformer 等
模型训练与评估
多变量、多步预测与反向验证
实战案例：预测电力消耗曲线
与其他时间序列工具对比
优势与局限性
总结与展望

一、什么是 Darts？

Darts 是一个 Python 时间序列分析和预测库，由 Unit8 公司开发，目标是提供一个统一、简单的接口来使用包括经典统计模型、机器学习模型和深度学习模型在内的各种时间序列方法。

“从 ARIMA 到 Transformer，只用几行代码。”——这是 Darts 的宗旨。

核心功能包括：

单变量与多变量预测
单步与多步预测（Recursive, Direct, Mixed）
时间序列的平滑、差分、归一化等预处理工具
集成多个主流模型（ARIMA、Prophet、LSTM、NBEATS、Transformer、XGBoost）
模型组合与集成
时间序列回测与评估
与 pandas/Numpy 深度集成，极易上手

二、安装与基本配置

安装 Darts

pip install u8darts[all]  # 安装所有依赖，包括深度学习模型

或者只安装核心功能：

pip install u8darts

注意：建议使用 Python 3.8+ 环境，并提前安装 PyTorch、lightgbm、xgboost 等依赖包。

导入基础模块

from darts import TimeSeries
from darts.models import NBEATSModel, ExponentialSmoothing
from darts.metrics import mape

三、时间序列数据结构与预处理

在 Darts 中，核心数据结构是 TimeSeries 对象，类似于 pandas DataFrame 但为时间序列优化。

创建一个简单序列：

import pandas as pd
from darts import TimeSeries

df = pd.read_csv("air_passengers.csv", parse_dates=["Month"])
series = TimeSeries.from_dataframe(df, "Month", "#Passengers")

常见预处理操作：

# 插值填补缺失值
series = series.interpolate()

# 平滑处理
smoothed = series.rolling(window=12)

# 归一化
from darts.dataprocessing.transformers import Scaler
scaler = Scaler()
normalized = scaler.fit_transform(series)

四、多种模型接口：从经典到深度学习

Darts 内置多种模型，统一 API：

模型类别	模型名称
统计模型	ARIMA, ExponentialSmoothing, Theta, KalmanFilter
ML 模型	RegressionModel (支持 XGBoost, LightGBM)
DL 模型	RNN, LSTM, NBEATS, Transformer, TCN, BlockRNN
外部模型	Prophet, TBATS

示例：使用 ARIMA

from darts.models import ARIMA

model = ARIMA()
model.fit(series[:-36])
forecast = model.predict(36)

使用深度模型（如 N-BEATS）

model = NBEATSModel(input_chunk_length=36, output_chunk_length=12, n_epochs=100)
model.fit(series[:-36])
forecast = model.predict(36)

五、模型训练与评估

划分训练集与测试集

train, val = series.split_before(0.8)

训练与预测

model = ExponentialSmoothing()
model.fit(train)
pred = model.predict(len(val))

评估结果

from darts.metrics import mape

error = mape(val, pred)
print(f"MAPE: {error:.2f}%")

还可以使用 RMSE、MASE、sMAPE 等指标。

六、多变量、多步预测与回测

Darts 非常适合多变量预测和多步预测，适合多特征建模。

多变量输入：

# 将多个 TimeSeries 合并为 multivariate series
combined = TimeSeries.from_dataframe(df, time_col="Date", value_cols=["Temp", "Humidity", "PowerLoad"])

多步预测策略：

Direct：为每一个未来时间点训练一个独立模型；
Recursive：一个模型递归预测；
Mixed：结合两者优点。

Darts 的模型大部分支持这三种策略，自动处理长序列预测问题。

七、实战案例：电力负荷预测

我们以电力系统的负荷曲线为例，预测未来一周的电力需求。

Step 1：加载数据

df = pd.read_csv("power_load.csv", parse_dates=["timestamp"])
series = TimeSeries.from_dataframe(df, "timestamp", "load_kw")

Step 2：训练集与测试集划分

train, val = series.split_before(pd.Timestamp("2023-06-01"))

Step 3：建立模型并训练

model = TransformerModel(input_chunk_length=48, output_chunk_length=24, n_epochs=150)
model.fit(train)

Step 4：预测与评估

forecast = model.predict(n=72)
mape_score = mape(val[:72], forecast)

Step 5：可视化结果

series.plot(label="Actual")
forecast.plot(label="Forecast")

结果曲线可以明显看出模型预测能力强，且具有平滑性。

八、与其他时间序列库对比

特性	Darts	Prophet	statsmodels	gluonts	sktime
多模型统一接口	✅	❌	❌	❌	✅
多步预测支持	✅	✅	❌	✅	✅
深度学习支持	✅	❌	❌	✅	✅
多变量支持	✅	部分	❌	✅	✅
易用性	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐	⭐⭐	⭐⭐⭐