LSTM与Prophet时间序列预测实验

最新推荐文章于 2025-10-30 21:58:18 发布

原创

最新推荐文章于 2025-10-30 21:58:18 发布 · 置顶 · 2.4k 阅读

28 ·

CC 4.0 BY-SA版权

本文是关于使用LSTM网络与Facebook的Prophet工具进行时间序列预测的对比实验。实验数据来源于维基百科美国橄榄球运动员佩顿·曼宁的日访问量记录。在Pytorch中构建的LSTM模型进行两天预测一天的实验，Prophet则展示了其时间序列分解和机器学习拟合的能力。结果显示LSTM预测效果较好，但Prophet能预测更长时间范围，且实验指出LSTM进行多步预测可能涉及复杂的seq2seq模型。

LSTM与Prophet时间序列预测实验

原文在个人博客
 LSTM与Prophet时间序列预测实验 - BraveY的文章 - 知乎
分别使用Pytorch构建的LSTM网络与Facebook开源的Prophet工具对时间序列进行预测的一个对比小实验，同时作为一个小白也借着这个实验来学习下Pytorch的使用，因为第一次使用，所以会比较详细的注释代码。

使用的数据为了与Prophet进行对比，因此使用了Prophet官网例子上用到的数据集。该时间序列数据集来自维基百科上面对美国橄榄球运动员佩顿·曼宁（Peyton Williams Manning）的日访问量的记录日志，时间跨度为2007年12月10号到2016年1月20号共2905条数据。

Jupyter代码与数据集地址在我的github上，欢迎star。

LSTM

LSTM的介绍参考夕小瑶与陈诚的介绍，代码主要参考凌空的桨与源码链接，在Pytorch1.3.1的版本上面改了一下，主要是测试的逻辑修改成了使用测试集以及取消了Variable的使用。整体的逻辑是使用前面的两天的数据来预测下一天的数据，网络的结构是使用了两层LSTM与一层线性回归层。

数据预处理

首先是数据的预处理代码如下：

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import torch 
from torch import nn

#数据预处理
data = pd.read_csv('example_wp_log_peyton_manning.csv',usecols=[1])
data = data.dropna() #丢弃空值
dataset = data.values
dataset = dataset.astype('float32')

max_value = np.max(dataset)
min_value = np.min(dataset)
scalar = max_value - min_value
dataset = list(map(lambda x: x/scalar, dataset)) #将数据归一化到0~1之间

#划分数据集
#通过前面几条的数据来预测下一条的数据，look_back设置具体的把前面几条的数据作为预测的输入data_X，而输出就是下一条data_Y
def create_dataset(dataset,look_back=2): # 每个的滑动窗口设置为2
    dataX, dataY=[], []
    for i in range(len(dataset)-look_back):
        a=dataset[i:(i+look_back)]
        dataX.append(a)    # 记录窗口的值
        dataY.append(dataset[i+look_back]) # 记录除了前面两个以外的所有值作为正确的标签
    return np.array(dataX