原文首发在公众号 AI天天用,欢迎关注,共同进步。
应朋友所托,复现Informer代码。没想到后来还吃到瓜了。如果您也有需要复现的文章(ns子刊,顶刊顶会为主),麻烦您关注公众号留言。
Informer是2021年AAAI会议的最佳论文,用于处理长时间序列预测。 由于发表时间较早,当前一些比较简单高效的命令尚未出现。 此外,原代码中涉及巨多的参数设置,对于理解代码而言非常不容易。 基于此,可复现Informer的代码,以便更好地理解文章。 这篇博文先复现数据部分。
Informer论文
原始代码地址: https://github.com/zhouhaoyi/Informer2020/tree/main
部分参数说明(大概40多个):
部分参数说明
原始代码中,数据部分主要涉及3个文件,data/loader_loader.py
,exp/exp_informer.py
, 以及utils/timefeatures.py
。对于初学者而言,大量的参数以及数据处理的复杂性可能已吓退了不少同学。而将关于数据的代码放在不同的文件夹下,也增加了复现和理解数据处理和加载的难度。
我们以ETTh1.csv
文件为例,重写数据部分代码。 首先,设置所有数据存储的主文件夹,一般命名为datasets
或data
等。
dataroot = "informer/datasets" # 数据文件夹路径
datafile = "ETTh1.csv" # 文件名
根据数据文件夹和数据名,即可读取数据
df = pd.read_csv(os.path.join(dataroot, datafile), parse_dates=[0], index_col=0)
df.head()
数据首行
数据尾行</