论文标题:TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods
论文链接:https://arxiv.org/pdf/2403.20150.pdf
代码链接:https://github.com/decisionintelligence/TFB
前言
五一过后读的第一篇文章,质量非常高。与以往对时序模型修补、改进类的算法论文不同,TFB这篇文章关注的是整个时间序列领域更高的层面的问题。其实从我开始写文章以来,就陆续收到私信,询问:为什么论文中SOTA的模型,放到我的数据集不work /效果不好/不如线性模型?包括我在kaggle社区也发现,几乎所有的业界时序预测竞赛,大家用XGboost类算法,而非深度学习。
这说明:不同应用领域的数据集与不同时序模型之间其实存在一个内在的Gap,本篇文章就通过对当前时序研究“不规范”、不全面的地方进行系统分析,从数据集、对比方法、评估流程三个方面,构造了一个可插拔的自动化基准。为时序研究人员提供了更全面可用的基准工具集。
当前时序研究框架存在的不足
现有时序研究在整个评估框架上存在的三方面问题:
问题1:数据领域覆盖不足。
不同领域的时间序列可能会表现出多样化的特征。图1a是环境领域的时序数据,呈现出明显