【论文阅读】Informer:Beyond Efficient Transformer for Long Sequence Time-Series Forecasting
原文:https://arxiv.org/abs/2012.07436
code(pytorch实现):https://github.com/zhouhaoyi/Informer2020
贡献
- The quadratic computation of self-attention 解决自注意力二次计算
- The memory bottleneck in stacking layers for long inputs 解决长序列的内存瓶颈
- The speed plunge in predicting long outputs 解决长序列的速度瓶颈
总之,提出ProbSparse self-attention,实现transformer在长时序的应用,以及改进一些性能问题。
informer整体结构
整体为encoder-decoder模型:
- 左侧为encoder部分
- 右侧为decoder部分

问题定义
LSTF问题:在滑动窗口固定的情况下,已知Xt预测Yt。


encoder

Informer是一种针对长序列时间序列预测的高效Transformer模型,解决了自注意力计算的复杂度、长输入的内存限制和长输出的预测速度问题。它通过ProbSparse自我注意力机制,实现了在长序列任务上的应用,并提升了性能。模型结构包含编码器和解码器两部分,适用于诸如滑动窗口固定条件下的未来时间点预测任务。
615

被折叠的 条评论
为什么被折叠?



