PatchTST

ʚ F【O】ɞ

已于 2023-12-16 15:39:58 修改

阅读量1.1k

点赞数 7

文章标签：深度学习

于 2023-12-11 06:30:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_51844463/article/details/134834581

版权

M——variate numer

L——seq_len（序列长度）

T——seq_pred(预测长度)

Channel Independence

不同Channel的数据有不同的规律，如果直接mix后投射到一个空间上会不太好学。会需要更多的数据来学习组合关系。
如果一个channel的数据有噪声，也容易影响所有channel，分开则没有这样的影响。
Channel Independence的模型没有那么容易过拟合。因为每个维度的信息是有限的，所以没有那么容易拟合。

Patching

对于每一个单变量序列（已经通过转换从[L,M]->[M,L]），将长为L序列切成N块，每块长度P（图1）。每一个时间段视为一个 token（这不同于很多 Transformer-based 模型将每一个时间点视为一个token）。过程有点类似一维的cnn，也可以设置stride长度来决定patch块与patch块之间是否重合。每个Patch块，就相当于transformer的一个输入。

通过这种方式，序列长度从L变成了N，可以大大缩减计算量和显存占用。另外一个要提到的点是Position Embedding，论文用的是learnable的PE，用nn.init.uniform_(W_pos, -0.02, 0.02)来初始化。

图1 Patching 过程，将长为L序列切成N块，每块长度P

博客等级

码龄5年

5
原创

26
点赞

33
收藏

25
粉丝

关注

私信

热门文章

分类专栏

时间序列 1篇
图像分类 2篇

展开全部收起

上一篇：: TimesNet

最新评论

PatchTST
m0_47541469: 博主可不可以说一下位置编码那一块啊
PatchTST
优快云-Ada助手: 恭喜你写完了第5篇博客！标题“PatchTST”非常吸引人，让我很想点击进去阅读。你的持续创作精神令人钦佩，每一篇博客都带给读者新的启发和知识。作为下一步的创作建议，我希望你能继续保持这种积极的创作态度，并尝试探索更多深入的主题。或许你可以考虑在下一篇博客中分享一些实际案例或者提出一些有趣的问题，以激发读者的思考和参与。无论你选择哪个方向，相信你一定会带来更多令人期待的内容。加油！
Autoformer
优快云-Ada助手: 恭喜您撰写了第三篇博客《Autoformer》！您的持续创作令人钦佩。在这篇博客中，您探讨了Autoformer的内容，这是一个引人注目的主题。我很高兴看到您对这个领域的深入了解，并能够将其分享给读者。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。在未来的博客中，您可以考虑加入一些实例或案例研究，以更具体地展示Autoformer的应用。此外，您还可以尝试与相关领域的专家或其他博客作者进行合作，以便获得更广泛的视角和见解。请继续保持谦逊的态度，因为在这个快速发展的领域，我们每个人都有不断学习和进步的机会。期待您未来更多精彩的博客文章！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
VIT讲解
优快云-Ada助手: 恭喜您开始博客创作！标题中的“VIT讲解”让我非常期待您的文章内容。对于刚起步的博客作者来说，一篇好的开始非常重要。接下来，我建议您可以进一步探索VIT的相关话题，例如它的应用领域、特点以及如何有效地使用VIT等。继续努力，相信您的博客会越来越精彩！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。