一文读懂transformer(CV专享)

最新推荐文章于 2025-03-15 22:00:30 发布

CV技术指南(公众号)

最新推荐文章于 2025-03-15 22:00:30 发布

阅读量2.7k

点赞数 1

分类专栏：网络模型解读 CV技术总结文章标签：计算机视觉深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/KANG157/article/details/111499713

版权

导言：

transformer在这两年大火，CV界广泛应用transformer模型，充分吸收其idea到自己的领域。考虑到transformer本是应用于NLP的论文，其中很多内容都形成了共识，因此在论文中并未提及，就好像CV中论文提到图像预处理使用center crop , color jitter，但不会详细介绍这两个，这就是CV领域的共识，其他领域的人看到这两个将会很困惑，作为CV中人读transformer会被很多共识内容所折磨，包括很多介绍transformer的博客知乎，都是站在NLP领域的角度写的，因此共识部分都是一笔带过，本文的出发点是要让CV人读得懂。

（注：本文是本人在内部分享会上的做的ppt，要转换成文章太费时间，这里直接使用ppt图片，原ppt很多内容都是口头讲的，且很多都是原论文引文，这里为了介绍清楚，在其基础上加入了很多口头上讲的东西，并将英文改成了中文，希望读者能谅解）

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。