AMiner论文推荐

AMiner：AI科研助手

于 2021-09-10 18:29:18 发布

阅读量122

点赞数

CC 4.0 BY-SA版权

分类专栏： Topic推荐 AMiner论文推荐 AMiner 文章标签：自然语言处理深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/AI_Conf/article/details/120227715

AMiner 同时被 3 个专栏收录

730 篇文章

订阅专栏

AMiner论文推荐

520 篇文章

订阅专栏

417 篇文章

订阅专栏

AMiner论文推荐
论文标题：Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
论文链接：https://www.aminer.cn/pub/605dbaf191e0113c28655a7f?f=cs
Swin Transformer 提出了一种针对视觉任务的通用的 Transformer 架构，Transformer 架构在 NLP 任务中已经算得上一种通用的架构，但是如果想迁移到视觉任务中有一个比较大的困难就是处理数据的尺寸不一样。作者分析表明，Transformer 从 NLP 迁移到 CV 上没有大放异彩主要有两点原因：

最主要的原因是两个领域涉及的scale不同，NLP 任务以 token 为单位，scale 是标准固定的，而 CV 中基本元素的 scale 变化范围非常大。
CV 比起 NLP 需要更大的分辨率，而且 CV 中使用 Transformer 的计算复杂度是图像尺度的平方，这会导致计算量过于庞大，例如语义分割，需要像素级的密集预测，这对于高分辨率图像上的Transformer来说是难以处理的。
Swin Transformer 就是为了解决这两个问题所提出的一种通用的视觉架构。Swin Transformer 引入 CNN 中常用的层次化构建方式。
AMiner,让AI帮你理解科学！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。