ICCV 2021 | Swin transformer: Hierarchical vision transformer using shifted windows 阅读笔记
于 2022-06-11 16:29:46 首次发布
SwinTransformer是微软亚洲研究院等机构提出的一种新型视觉Transformer,旨在解决Transformer在视觉任务中的尺度变化问题和高分辨率计算成本。通过引入分层结构和移位窗口机制,SwinTransformer实现了类似卷积网络的多尺度特征提取,并保持线性计算复杂度。该模型能应用于分类、检测和分割等任务,展示了在Transformer领域的创新应用。

最低0.47元/天 解锁文章
646

被折叠的 条评论
为什么被折叠?



