【论文阅读】【2d目标检测】一些swin transformer的改进方案

随着Swin Transformer获得最佳论文奖,Transformer在2D图像处理中的应用受到广泛关注。文章介绍了Vision Transformer with Deformable Attention,它通过使用下采样的参考点改进了传统方法,解决了仅选择四个临近点导致的计算效率问题。此外,还提到了其他Transformer变体如Twins、MSG-Transformer和GG-Transformer,以及ShuffleTransformer,这些都是当前研究的热点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

随着swin transformer成为best paper。transformer用于2d图像领域更加引起人们的广泛关注,划分框框的方法确实有些笨拙。我也看了一些相关的文章,不过有些文章没有开源出代码来。
记录一下:

Vision Transformer with Deformable Attention

论文连接:https://arxiv.org/abs/2201.00520v1
已开源 放心使用 用deformable conv的方法来做transformer不稀奇,之前过def transformer的方法,文章也指出这种方法智能选择四个临近点来降低计算cost 这是不够的,所以文章选用了下采样的reference points。是在swin上做的改进!
在这里插入图片描述

Twins

MSG-Transformer

GG-Transformer

Shuffle Transformer

针对swin transformer在处理小目标时的改进,有几个方法被提出并获得了广泛关注。其中一个方法是基于deformable convolutions的改进。论文中提到,这种方法利用了deformable convolutions来降低计算成本,并采用下采样的参考点来提高性能。这个方法在swin transformer上进行了改进,并取得了不错的效果。 另外,还有一种方法是使用了Deformable Attention的Vision Transformer。根据引用的记录,这个方法在2D图像领域引起了广泛关注。它在划分框框的方法上进行了改进,使得在处理小目标时更加灵活和准确。 此外,还有一个与swin transformer相关的项目,Swin Transformer实现了完整的图像分类代码,包含预训练权重和数据集,并且路径都是相对路径,可以直接使用。这个项目的代码可以用于比赛项目、毕业设计等等。 总结起来,swin transformer针对小目标的改进方法有:基于deformable convolutions的改进、使用Deformable Attention的Vision Transformer以及Swin Transformer项目的实现。这些方法都为解决小目标问题提供了有效的解决方案。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [【论文阅读】【2d目标检测】一些swin transformer改进方案](https://blog.youkuaiyun.com/hgj1h/article/details/124556130)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [Swin Transformer 实现图像分类](https://download.youkuaiyun.com/download/weixin_42715977/85490984)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值