目标检测 - Deformable DETR: Deformable Transformers for End-to-End Object Detection

该博客探讨了DETR在目标检测中的局限性,如收敛速度慢和处理小目标的困难。通过引入可形变注意力模块,提出了Deformable DETR,旨在解决Transformer在图像特征处理中的效率问题。文章介绍了Deformable DETR的结构,包括多尺度可形变注意力模块和两阶段变形Transformer,以及这些改进如何提高性能并减少训练时间。同时,还讨论了进一步的优化策略,如迭代框精炼和两阶段解码器。实验结果显示效果显著,但仍有改进空间,建议深入理解DETR源码以进行更多研究。

0. 前言

  • 相关资料:
  • 论文基本信息
    • 领域:目标检测
    • 作者单位:商汤
    • 发表时间:2020.10
  • 一句话总结:在DETR中加入了Deformable

1. 要解决什么问题

  • DETR存在一些问题:
    • 收敛速度慢(需要训练更多的epochs)
    • Transformer处理图像数据时,feature spatial resolution受限。
  • Faster RCNN中,处理小目标问题一般是使用FPN。但在DETR中,使用FPN并不现实。因为会导致计算量大幅度增加。
  • 而DETR中存在的问题,都可以归结为,在使用Transformer处理图像特征时,会处理所有可能的空间位置。
    • 可能意思是,处理的位置太多了,没有抓住重点?
    • 原文如下

The core issue of applying Transformer attention on image feature maps is that it would look over all possible spatial locations.

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值