【论文阅读】DETR (ECCV2020)|End-to-End Object Detection with Transformers

DETR是Facebook AI在ECCV2020提出的一种使用Transformer架构进行端到端目标检测的方法。它摒弃了传统检测器的顺序预测,转而采用匈牙利算法解决无序集合预测问题。模型后端输出预测矩阵,通过构建并解决代价矩阵来确定最佳匹配,盒损失包括在内。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:End-to-End Object Detection with Transformers
作者:Facebook AI – Nicolas Carion , Francisco Massa , Gabriel Synnaeve, Nicolas Usunier,
Alexander Kirillov, and Sergey Zagoruyko

motivation:
作者想直接预测无序集合

method:

亮点我觉得有2:
1)采用了transformer的模型架构;
2)采用匈牙利算法的无序预测;

总体结构如下图:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

transformer 没什么好说的,匈牙利losss比较有意思:

模型后端输出(100,cls)和(100,4)的预测矩阵,
构建代价矩阵:
分别算出100个模型与N个GT模型的代价值,形[100,N]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值