题目:End-to-End Object Detection with Transformers
作者:Facebook AI – Nicolas Carion , Francisco Massa , Gabriel Synnaeve, Nicolas Usunier,
Alexander Kirillov, and Sergey Zagoruyko
motivation:
作者想直接预测无序集合
method:
亮点我觉得有2:
1)采用了transformer的模型架构;
2)采用匈牙利算法的无序预测;
总体结构如下图:
transformer 没什么好说的,匈牙利losss比较有意思:
模型后端输出(100,cls)和(100,4)的预测矩阵,
构建代价矩阵:
分别算出100个模型与N个GT模型的代价值,形[100,N]