【论文阅读】Cascade Transformers for End-to-End Person Search

≈落小朵

已于 2022-09-27 11:27:01 修改

阅读量1.3k

点赞数

分类专栏： re-id论文学习文章标签：论文阅读深度学习计算机视觉

于 2022-09-26 17:03:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43169773/article/details/126256363

版权

论文代码地址

我们提出了用于端到端人员搜索的级联遮挡注意transformer（Cascade Occluded Attention Transformer）。三阶段级联设计侧重于在第一阶段检测人员，而在随后的阶段同时逐步完善人员检测和重新识别的表示。在每个阶段，被遮挡的注意力变换器在联合阈值上应用更紧密的交集，迫使网络学习从粗到细的姿势/比例不变特征。同时，计算每个检测的遮挡注意力，以区分一个人的标标志或背景。

目录

由粗到细的embedding模块介绍

基于遮挡的attention transformer

Training and Inference（训练）

引言

行人检索目的是从一组场景图像中定位出特定的人。目前存在两步和一步的方法。

两步的方法通常是先检测，然后再进行重识别任务；

一步的方法是一种多任务的端到端框架，同时检测和重识别；

存在的挑战：

1：行人检测主要是学习特征，以便于从背景中区分行人。行人重识别是区分人与人之间的差异性。目前存在的方法如行人检测任务优先和重识别任务优先（该论文的阅读笔记）通常分配不同的优先等级，这些方法不好平衡两个子任务。

2：尺度和姿态变化使得重识别具有一定难度；特征金字塔和可变形卷积可以解决此类问题，但是特征融合策略易引入噪声；

3：遮挡或模糊造成的难点问题；

解决：

we propose a new Cascade Occluded Attention Transformer (COAT) for end-to-end person search.

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。