CVPR2022《Cascade Transformers for End-to-End Person Search》

人物搜索的目标是从一组场景图像中定位目标人物,由于大规模变化、姿势/视点变化和遮挡,这极具挑战性。在本文中,我们提出了用于端到端人员搜索的 Cascade Occluded Attention Transformer (COAT)。我们的三阶段级联设计侧重于在第一阶段检测人员,而后期阶段同时逐步完善人员检测和重新识别的表示。在每个阶段,被遮挡的注意力转换器在联合阈值上应用更紧密的交集,迫使网络学习从粗到细的姿势/尺度不变特征。同时,我们计算每个检测的遮挡注意力,以区分一个人的标记与其他人或背景。通过这种方式,我们在令牌级别模拟了其他对象遮挡感兴趣的人的效果。通过全面的实验,我们通过在两个基准数据集上实现最先进的性能来展示我们方法的好处。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值