这篇论文发表在CVOR2021会议,主要是用于行人搜索任务。
(本文代表个人对论文的见解,仅用于学术交流)
目录
AFA模块(Aligned Feature Aggregation)
三元组辅助的在线样本匹配损失(Triplet-Aided Online Instance Matching Loss)
行人搜索结合了检测和重识别任务,通过定位及识别真实环境获取的图像进行人员搜索。
目前主要的行人检测及重识别通常是两步,先检测行人并标记锚框,然后再对已标记的图像进行重识别。两步的方法其实会增加一些开销,如果能够将其结合并对上级任务有相应的反馈,应该能够大大提升搜索效率和准确性。
作者提出了 Feature-Aligned Person Search Network (AlignPS) 采用特征聚合模块(aligned feature aggregation module)用于行人搜索任务。既然是anchor方法,应该主要是效率和速度的提升吧。结构简单,速度快。
引言
这篇文章将行人检测和重识别两个独立的任务结合到统一的框架同时检测和识别。
目前主要框架分为以下几类:
a: 两步的方法,分别检测和重识别--首先检测和定位,然后裁剪图像用于重识别
b: 在同一个框架中端到端的方法。首先采用roi去检测框中的特征,然后通过检测和重识别共享特征。两个任务可以同时优化 ( one-step two-stage models)。
以上两种方法存在的问题:复杂度高,参数敏感性(anchor 的数量以及尺寸)
采用特征金字塔可能存在比例错位;缺少ROI对齐,无法确定区域;两个子任务的协调。
c: 该论文提出的方法,以RE-ID任务为首要原则,1:通过 deformable convolution and feature fusion重构金字塔的某些模块,克服区域和尺度错位问题;2:作者优化了RE-ID的检测和训练过程
方法
论文框架:
论文的基础框架来自论文FCOS论文链接,该论文学习有利于re-id任务的特征进而用于person search任务。图2 为模型框架
优点:能够同时定位图像中的多个人(金字塔不同尺度的特征捕捉能力)
特征层次:
AFA模块聚合提取的多层次特征,re-id特征来自AFA模块的输出
检测:
采用FCOS