ECCV2020的一篇文章, 关于可泛化行人重识别. 提出了"查询自适应卷积"和"时序提举". 其中"查询自适应卷积"方法比较新颖, 放弃了传统的对高层特征进行分类, 计算损失的方法; 转而关注中间的特征图对一个class_memory的匹配, 一次来提升模型对未知场景的泛化能力. “时序提举"不多介绍, 比较容易理解, 主要的思路是利用"同伴”, 来提升或者降低一个候选图片的置信度.
作者本人对论文的介绍
文章中的关键词
- generalizable person re-id: 可泛化行人重识别
- finding local corespondences: 查找局部联系
- among different domains: 跨数据库, 跨场景
- more generalizable than representation features to unseen scenarios, including unkown misalignment, pose of viewpoints changes: 对于未见场景, 不对齐, 姿态变化的泛化能力更强
- 作者在论文介绍中讲的比较清楚, 使用了以下的关键理解:
关于泛化性我们先从卷积讲起。卷积可以理解为一个模板匹配的过程,它的卷积核是模板,该模板既可以是预定义的,如传统的差分滤波用于边缘检测,也可以是学习得到的,如 CNN。卷积核通常是一个局部模板,卷积操作则是将该模板在全图滑动,得到的输出则是图像各处对该模板的匹配响应,大的响应则代表较好的局部匹配。因此,在深度卷积神经网络里,要学习的卷积核参数是很重要的,它决定了该网络要寻觅的是什么样的模式。然而,一旦在一个数据集上训练完成,CNN 的卷积核就是固定的,它只能代表对训练数据固化的记忆。如果应用场景跟训练场景不一样,CNN 学到的固定卷积核就有可能对没见过的图像模式(颜色、纹理等

ECCV2020文章提出可泛化行人重识别的“查询自适应卷积”和“时序提举”方法。“查询自适应卷积”关注中间特征图与class_memory匹配,提升模型对未知场景泛化能力。相比传统分类损失,该方法重点关注特征图像素级匹配,或可提升模型提取结构化特征能力。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



