#今日论文推荐# CVPR2022 | 中科大&华为提出用于非对称图像检索的上下文相似性蒸馏
非对称图像检索,典型的查询端使用小模型,数据库服务器使用大模型,是资源受限场景的有效解决方案。然而,现有方法要么无法实现特征一致性,要么做出强假设,例如,需要来自大型模型的标记数据集或分类器等,这限制了它们的实际应用。为此,作者提出了一个灵活的上下文相似性蒸馏框架来增强小型查询模型并保持其输出特征与大型图库模型的输出特征兼容,这对于非对称检索至关重要。在本文的方法中,作者学习了具有新的上下文相似性一致性约束的小型模型,没有任何数据标签。在小模型学习过程中,它保留了每个训练图像及其相邻图像与大模型提取的特征之间的上下文相似性。这个简单的约束与同时保留一阶特征向量和二阶排序列表保持一致。大量实验表明,所提出的方法在 Revisited Oxford 和 Paris 数据集上优于最先进的方法。
大多数现有的图像检索方法使用相同的模型将查询图像和图库图像映射到特征向量,这被称为对称检索。为了达到较高的检索准确率,他们通常只是简单地选择一个大模型进行特征提取,这存在效率低下的问题。在一些计算和内存资源有限的实际场景中,例如移动搜索,在用户侧使用大模型进行特征提取是难以承受的,轻量化模型更可取。一种简单的解决方案是直接使用轻量级模型来提取图库和查询的特征,但是由于轻量级模型的表示能力较差,这通常会降低检索精度。在实践中,图库图像可以在具有足够计算资源的情况下离线处理,而查询在最终用户侧进行特征提取,计算能力有限。在这样的非对称检索设置中,采用大型模型来索引画廊图像并采用轻量级模型进行查询是可行的,这在检索准确性和效率之间进行权衡。
论文题目:Contextual Similarity Distillation for Asymmetric Image Retrieval
详细解读:https://www.aminer.cn/research_report/630e08c57cb68b460f0fa76bhttps://www.aminer.cn/research_report/630e08c57cb68b460f0fa76b
AMiner链接:https://www.aminer.cn/?f=cs