#今日论文推荐# CVPR2022 | 中科大&华为提出用于非对称图像检索的上下文相似性蒸馏

最新推荐文章于 2024-10-11 10:33:49 发布

wwwsxn

最新推荐文章于 2024-10-11 10:33:49 发布

阅读量248

点赞数

分类专栏：神经网络文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/630e08c57cb68b460f0fa76b

版权

神经网络专栏收录该内容

9 篇文章

订阅专栏

针对资源受限场景，中科大&华为提出一种上下文相似性蒸馏框架，用于增强小型查询模型，使其输出特征与大型图库模型兼容。该方法无需额外标签，在保持检索精度的同时提升了效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#今日论文推荐# CVPR2022 | 中科大&华为提出用于非对称图像检索的上下文相似性蒸馏

非对称图像检索，典型的查询端使用小模型，数据库服务器使用大模型，是资源受限场景的有效解决方案。然而，现有方法要么无法实现特征一致性，要么做出强假设，例如，需要来自大型模型的标记数据集或分类器等，这限制了它们的实际应用。为此，作者提出了一个灵活的上下文相似性蒸馏框架来增强小型查询模型并保持其输出特征与大型图库模型的输出特征兼容，这对于非对称检索至关重要。在本文的方法中，作者学习了具有新的上下文相似性一致性约束的小型模型，没有任何数据标签。在小模型学习过程中，它保留了每个训练图像及其相邻图像与大模型提取的特征之间的上下文相似性。这个简单的约束与同时保留一阶特征向量和二阶排序列表保持一致。大量实验表明，所提出的方法在 Revisited Oxford 和 Paris 数据集上优于最先进的方法。

大多数现有的图像检索方法使用相同的模型将查询图像和图库图像映射到特征向量，这被称为对称检索。为了达到较高的检索准确率，他们通常只是简单地选择一个大模型进行特征提取，这存在效率低下的问题。在一些计算和内存资源有限的实际场景中，例如移动搜索，在用户侧使用大模型进行特征提取是难以承受的，轻量化模型更可取。一种简单的解决方案是直接使用轻量级模型来提取图库和查询的特征，但是由于轻量级模型的表示能力较差，这通常会降低检索精度。在实践中，图库图像可以在具有足够计算资源的情况下离线处理，而查询在最终用户侧进行特征提取，计算能力有限。在这样的非对称检索设置中，采用大型模型来索引画廊图像并采用轻量级模型进行查询是可行的，这在检索准确性和效率之间进行权衡。

论文题目：Contextual Similarity Distillation for Asymmetric Image Retrieval
详细解读：https://www.aminer.cn/research_report/630e08c57cb68b460f0fa76bhttps://www.aminer.cn/research_report/630e08c57cb68b460f0fa76b
AMiner链接：https://www.aminer.cn/?f=cs