机器学习笔记 - 结合深度学习的基于内容的图像实例检索 综述

本文综述了基于深度学习的实例级图像检索(IIR)研究,探讨了从2012年以来的关键进展,包括深度特征提取、嵌入聚合方法和微调策略。尽管深度学习显著提升了检索的准确性,但准确性与效率仍是当前面临的主要挑战。文章还介绍了一般的IIR框架,强调了特征匹配的重要性。未来工作将聚焦于改善模型的不变性、注意力和效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、概述

        基于内容的图像检索(CBIR)——这是一个建立已久的研究领域,需要提高实时检索的效率和准确性。人工智能在CBIR方面取得了进展,极大地促进了实例搜索过程。在这项调查中,我们回顾了最近基于深度学习算法和技术开发的实例检索工作,调查由深度特征提取、特征嵌入和聚合方法以及网络微调策略组织。我们的调查考虑了各种各样的最新方法,通过这些方法,我们确定了里程碑式的工作,揭示了各种方法之间的联系,并提出了常用的基准、评估结果、共同的挑战,以及提出了有希望的未来方向。

        基于内容的图像检索(CBIR)是在给定查询图像的情况下,通过分析视觉内容(颜色、纹理、形状、对象等)来搜索图像库中的相关图像的问题。CBIR一直是计算机视觉和多媒体领域的一个长期研究课题。随着图像数据的指数级增长,开发能够有效管理此类大型图像采集的适当信息系统至关重要,图像搜索是最不可或缺的技术之一。因此,CBIR的应用潜力几乎无穷无尽,如人/车再识别、地标检索、遥感、在线产品搜索等。

        一般来讲,CBIR方法可以分为两个不同的任务:类别级图像检索(CIR)和实例级图像检索(IIR)

        CIR的目标是找到代表与查询相同类别的任意图像(例如,狗、汽车)。相比之下,在IIR任务中,给出了特定实例(例如,埃菲尔铁塔,我邻居的狗)的查询图像,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值