2、大规模图像集合在线浏览的图像检索技术解析

大规模图像集合在线浏览的图像检索技术解析

在大规模图像集合的在线浏览场景中,传统的基于相似度的图像检索方法在很多情况下已难以满足需求,往往只能返回近似重复的图像。本文将介绍几种先进的图像检索方法,包括图像表示、检索策略以及一种新颖的缩放算法,旨在解决“这是什么?”和“这在哪里?”等问题。

1. 图像表示方法

在大规模图像检索中,有几种流行的图像表示方法,它们各自有着独特的特点和应用场景。
- 词袋模型(Bag of Words,BoW)
- 特征检测 :对于数据集中的每张图像,检测其局部特征,常用的特征检测器有Harris - affine、Hessian - affine和MSER等,它们具有不同的检测特性,共同代表了当前的先进水平。
- 特征描述 :使用特征描述符来描述检测到的兴趣区域,其中SIFT描述符最为常见,它将兴趣区域描述为128维空间中的一个点。此外,还有rootSIFT和SURF等变体。
- 视觉词汇构建 :将特征描述符进行向量量化,形成视觉词汇。经典的词汇构建方法是无监督的k - means聚类,参数k表示词汇中视觉单词的数量,其取值范围较广,从适合分类任务的k ≈ 10³到k ≈ 10⁷不等。为了高效构建大词汇表,还可以使用层次词汇树和近似最近邻等方法。同时,通过无监督聚类可以压缩空间信息,而不会显著降低精度。
- 向量局部聚合描述符(VLAD)
- VLAD方法结合了词袋模型和Fisher核的优点。同样先检测和描述局部特征,使用k

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值