最近邻检索(NN)和近似最近邻(ANN)检索

本文介绍了近邻检索(Nearest Neighbor Search)的基本概念及其在文档检索、地理信息系统、图像检索等多个领域的应用。讨论了近邻检索的发展历程,包括精确检索和近似检索两种方法,以及基于树结构和数据处理的改进技术。特别提到了局部敏感哈希(LSH)和乘积量化(PQ)在处理高维数据和大规模数据集时的优势。

1. 最近邻检索(Nearest Neighbor Search)

1.1 概述

最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。

k最近邻(K-Nearest Neighbor,K-NN)检索:当需要查找离目标数据最近的前k个数据项时。

最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。

1.2 应用领域

  1. 起初应用于文档检索系统,最近邻检索作为具有查找相似性文档信息的方法;
  2. 随后在地理信息系统中,最近邻检索也被广泛应用于位置信息,空间数据关系的查询、分析与统计;
  3. 如今在图像检索、数据压缩、模式识别以及机器学习等领域都有非常重要的作用。
  4. 在图像处理与检索的研究中,基于内容的图像检索方法(CBIR)是目前的主流。

这里的“内容”是指:图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。这里的“内容”是指图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。

图像的描述方式:局部特征描述子(SIFT、SURF、BRIEF) ,全局特征描述子(GIST),特征频率直方图,纹理信息,显著性区域等。

最近邻检索的引入将

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值