1. 最近邻检索(Nearest Neighbor Search)
1.1 概述
最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。
k最近邻(K-Nearest Neighbor,K-NN)检索:当需要查找离目标数据最近的前k个数据项时。
最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。
1.2 应用领域
- 起初应用于文档检索系统,最近邻检索作为具有查找相似性文档信息的方法;
- 随后在地理信息系统中,最近邻检索也被广泛应用于位置信息,空间数据关系的查询、分析与统计;
- 如今在图像检索、数据压缩、模式识别以及机器学习等领域都有非常重要的作用。
- 在图像处理与检索的研究中,基于内容的图像检索方法(CBIR)是目前的主流。
这里的“内容”是指:图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。这里的“内容”是指图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。
图像的描述方式:局部特征描述子(SIFT、SURF、BRIEF) ,全局特征描述子(GIST),特征频率直方图,纹理信息,显著性区域等。
最近邻检索的引入将

本文介绍了近邻检索(Nearest Neighbor Search)的基本概念及其在文档检索、地理信息系统、图像检索等多个领域的应用。讨论了近邻检索的发展历程,包括精确检索和近似检索两种方法,以及基于树结构和数据处理的改进技术。特别提到了局部敏感哈希(LSH)和乘积量化(PQ)在处理高维数据和大规模数据集时的优势。
最低0.47元/天 解锁文章
4731

被折叠的 条评论
为什么被折叠?



