最近邻检索（NN）和近似最近邻（ANN）检索

最新推荐文章于 2025-10-14 17:21:07 发布

原创

最新推荐文章于 2025-10-14 17:21:07 发布 · 2.6w 阅读

·

10

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了近邻检索（Nearest Neighbor Search）的基本概念及其在文档检索、地理信息系统、图像检索等多个领域的应用。讨论了近邻检索的发展历程，包括精确检索和近似检索两种方法，以及基于树结构和数据处理的改进技术。特别提到了局部敏感哈希（LSH）和乘积量化（PQ）在处理高维数据和大规模数据集时的优势。

文章目录

1. 最近邻检索（Nearest Neighbor Search）

1.1 概述

最近邻检索就是根据数据的相似性，从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离，可以认为数据在空间中的距离越近，则数据之间的相似性越高。

k最近邻（K-Nearest Neighbor，K-NN）检索：当需要查找离目标数据最近的前k个数据项时。

最近邻检索是线性复杂度的，不能满足对于大规模数据检索的时间性能要求。

1.2 应用领域

起初应用于文档检索系统，最近邻检索作为具有查找相似性文档信息的方法；
随后在地理信息系统中，最近邻检索也被广泛应用于位置信息，空间数据关系的查询、分析与统计；
如今在图像检索、数据压缩、模式识别以及机器学习等领域都有非常重要的作用。
在图像处理与检索的研究中，基于内容的图像检索方法（CBIR）是目前的主流。

这里的“内容”是指：图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性，以及前景与后景的对比程度等整体特征。这里的“内容”是指图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性，以及前景与后景的对比程度等整体特征。

图像的描述方式：局部特征描述子（SIFT、SURF、BRIEF），全局特征描述子（GIST），特征频率直方图，纹理信息，显著性区域等。

最近邻检索的引入将

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。