【人工智能的数学基础】局部敏感哈希(Locality Sensitive Hashing)

局部敏感哈希(LSH)是一种用于高维大数据集的检索算法,尤其适用于近似最近邻搜索。通过设计特定的哈希函数,相似的点在哈希后仍能保持较高概率相同,而距离较远的点则概率较低。LSH涉及(R,cR,P1,P2)-敏感哈希函数,通过调整哈希键长和哈希表数量提高相似向量检索概率。此外,文章还介绍了基于汉明距离和余弦相似度的LSH实现方法。" 83720036,8189494,PyQt实现股票代码一览的QTabWidget界面设计,"['Python', 'GUI开发', 'PyQt', '数据可视化']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Locality Sensitive Hashing.

在机器学习领域,经常会面临检索问题:比如给定一个特征向量,检索数据库中与其相似的特征向量。如果是在低维度的小数据集中,可以使用线性查找(Linear Search,如KNN)的方法;但是在高维度大数据集中,线性查找的效率很低,显然是不可行的。

如何从高维度大数据集中找到与某个向量最相似的一个或多个向量,是检索任务中的一个难点。

在这种高维度大数据集中的检索,通常需要使用最近邻最相似查找(Approximate Nearest Neighbor, ANN)的方法。局部敏感哈希(Locality Sensitive Hashing, LSH) 是一种最近邻最相似搜索算法,有比较可靠的理论根据且在高维数据中表现比较好,很适合应用在检索任务中。

与一般的哈希算法不同,局部敏感哈希具有位置敏感性,也就是散列前类似的点(距离近的点)&#

评论 28
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI天才研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值