算法拾遗

本文深入探讨了KD-Tree、余弦相似度、Levenshtein距离以及BloomFilter等关键技术在数据处理领域的应用,提供了直观的解释和实例说明,旨在帮助读者理解这些技术的核心概念及其实际应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. KD-Tree

使用k维度数据构造的一颗二叉树,主要用途:寻找距离K维空间中一个点最近的点。KD-Tree思想主要是K维空间中模仿二叉排序树,方便进行二分查找。这里有篇写的很6的博客供参考,感谢原作者的奉献。

原文地址(有可能打不开):http://www.icvpr.com/kd-tree-tutorial-and-code/

转载的文章:http://my.oschina.net/keyven/blog/221792


2.余弦相似度

余弦相似度,利用两个向量的夹角余弦值来定义相似度,此处应有余弦公式(略)。主要用于计算字符串相似度。

之前见到余弦相似来计算相似度的,但是不知道为啥这样就能算出来,看了这篇文章感觉这样算确实很好,感谢原作者的实例。

原文地址:http://my.oschina.net/BreathL/blog/42477


3.Levenshtein 距离(编辑距离)

这个算法也是用于计算字符串相似度。推荐两篇文章,一目了然。

图画版原文1:http://wdhdmx.iteye.com/blog/1343856

公式版原文2:http://blog.youkuaiyun.com/xanxus46/article/details/38678335


4. BloomFilter——大规模数据处理利器

通俗易懂的介绍:http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html

(未完待续)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值