
算法
taczeng
最简单的代码完成尽可能复杂的功能
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
浅谈我对算法理解
内容持续更新总结中......算法,一直是看似复杂的东西,但是,深入本质,其实算法,是很有趣的;算法,其实就是对于一堆输入的内容,转换成你想要的输出的内容的一个计算序列!栗子:从A到B有很多条路,最快到B是时间复杂度(多长时间),走路流汗最少是空间复杂度(用了多少内存空间);算法技术点(借用知乎的一张思维导图)——需要的基础数学知识:求导、nlgn等等这种时...原创 2019-12-05 15:35:50 · 3342 阅读 · 0 评论 -
使用simhash进行海量文章数据相似度去重
1.原理理解:这篇文章相当好:https://www.cnblogs.com/maybe2030/p/5203186.htmlhttps://www.cnblogs.com/qcloud1001/p/10059709.html理解了整体思路,中间有个地方不好理解:1.如何分桶,分桶的目的,只是缩小比较次数,尽快找到待比较的文本,进行海明计算:现在一个text文本...原创 2019-06-24 17:20:46 · 3437 阅读 · 1 评论