- 博客(2)
- 资源 (8)
- 收藏
- 关注
原创 基于最小哈希(MinHash)和局部敏感哈希(Locality Sensitive Hashing,LSH)的短文本相似去重算法实现和测试
本文介绍一种针对海量短文本的相似去重算法实现,涉及的技术包括最小哈希(MinHash)和局部敏感哈希(Locality Sensitive Hashing,LSH),利用了开源python包datasketch。
2025-07-25 23:46:41
808
原创 《算法(第四版)》练习1.3.49
只要Tail不为空,则将Tail栈中的元素转移到Hbuf,其中有一个常数次(SPEED)的for循环,该循环是为了加速Tail栈中的元素向Hbuf的转移,因为Hbuf是Head的缓冲,所以终是为了加速Tail到Head的转移,将元素从Tail往Head转移是该算法的一个重要的设计原则,能够有效保证出队时通过简单的弹出Head顶层元素即可完成,虽然此处有一个for循环,但次数是有限的且固定的,因此保证入队时栈操作仍然是常数次。:用于出队,Head栈的栈顶是下一个出队的元素。:同Head栈中的元素顺序相反。
2025-07-01 00:45:50
1025
1
2018_knowledge_guided_nlp_en.pdf
2020-02-08
2018_deep_learning_and_computational_social_sciences.pdf
2020-02-08
Link Mining- Models, Algorithms, and Applications
2011-08-26
Large Text File Viewer LTFViewr
2012-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅