捡起博客,继续学习,争取聘上算法工程师。
1. [Algorithm & NLP] 文本深度表示模型——word2vec&doc2vec词向量模型 http://www.cnblogs.com/maybe2030/p/5427148.html
没看太懂。看了一些词,说了一些方法,对完整过程的理解还是懵逼
2http://www.cnblogs.com/maybe2030/p/5678387.html logistic函数和softmax函数
解释了这两个函数类型、作用与区别
3http://www.cnblogs.com/maybe2030/p/4953039.html 局部敏感哈希算法(Locality Sensitive Hashing)
顺手看了下LSH局部敏感hash还挺有意思的
4.http://www.cnblogs.com/maybe2030/p/5203186.html 使用SimHash进行海量文本去重
提到了海明距离,不过通过分片的方式进行的枚举检索的。其实是一种加速的方式。
本文记录了作者在算法学习过程中的心得,包括对word2vec&doc2vec词向量模型的理解尝试,logistic函数和softmax函数的区别及应用,局部敏感哈希(LSH)算法的应用场景及其有趣之处,以及如何使用SimHash进行文本去重的技术细节。
36万+

被折叠的 条评论
为什么被折叠?



