自然语言处理(分词,搜索等)有关
1. 阮一峰的网络日志 http://www.ruanyifeng.com/blog/
TF-IDF关键词提取算法 http://www.ruanyifeng.com/blog/2013/03/tf-idf.html
TF-IDF与余弦相似性结合衡量文章之间的相似度http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html
TF-IDF应用于自动摘要算法http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html
数据压缩与信息熵 http://www.ruanyifeng.com/blog/2014/09/information-entropy.html
贝叶斯推断与应用
之一定理简介:原文链接 http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.html
之二过滤垃圾邮件: 原文链接 http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_two.html
之三拼写检查 : 原文链接 http://www.ruanyifeng.com/blog/2012/10/spelling_corrector.html
朴素贝叶斯分类
原文链接 http://www.ruanyifeng.com/blog/2013/12/naive_bayes_classifier.html
3.我爱自然语言处理 http://www.52nlp.cn/
4中文分词算法大全 http://lutaf.com/157.htm
5.Trie http://iregex.org/blog/trie.html
Trie in Python http://iregex.org/blog/trie-in-python.html
6.对jieba分词算法的理解与分析 http://www.thinkface.cn/thread-1303-1-1.html
7. Stanford Word Segmenter http://nlp.stanford.edu/software/segmenter.shtml
算法基础有关
8.算法时间复杂度的计算 http://univasity.iteye.com/blog/1164707
9.最长公共子序列问题
http://taop.marchtea.com/11.0.html
http://buzheng.org/blog/longest-common-substring-subsequence.html