http://blog.youkuaiyun.com/yangliuy/article/details/8296481
博客2:http://licstar.net/archives/687
非常好的一篇文章。普及NLP常见的数学常识。如:
1、文本分析的三种参数分析方法:最大似然估计MLE,最大后验概率估计MAP,贝叶斯估计。
1.1 最大似然估计MLE
最大似然估计就是要用似然函数取到最大值时的参数值作为估计值,似然函数可以写做

由于连乘

该函数取得最大值是对应的
的取值就是我们估计的模型参数。
1.2 最大后验概率MAP
与最大似然概率不同的是:引入先验概率