LDA
贝叶斯概率模型:先验概率+观察数据 -> 后验概率
LDA以其灵活地对主题的分布进行概率估计,被广泛应用于主题模型抽取之中。这里仅列举概念和读过的资料,具体内容不赘述。多种语言中已经实现过此算法。总之,这是一个好用但不好吃透的算法,最后得到的也只是近似最优解。
涉及到的知识
- 多项分布
- 狄利克雷函数
- 马尔科夫链:平稳转移矩阵,收敛
- 吉布斯采样
Reference
- Lda数学八卦-靳志辉
- 通俗理解 Lda 主题模型 2015
- Parameter Estimation for Text Analysis - Heinrich, Gregor(详细讲解了 LDA+Gibbs sampling 抽取文本主题模型的过程)

本文介绍了LDA(Latent Dirichlet Allocation)主题模型的基本原理及其应用。LDA是一种基于贝叶斯概率模型的方法,通过结合先验概率与观察数据来获取后验概率,从而实现对文档集合中潜在主题的有效估计。文章还提到了多项分布、狄利克雷函数、马尔科夫链等关键概念,并推荐了一些参考资料以帮助读者深入理解。
824

被折叠的 条评论
为什么被折叠?



