LDA(Latent Dirichlet Allocation)相关论文阅读小结

本文是对LDA(Latent Dirichlet Allocation)的深入解析,包括LDA的数学基础、与二项分布、泊松分布、Gamma分布、Beta分布和Dirichlet分布的关系,以及MCMC采样中的Gibbs Sampling算法。LDA模型通过Doc-Topic和Topic-Word骰子的概念解释,展示了如何用于文档主题分析,并详细描述了训练过程和新文档的主题预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于主题挖掘,LDA(Latent Dirichlet Allocation)已经得到了充分的应用。本文是我对自己读过的相关文章的总结。
1. 《LDA数学八卦》http://pan.baidu.com/s/18KUBG
把标准LDA的由来讲解得通俗易懂,细致入微。真的是了解LDA的最佳入门读物。
Gamma函数:Gamma函数
通过分部积分可以推导其具有递归性质 这里写图片描述,因此Gamma函数可以当成是阶乘在实数集上的拓展。具有性质:这里写图片描述。这个性质很重要,在后来的LDA推理中会用到。
二项分布:这里写图片描述
泊松分布:这里写图片描述
Gamma分布:这里写图片描述,若做变换x=βt,得到如下分布函数
这里写图片描述其中α为形状参数,决定了分布曲线的形状,β为速率参数,决定了曲线有多陡。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值