LDA学习

最新推荐文章于 2022-01-18 16:56:00 发布

Ayang777

最新推荐文章于 2022-01-18 16:56:00 发布

阅读量296

点赞数

分类专栏：话题模型

话题模型专栏收录该内容

26 篇文章

订阅专栏

收藏：

模型建立：http://blog.youkuaiyun.com/happyer88/article/details/45936107

变量求解：http://blog.youkuaiyun.com/happyer88/article/details/46405399/

变分推断：http://blog.youkuaiyun.com/happyer88/article/details/46438111/

模型参数：http://blog.youkuaiyun.com/happyer88/article/details/46723941

Gaussian LDA: http://blog.youkuaiyun.com/u011414416/article/details/51168242

LDA的rethink，对变分一直理解不能，对推断也知道的不多，现在自己要把盘子图推出来，难上加难，只好重新复习一遍。

引用：http://blog.youkuaiyun.com/happyer88/article/details/45936107

LDA的过程不赘述。引入隐变量z和θ，此处引入隐变量z是为了后面使用EM算法求解模型参数

α,β 时能简化计算，而引入隐变量θ 则是在主题分布（是一个多项分布）之上加一层Dirichlet分布（与多项分布共轭），可以保证一篇文档有多个主题。此处选择Dirichlet分布是因为主题zn 服从多项分布，而Dirichlet分布和多项分布是共轭分布，在以后的计算中会带来很多便利。所谓共轭，指的就是先验分布和后验分布的形式相同：

给定α,β，根据文档生成的过程，可以得到，主题分布的参数θ，N个主题的集合z，N个单词的集合w，的联合分布：

要消掉式中的隐变量θ,z，需对连续型变量θ 求积分，对离散型变量z 求和，得到文档w 的边缘分布：

那么就可以通过求乘积进一步得到文档集D的边缘分布

LDA再学习

模型的参数是α,β，我们还引入了两个隐变量θ,z，接下来要做的就是消掉隐变量，求解参数，确定LDA模型。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。