
topicModel
ziyue246
简单,安静
展开
-
LDA主题模型笔记
LDA图模型 每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。如下图: K为主题个数,M为文档总数,是第m个文档的单词总数。是每个Topic下词的多项分布的Dirichlet先验参数,是每个文档下Topic的多项分布的Dirichlet先验...原创 2018-07-16 10:17:12 · 1408 阅读 · 0 评论 -
pLSA图模型笔记
pLSA图模型 求解目标p(W,D) ,整个文档集合的出现概率,使得p(W,D) 最大化,即为plsa的目标: 下面咱们开始求解p(W,D): 为 词wj在文档di中出现的次数; 注释:为第m篇文档中,第n个词出现的概率,为第i篇文档中词表中第i个词出现的概率,由于di 利用EM算法求 至此,我们就可以用em算法迭代求解了 其中、需要用偏导数=0...原创 2018-09-13 15:29:04 · 250 阅读 · 0 评论