LDA,咱们一起来学习【转】

本文深入探讨了LDA模型的基本概念、工作原理及在文本主题表示领域的应用,包括模型的数学推导、实现方式及与其他模型的关系,并提供了丰富的资源链接供读者进一步学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,我以前总结过,关于北邮一个人写的导读,连接在这里

肯定得看Blei 2003年的论文,点击下载

然后很重要的Blei的视频和一个80多页的Lecture

Topic Models

Latent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。

关键所在:it posits that each document is a mixture of a small number of topics and that each word’s creation is attributable to one of the document’s topics。

将文档看成是一组主题的混合,词有分配到每个主题的概率。

Probabilistic latent semantic analysis(PLSA) LDA可以看成是服 从贝叶斯分布的PLSA

LDA,就是将原来向量空间的词的维度转变为Topic的维度,这一点是十分有意义的。

Lda的源代码,java c matlab python 等  :

Code-python

deltaLDA.tgz

Other LDA implementations

转自:http://www.zhizhihu.com/html/y2010/1465.html

转载于:https://www.cnblogs.com/wintergrass/archive/2011/10/31/2230388.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值