lda代码的一些资料

本文介绍了Latent Dirichlet Allocation (LDA) 模型的基本原理及其在文本主题表示方面的应用。LDA假设每篇文档是由少量主题混合而成,每个词的生成可归因于文档中的某个主题。文中还提供了LDA模型的多个实现版本,包括Java、C和Python等语言。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文链接:点击打开链接







首先,我以前总结过,关于北邮一个人写的导读,连接在这里

肯定得看Blei 2003年的论文,点击下载

然后很重要的Blei的视频和一个80多页的Lecture

Topic Models

Latent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。

关键所在:it posits that each document is a mixture of a small number of topics and that each word’s creation is attributable to one of the document’s topics。

将文档看成是一组主题的混合,词有分配到每个主题的概率。

Probabilistic latent semantic analysis(PLSA) LDA可以看成是服 从贝叶斯分布的PLSA

LDA,就是将原来向量空间的词的维度转变为Topic的维度,这一点是十分有意义的。

Lda的源代码,java c matlab python 等  :

Code-python

deltaLDA.tgz

Other LDA implementations


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值