LDA学习笔记

本文详细探讨了LDA(Latent Dirichlet Allocation)的主题建模原理,包括如何计算主题矩阵和词分布矩阵,解释了LDA中的共轭分布和与PLSA的区别。同时,讨论了确定LDA主题个数的方法,以及LDA与Word2Vec、Doc2Vec的差异,并介绍了Dirichlet分布参数alpha和beta的确定技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

详述LDA原理?

  • 从狄利克雷分布α中取样生成文档i的主题分布
    • 多项式分布的共轭分布是狄利克雷分布
    • 二项式分布的共轭分布是Beta分布
  • 从主题的多项式分布中取样生成文档i第j个词的主题
  • 从狄利克雷分布β中取样生成主题对应的词语分布
  • 从词语的多项式分布中采样最终生成词语
  • 文档里某个单词出现的概率可以用公式表示:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值