LDA(文档主题模型)

本文探讨了主题模型在自然语言处理中的应用,包括LSA、PLSA、LDA等模型的原理与实现。介绍了大规模LDA系统的几种实现方式,如SparkLDA、GooglePLDA、LightLDA及腾讯LDA(PEACOCK)。这些模型通过将词-文档映射到低维隐语义空间,比较词和文档在低维空间的相似性,从而实现主题发现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • LSA latent semantic analysis

    映射词-文档到一个低维隐语义空间

    比较词和文档在低纬空间的相似性

  •  topic 是 Vocab 上的概率分布(符合多项式分布)
  •  文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型
  • plsa 模型
  • LDA模型
  • 大规模LDA系统
    •   spark LDA
    •       Google PLDA
    •       微软LightLDA
    •       腾讯LDA,PEACOCK

转载于:https://www.cnblogs.com/ChenAlong/p/5228329.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值