Orange3实战教程:文本挖掘---主题建模

主题建模

使用潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)、潜在语义索引(Latent Semantic Indexing, LSI)或分层狄利克雷过程(Hierarchical Dirichlet Process, HDP)进行主题建模。

输入

  • 语料库(Corpus):文档集合。

输出

  • 语料库(Corpus):附带主题权重的语料库。
  • 主题(Topics):所选主题及其词权重。
  • 所有主题(All Topics):每个主题的词权重。

主题建模通过分析文档中的词簇及其频率,发现语料库中的抽象主题。一个文档通常包含多个主题,比例各异,因此该组件还会报告每个文档的主题权重。

该组件封装了 Gensim 的主题模型(LSILDA

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

err2008

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值