Orange3实战教程:文本挖掘---LDA主题探索

LDAvis

LDA主题的交互式探索工具。

输入

  • 主题:来自主题建模的所有LDA主题。

LDAvis 是 Orange 对 pyLDAvis 的实现,而 pyLDAvis 源自 Sievert 和 Shirley(2014)开发的 R 包 LDAvis。该可视化工具通过调整主题中高排名词汇的权重,用于探索 LDA 主题模型。参数“相关性”(Relevance)用于调整词汇权重,取值范围为 0 到 1:值为 1 时,词汇仅按其在主题中的频率排名;值为 0 时,词汇仅按“提升度”(词汇在主题中的概率与在语料库中的概率之比)排名。

在这里插入图片描述

  1. 调整单词在主题中相关性的参数:值为 1 时,显示与“主题建模”组件中相同的词汇。
  2. 主题列表

右侧图表展示了按计算后的相关性排名前 20 的词汇。默认相关性值为 0.5(作者建议 0.6),可在主题内概率和提升度之间达到平衡。横轴权重表示词汇的绝对计数,红色条形表示主题内概率,灰色条形表示词汇在语料库中的概率。

示例

以下是如何在 Orange 中近似实现完整 LDAvis 功能的步骤:

  1. 使用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

err2008

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值