LDAvis
LDA主题的交互式探索工具。
输入
- 主题:来自主题建模的所有LDA主题。
LDAvis 是 Orange 对 pyLDAvis 的实现,而 pyLDAvis 源自 Sievert 和 Shirley(2014)开发的 R 包 LDAvis。该可视化工具通过调整主题中高排名词汇的权重,用于探索 LDA 主题模型。参数“相关性”(Relevance)用于调整词汇权重,取值范围为 0 到 1:值为 1 时,词汇仅按其在主题中的频率排名;值为 0 时,词汇仅按“提升度”(词汇在主题中的概率与在语料库中的概率之比)排名。

- 调整单词在主题中相关性的参数:值为 1 时,显示与“主题建模”组件中相同的词汇。
- 主题列表。
右侧图表展示了按计算后的相关性排名前 20 的词汇。默认相关性值为 0.5(作者建议 0.6),可在主题内概率和提升度之间达到平衡。横轴权重表示词汇的绝对计数,红色条形表示主题内概率,灰色条形表示词汇在语料库中的概率。
示例
以下是如何在 Orange 中近似实现完整 LDAvis 功能的步骤:
- 使用
订阅专栏 解锁全文
230

被折叠的 条评论
为什么被折叠?



