高级主题建模与文本聚类分类
高级主题建模可视化
在主题建模中,树状图(dendrogram)是一种非常有用的工具。它是一种树状结构的图形,可用于可视化任何类型的层次聚类结果。层次聚类会将单个数据点划分到相似性组中,并且根据组的内容,一些组会处于其他组之上。例如,在对包含各种行业的语料库进行建模时,“梅赛德斯”主题可能会位于“汽车”主题之下。我们可以利用树状图来探索主题模型,了解在聚类过程中主题是如何通过一系列连续的融合或划分相互关联的。
所有这些可视化操作都基于Gensim库,相关的Jupyter笔记本都来自Gensim文档。花些时间运行这些笔记本并亲自查看可视化结果是很有价值的。
此外,还有一些非官方的Gensim可视化工具,能让我们以有趣的方式查看数据,以下是相关链接:
- Visualizing Trends
- Topic Modeling and t - SNE Visualization
- Visualizing Topic Shares
-
超级会员免费看
订阅专栏 解锁全文
4521

被折叠的 条评论
为什么被折叠?



