# 研究杂感 × Gephi(第一辑)

本文介绍使用Gephi进行语义网络分析的方法,对比LDA主题模型,阐述如何构建词语关系网并进行主题聚类分析。通过具体步骤说明如何处理中文文本数据,包括导入数据、调整节点大小和线条样式等。

写在前面

之前用过ROST CM6 来进行毕设中有关景区整体的感知,但是ROST CM6似乎已经是2010年的产品了,用在2022年毕设有点稍旧(当然Gephi似乎是2009年的产品 )不管怎么说,Gephi不管是从名字上还是内容上似乎好像也许可能比 ROST CM6 高端辣么一点点,现在学习一下绘制过程和方法,将毕设部分进行调整和改进。

正餐开始

其实利用Gephi来进行相关分析和LDA差不多

LDA所做的内容主题是割裂的,无法得知各主题间的相关关系,丢失了词语和句子之间的联系,常常导致我们无法给主题进行准确的命名。

LDA还会遇到一个常见的问题是困惑度不减反增,出现这个问题的原因可能是:

由于短文本的特征稀疏性,传统的LDA获PLSA主题模型分析短文本的效果并不理想
[1] 蔡永明,长青.共词网络LDA模型的中文短文本主题分析[J].情报学报,2018,37(03):305-317

在这里插入图片描述
(毕设中用的都是长段的评论文本,所以没出现问题)

开始说一下语义网络分析

语义网络分析是指从文章中提取某些关键词,然后利用这些词语直接的相似度关系来构建词语的关系网。进而来探索文本想表达的意思,比方说我们可以用其来做主题聚类分析。
在这里插入图片描述
相较于割裂的 LDA 主题我们能通过关系图更清晰了解主题及内容之间的关系讯息。

动手实操

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人生苦短我愛Python

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值