利用gephi作人物网络图

本文介绍了一种利用word2vec训练《红楼梦》中的人物名称并构建人物关系图谱的方法。首先通过jieba分词提取文本中的人名,然后使用word2vec训练模型并计算相似度高的词语。最后,利用Gephi软件将这些数据可视化,形成一张清晰的人物关系网络图。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.先利用word2vec训练数据得到模型

a.利用jieba对文本进行分词,并只提取词性为人名的词,去除分词长度为1和大于4的词

b.利用word2vec训练分词后的文本,并存储

c.利用训练后的模型计算相关度词

d.人工过滤一些杂项(由于分词的不准确造成)

二.利用gephi画图

a.将相似数据组织成gehpi需要的数据结构

b.利用gephi画图,将调整

三.主代码在https://github.com/jiangnanboy/similarity_words中

四.这里利用红楼梦中的人进行计算,使用'薛宝钗', '贾琏', '巧姐', '贾雨村', '凤姐', '贾宝玉', '林黛玉', '贾母', '邢夫人', '史湘云'计算与它们的相似词取前10个

五.显示图

 

转载于:https://www.cnblogs.com/little-horse/p/7453351.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值