# 研究杂感 × Gephi探秘飞升（第三辑）

原创已于 2022-03-27 10:39:04 修改 · 1.7k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #数据分析

于 2022-03-26 21:55:56 首次发布

Faya美数课专栏收录该内容

13 篇文章

订阅专栏

本文介绍了使用Gephi绘制网络图的详细步骤，包括PMI-Gephi网络构建、edge_csv数据规整、解决导入数据时的乱码问题、图像调整以及保存设置。通过高级筛选功能优化数据，调整节点大小和线条粗细，以实现更清晰、简洁的网络图。

写在前面

现在是2022年03月26日，周六晚20:35
前段时间准备将ROST CM6 绘制的图像转用 Gephi 软件来进行替代
也学习了一些前人的经验，但据我个人总结，Gephi具有以下2个硬伤：

1、绘制的线条过多过乱
2、无法直接选择节点大小

当然在之前也给出了一些解决方法，如通过筛选控制线条数目，采用导入文件的形式控制节点 Size 等，但我个人觉得依然不是一个很好的方法。

于是我就尝试了一下 Gephi 第一辑中我脑海中一闪而过的念头，事实证明，这确实或者说应该是对于大量无规则语义内容最为行之有效的 Gephi 绘图方案（至少目前我是这样觉得的）
在这里插入图片描述
收回第一辑的这段话（光速打脸）
并在第三辑阐明这才是最好用的方法！！

正餐开始

测试结果样例：
在这里插入图片描述

完成一幅高质量的 Gephi 图，需要从以下几个方面出发，下面就一步步讲如何实现上述过程：

1、PMI-Gephi 网络构建

利用PMI-Gephi相关代码构建完网络图（共现矩阵）之后，点选数据资料，即可查看相关数据信息

首先是节点的相关数据信息，具有代表性的是具有 Modularity Class（事先经过模块化处理）和加权度，且AB块内容完全相同
在这里插入图片描述
其次是边相关的数据信息，具有代表性的是有一个起点（源）和终点（目标），同时选用无向连接，也具有相关权重。

接下来需要把相关的两个表内数据复制粘贴到 Excel 文件中：
（另存为.csv文件）

其中 node 文件可以直接拿来用：
在这里插入图片描述

PS：其实在这里node文件也是经过修整的（不然还多搞这一步干嘛）主要是人工筛除一些对主题分析无关的词语，接着就可以将Node拿来用了（我这里是通过Python构建150词的共现矩阵，接着人工筛除至55词）

但是 edge 文件就需要大幅修改：

大幅修改的原因是将node文件进行了修整，但 edge 的边数数据依然没有变化，这将导致边数>节点数，并且由于 edge 文件中源和目标的数据不同，这将导致两次筛选
在这里插入图片描述

2、edge_csv 数据规整

传统对数据集进行点选筛除过于繁琐且容易出错，采用Excel的高级筛选功能进行解决：
在这里插入图片描述

首先将作为参照的替换源和目标复制粘贴放在旁边：
在这里插入图片描述
接着通过高级筛选功能将原edge数据进行第一次筛选：

右侧绿色数据即是我们想要的数据，但绿色右侧的部分还需要进一次筛选，依然采用同样的方法进行。

两次筛选过后，将最终内容放置到一个新的edge.csv里即可

于是我们就准备好了2个想要的数据。

3、打开Gephi导入数据

导入CSV文件，出现了乱码
在这里插入图片描述
解决方案：
找到乱码CSV文件–用记事本打开–另存为UTF-8格式
这时候再尝试导入即没有问题

点选无向图–新工作台

边文件也采取同样方案进行导入，唯一区别在于点选的是Append to existing workplace 选项。

4、图像调整

这个时候再点选概览，图像就简明很多了
在这里插入图片描述
其他的调试基于1-2辑的数据，在这里不过多赘述，特别强调几个点：
由于自定义中可以自定义Size相关内容：
（这个size 可以通过pageranke得出）
但是我调整多次Size没有任何变化，一怒之下将Size调整至200，效果就很明显了：
在这里插入图片描述
看来还是对Gephi太仁慈了（~~滚刀肉是吧？~~ ）

这个配色不错，偶然随便搞的，i了i了