Co-occurrence-Matrix 项目使用教程
1. 项目目录结构及介绍
Co-occurrence-Matrix/
├── Co-occurrence_Matrix.py
├── LICENSE
├── README.md
├── data.csv
├── network.gexf
├── network.svg
└── 作者关系图.gephi
- Co-occurrence_Matrix.py: 项目的主要代码文件,用于构建共现矩阵并以三元组形式存储到CSV文件。
- LICENSE: 项目的开源许可证文件,本项目使用MIT许可证。
- README.md: 项目的说明文件,包含项目的基本介绍和使用方法。
- data.csv: 存储原始数据的CSV文件,包含每篇论文的作者信息。
- network.gexf: 生成的网络图文件,用于可视化作者之间的合作关系。
- network.svg: 生成的网络图文件的SVG格式,用于在网页中嵌入。
- 作者关系图.gephi: 使用Gephi软件生成的作者关系图文件。
2. 项目启动文件介绍
项目的启动文件是 Co-occurrence_Matrix.py。该文件包含了构建共现矩阵的主要逻辑,具体步骤如下:
- 读取并分割数据: 从
data.csv文件中读取作者信息,并将其分割成列表。 - 统计节点和关系频数并构建共现矩阵: 遍历每行的作者信息,统计每个作者的出现频次以及两两作者之间的合作频次,构建共现矩阵。
- 对结果字典按照值进行倒序排序: 对生成的节点和边字典进行排序,确保合作频次高的关系排在前面。
- 写入到CSV文件: 将排序后的结果写入到CSV文件中。
3. 项目的配置文件介绍
项目中没有专门的配置文件,所有的配置和参数都在 Co-occurrence_Matrix.py 文件中进行设置。以下是一些关键配置项:
- 文件路径: 在
get_Co_authors函数中设置data.csv文件的路径。 - 编码方式: 在读取文件时,设置编码方式为
utf-8-sig,以防止文件首部出现\ufeff字符。 - 排序方式: 在
sortDictValue函数中设置是否按照倒序排序。
通过这些配置项,用户可以根据自己的需求调整项目的运行方式。
以上是 Co-occurrence-Matrix 项目的使用教程,希望对你有所帮助!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



