SEAL-CI 开源项目使用教程
1. 项目的目录结构及介绍
SEAL-CI/
├── data/
│ ├── graphs/
│ └── synthetic_edges.csv
├── src/
│ ├── main.py
│ ├── model.py
│ ├── utils.py
│ └── config.py
├── README.md
└── requirements.txt
- data/: 存储项目所需的数据文件,包括图数据和层次图数据。
- graphs/: 存储训练图数据的文件夹。
- synthetic_edges.csv: 层次图数据文件。
- src/: 包含项目的主要源代码文件。
- main.py: 项目的启动文件。
- model.py: 定义模型结构的文件。
- utils.py: 包含一些辅助函数和工具。
- config.py: 配置文件。
- README.md: 项目说明文档。
- requirements.txt: 项目依赖的Python库列表。
2. 项目的启动文件介绍
main.py
main.py
是项目的启动文件,负责加载数据、配置模型参数、训练模型等。以下是主要功能介绍:
- 数据加载: 从
data/graphs/
和data/synthetic_edges.csv
加载训练数据。 - 模型配置: 通过命令行参数配置模型参数,如
epochs
,budget
,labeled-count
等。 - 模型训练: 使用加载的数据和配置的参数训练模型。
命令行参数
python src/main.py --graphs input/graphs/ --hierarchical-graph input/synthetic_edges.csv --epochs 10 --budget 20 --labeled-count 100
3. 项目的配置文件介绍
config.py
config.py
文件包含了模型的配置参数,可以通过修改这些参数来调整模型的行为。以下是一些关键配置参数的介绍:
- epochs: 训练的轮数,默认值为10。
- budget: 每次迭代中新增的标注节点数,默认值为20。
- labeled-count: 初始标注实例的数量,默认值为100。
- first-gcn-dimensions: 图级GCN的第一层过滤器数量,默认值为16。
- second-gcn-dimensions: 图级GCN的第二层过滤器数量,默认值为8。
- first-dense-neurons: SAGE聚合器的神经元数量,默认值为16。
- second-dense-neurons: SAGE注意力层的神经元数量,默认值为4。
- macro-gcn-dimensions: 宏观级GCN的过滤器数量。
通过修改这些配置参数,可以灵活地调整模型的训练过程和性能。
以上是 SEAL-CI 开源项目的使用教程,希望对您有所帮助。如果有任何问题,请参考项目的 GitHub 页面 获取更多信息。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考