1.下载原代码
2.配置环境
这个环境比较奇怪,笔者尝试了多次,总算找到了以最短时间配置好环境的方式(以AutoDL为例)
预设版本:
然后根据原项目的requirement.txt文件下载对应版本的库
- 这个很重要,如果版本不一样会出现非常多的问题,建议为这个项目新建一个环境
- requirement.txt也需要修改,笔者直接下载时报错。
修改后如下:
dgl==1.1.3
graph_nets==1.1.0
h5py==3.10.0
joblib==1.3.2
lie_learn==0.0.1.post1
MDAnalysis==2.7.0
MDAnalysisData==0.9.0
numpy==1.24.1
packaging==24.0
scikit_learn==1.3.2
scipy==1.12.0
sympy==1.12
torch==2.1.0
torch_geometric==2.5.2
torch_scatter==2.1.2
torch_sparse==0.6.18
tqdm==4.66.1
数据集
protein数据集
如果出现:
File "/root/miniconda3/lib/python3.10/urllib/request.py", line 643, in http_error_default
raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden
说明需要连接代理。
如果连接代理失败,需要手动去下载数据集
下载数据集方法
根据报错信息找到下载数据集的文件:
笔者使用的路径在此处
/root/miniconda3/lib/python3.10/site-packages/MDAnalysisData/adk_equilibrium.py
打开adk_equilibrium.py
这个文件查看
(1)数据下载
需要用到两个数据
然后到对应的url中下载(需要代理)
将下载好的文件放进对应文件夹中,/root/FastEGNN-main/data/ adk_equilibrium
其中/root/FastEGNN-main/data/
是需要在主程序运行脚本中修改的文件目录
# Sample Shell Script for Protein Dataset``
data_directory=/root/FastEGNN-main/data
virtual_channel=3
cutoff_rate=0.5
model='FastEGNN'
python ./main_protein.py --model $model --data_directory $data_directory --dataset_name 'adk' --seed 43 --early_stop 100 \
--virtual_channel $virtual_channel --cutoff_rate $cutoff_rate --device 'cpu'
注意:下载的数据文件名和实际程序中的数据文件名有出入,需要按照图片中的进行修改。
(2)一些修改
将download_is_missing
改成False
nbody数据集
按照readme的操作就行了,比较简单