EigenFold 项目使用教程
EigenFold 项目地址: https://gitcode.com/gh_mirrors/ei/EigenFold
1. 项目目录结构及介绍
EigenFold 项目的目录结构如下:
EigenFold/
├── diffusion/
│ ├── model/
│ └── pretrained_model/
├── splits/
├── structures/
├── utils/
├── LICENSE
├── README.md
├── download_pdb.sh
├── eigenfold.png
├── ensemble_analysis.ipynb
├── inference.py
├── make_embeddings.py
├── make_splits.py
├── single_structure_analysis.ipynb
├── train.py
└── unpack_pdb.py
目录介绍:
- diffusion/: 包含扩散模型的相关文件,如模型定义和预训练模型。
- splits/: 包含用于训练和测试的数据集分割文件。
- structures/: 包含蛋白质结构的参考文件。
- utils/: 包含项目中使用的各种实用工具和辅助函数。
- LICENSE: 项目的开源许可证文件。
- README.md: 项目的介绍和使用说明。
- download_pdb.sh: 用于下载PDB数据的脚本。
- eigenfold.png: 项目的图标或示意图。
- ensemble_analysis.ipynb: 用于分析多个预测结构的Jupyter Notebook。
- inference.py: 用于推理和生成蛋白质结构的Python脚本。
- make_embeddings.py: 用于生成OmegaFold嵌入的Python脚本。
- make_splits.py: 用于生成数据集分割的Python脚本。
- single_structure_analysis.ipynb: 用于分析单个预测结构的Jupyter Notebook。
- train.py: 用于训练模型的Python脚本。
- unpack_pdb.py: 用于解压PDB数据的Python脚本。
2. 项目启动文件介绍
inference.py
inference.py
是用于推理和生成蛋白质结构的主要启动文件。它接受输入序列,生成相应的蛋白质结构,并输出结果。
使用方法:
python inference.py --model_dir /path/to/pretrained_model --ckpt epoch_7.pt --pdb_dir /path/to/structures --embeddings_dir /path/to/embeddings --embeddings_key name --elbo --num_samples 5 --alpha 1 --beta 3 --elbo_step 0.2 --splits /path/to/splits/split.csv
train.py
train.py
是用于训练模型的启动文件。它从数据集中读取数据,进行模型训练,并保存训练好的模型。
使用方法:
python train.py --splits /path/to/splits/split.csv
3. 项目配置文件介绍
README.md
README.md
是项目的配置文件之一,包含了项目的详细介绍、安装步骤、使用说明和常见问题解答。它是用户了解项目的第一手资料。
LICENSE
LICENSE
文件包含了项目的开源许可证信息,规定了项目的使用、修改和分发的条款。
download_pdb.sh
download_pdb.sh
是一个配置文件,用于下载PDB数据。用户可以根据需要修改脚本中的下载路径和参数。
make_embeddings.py
make_embeddings.py
是一个配置文件,用于生成OmegaFold嵌入。用户可以通过修改脚本中的参数来调整嵌入的生成方式。
make_splits.py
make_splits.py
是一个配置文件,用于生成数据集的分割。用户可以根据需要调整分割的比例和方式。
通过以上介绍,您应该对EigenFold项目的目录结构、启动文件和配置文件有了基本的了解。希望这份教程能帮助您更好地使用和配置EigenFold项目。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考