Protenix 使用与启动教程
1. 项目介绍
Protenix 是由字节跳动开源的一个基于 PyTorch 的 AlphaFold 3 的可训练再现。AlphaFold 是一种预测蛋白质结构的算法,Protenix 继承了其核心功能,并在此基础上进行了优化和扩展。该项目旨在为科研人员和开发者提供一个强大的工具,用于蛋白质结构预测和研究。
2. 项目快速启动
环境准备
在开始之前,请确保您的系统中已安装了 Python 3 以及必要的依赖项。以下命令将帮助您安装所需的库:
pip3 install torch
pip3 install -r requirements.txt
安装 Protenix
通过 PyPI 安装
推荐使用 PyPI 进行安装:
pip3 install protenix
使用 Docker
如果您对模型训练感兴趣,建议使用 Docker 进行安装:
docker pull bytedance/protenix
在 CPU-only 机器上安装
对于只在 CPU 上进行开发的情况,可以使用以下命令:
python3 setup.py develop --cpu
运行示例
以下命令将展示如何使用 Protenix 进行模型预测:
# 使用预计算的 MSA 目录进行预测
protenix predict --input examples/example.json --out_dir ./output --seeds 101
# 如果 JSON 文件中没有包含预计算的 MSA 目录,可以使用以下命令
protenix predict --input examples/example_without_msa.json --out_dir ./output --seeds 101,102 --use_msa_server
将 PDB/CIF 文件转换为 JSON
如果您输入的是 PDB 或 CIF 文件,可以将其转换为 JSON 文件进行推理:
protenix tojson --input examples/7pzb.pdb --out_dir ./output
3. 应用案例和最佳实践
使用 Protenix 进行蛋白质结构预测时,以下是一些最佳实践:
- 确保输入的 JSON 文件格式正确,并且包含了所有必要的参数。
- 利用预计算的 MSA(多重序列比对)可以提高预测的准确性。
- 对于不同的预测任务,可能需要调整模型参数以获得最佳结果。
4. 典型生态项目
Protenix 作为开源项目,已经有一些生态系统项目在对其进行扩展和应用。以下是一些典型的生态项目:
- Protenix-Dock:这是一个基于经典蛋白质-配体对接框架的实现,不使用深度神经网络即可提供有竞争力的刚体对接性能。
- PyMOLfold:如果想要使用 PyMOL 进行 Protenix 推理,可以参考这个项目。
请根据具体需求选择合适的项目进行集成和使用。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考