LigandMPNN 完全指南:3步掌握蛋白质序列设计
【免费下载链接】LigandMPNN 项目地址: https://gitcode.com/gh_mirrors/li/LigandMPNN
LigandMPNN 是一款基于深度学习的蛋白质序列设计工具,能够智能生成与特定蛋白质骨架结构兼容的氨基酸序列。该工具在药物发现和蛋白质工程领域具有重要应用价值。
项目核心概览
LigandMPNN 通过消息传递神经网络技术,实现了从蛋白质三维结构到氨基酸序列的智能设计。相比传统方法,它能更好地考虑配体环境对序列设计的影响。
快速上手指南
环境准备步骤
首先确保系统已安装必要的依赖包:
pip install torch ProDy scipy
获取项目代码
git clone https://gitcode.com/gh_mirrors/li/LigandMPNN.git
cd LigandMPNN
下载模型参数
bash get_model_params.sh "./model_params"
运行首个设计案例
python run.py \
--seed 111 \
--pdb_path "./inputs/1BC8.pdb" \
--out_folder "./outputs/default"
实际应用场景
药物靶点优化
在药物研发中,LigandMPNN 可用于优化蛋白质靶点的结合特性,提高药物分子的亲和力。
酶工程改造
通过重新设计酶的活性位点序列,提升催化效率或改变底物特异性。
蛋白质稳定性增强
重新设计表面氨基酸序列,提高蛋白质的热稳定性和表达量。
配置技巧详解
温度参数调节
通过调整温度参数控制序列多样性:
python run.py \
--seed 111 \
--pdb_path "./inputs/1BC8.pdb" \
--temperature 0.05 \
--out_folder "./outputs/temperature"
残基固定设置
保留特定残基的原始序列:
python run.py \
--seed 111 \
--pdb_path "./inputs/1BC8.pdb" \
--out_folder "./outputs/fix_residues" \
--fixed_residues "C1 C2 C3 C4 C5 C6 C7 C8 C9 C10" \
--bias_AA "A:10.0"
批量序列生成
一次性设计多个序列变体:
python run.py \
--seed 111 \
--pdb_path "./inputs/1BC8.pdb" \
--out_folder "./outputs/batch_size" \
--batch_size 3 \
--number_of_batches 5
相关工具集成
ProDy 结构解析
项目使用 ProDy 库进行 PDB 文件解析,能够准确处理残基索引、链标识和插入码信息。
OpenFold 侧链打包
集成 OpenFold 的侧链打包功能,生成更准确的三维结构模型。
多种模型支持
- ProteinMPNN:通用蛋白质序列设计
- LigandMPNN:考虑配体环境的序列设计
- SolubleMPNN:可溶性蛋白质专用设计
常见问题解答
如何选择合适的模型类型?
对于包含配体的蛋白质结构,推荐使用 LigandMPNN 模型;对于普通蛋白质,ProteinMPNN 是更好的选择。
输出文件格式说明
- FASTA 文件:包含设计的氨基酸序列
- PDB 文件:包含完整的结构信息,包括链标识和残基索引
序列恢复率计算
序列恢复率仅针对重新设计的残基进行计算,反映设计序列与原始序列的相似程度。
置信度指标解读
输出中包含两个置信度指标:
- overall_confidence:整体设计置信度
- ligand_confidence:配体相关残基设计置信度
值域范围 0.0 到 1.0,数值越高表示模型对该序列越有信心。
提示:建议优先使用 PDB 格式输出文件,因为它们包含更完整的结构信息。
【免费下载链接】LigandMPNN 项目地址: https://gitcode.com/gh_mirrors/li/LigandMPNN
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



