推荐开源项目:NeuralPLexer——深度生成模型预测蛋白质-配体复合物3D结构
项目介绍
NeuralPLexer 是一个创新的深度生成模型,旨在联合预测蛋白质-配体复合物的3D结构及其相关特性。该项目由Qiao Z, Nie W, Vahdat A, Miller III TF, Anandkumar A等研究人员开发,并在《Nature Machine Intelligence》杂志上发表(2024年)。通过该模型,用户可以高效地生成高质量的蛋白质-配体复合物结构,为药物设计和生物研究提供强有力的支持。
项目技术分析
NeuralPLexer 采用多尺度深度生成模型,结合了先进的机器学习和生物信息学技术,能够准确预测蛋白质-配体复合物的三维结构。其核心技术包括:
- 多尺度建模:模型在不同尺度上捕捉蛋白质和配体的相互作用,提高预测的准确性。
- 生成对抗网络(GAN):利用GAN技术生成逼真的复合物结构。
- 扩散采样:通过langevin模拟退火等采样技术,优化结构生成的过程。
项目依赖于GPU计算资源,要求CUDA版本不低于10.2,并推荐使用libmambda solver for conda
进行环境配置。
项目及技术应用场景
NeuralPLexer 适用于多种生物研究和药物开发场景,包括但不限于:
- 药物设计:预测药物分子与蛋白质的结合模式,加速新药研发。
- 生物分子研究:研究蛋白质-配体相互作用机制,揭示生物过程。
- 结构生物学:提供高精度的蛋白质-配体复合物结构,辅助实验验证。
项目特点
- 多功能性:支持单链或多链蛋白质、单个或多个配体的复合物结构预测。
- 灵活性:输入可以是PDB文件、蛋白质序列、sdf文件或SMILES字符串,适应不同用户需求。
- 高效性:并行生成多个结构样本,显著提高计算效率。
- 易用性:提供命令行界面(CLI),操作简便,易于集成到现有工作流程。
安装指南
- 确保系统具备支持CUDA>=10.2的GPU。
- 设置
libmambda solver for conda
环境:make environment make install
使用示例
预测带有模板结构的蛋白质-配体复合物:
neuralplexer-inference --task=batched_structure_sampling \
--input-receptor input.pdb \
--input-ligand <ligand>.sdf \
--use-template --input-template <template>.pdb \
--out-path <output_path> \
--model-checkpoint <data_dir>/models/complex_structure_prediction.ckpt \
--n-samples 16 \
--chunk-size 4 \
--num-steps=40 \
--cuda \
--sampler=langevin_simulated_annealing
输出结果
在指定输出目录下,生成包含所有预测结构的prot_all.pdb
和lig_all.sdf
文件,以及各个样本的独立文件。
结语
NeuralPLexer 作为一款强大的开源工具,为蛋白质-配体复合物结构预测提供了全新的解决方案。其高效、灵活且易用的特性,使其成为生物研究和药物开发领域的宝贵资源。立即尝试NeuralPLexer,开启您的科研新旅程!
项目链接:NeuralPLexer GitHub
参考文献:Qiao Z, Nie W, Vahdat A, Miller III TF, Anandkumar A. State-specific protein-ligand complex structure prediction with a multi-scale deep generative model. Nature Machine Intelligence, 2024. https://doi.org/10.1038/s42256-024-00792-z.
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考