在 De Novo Protein Design(蛋白质从头设计)的领域中,如果说 RFdiffusion 等扩散模型的出现,解决了“如何构建一个优美骨架”的问题,那么 ProteinMPNN 的诞生,则真正解决了“如何让这个骨架在生物学上成立”的问题。
然而,对于大多数一线科研人员来说,从论文中的代码仓库到实验室电脑里的可用工具,中间隔着巨大的“环境鸿沟”:CUDA 版本冲突、依赖包版本不兼容、显存溢出、繁琐的 Python 脚本参数……这些非科学层面的琐事,往往消耗了研究者 50% 以上的精力。
SciMiner 平台 的初衷,就是打破这种壁垒。今天,我们正式向大家介绍 SciMiner 深度集成的 ProteinMPNN 全家桶模块。
ProteinMPNN 家族:为什么它是序列设计的“黄金标准”?
ProteinMPNN 被誉为蛋白质序列设计的“逆折叠(Inverse Folding)”神器。相比于传统的 RosettaDesign,它在速度上提升了数千倍,且设计出来的序列具有极高的成功率和折叠恢复率。
在 SciMiner 中,我们深度集成了整个生态矩阵,满足不同细分场景的需求:
1. 经典 ProteinMPNN:基础设计的定海神针
这是最通用的版本,适用于大多数单体或多聚体蛋白的序列设计。它能根据主链骨架坐标,快速预测出最匹配的氨基酸序列。

2. LigandMPNN:复杂体系的“操盘手”
在药物研发中,蛋白质往往不是孤立存在的。LigandMPNN 是该家族的重大升级,它在设计序列时能够感知配体(Ligand)的存在,是酶活性中心设计与小分子结合口袋优化的利器。

3. SolubleMPNN:解决“表达难题”的杀手锏
很多设计的蛋白在计算机模拟中很完美,但一到湿实验阶段,往往面临“不表达”或“包涵体”的尴尬。SolubleMPNN 通过调整参数和模型偏好,显著提升了设计蛋白的水溶性。

4. AntiBMPNN:抗体设计的专项优化
抗体(Antibody)的 CDR 区设计具有极高的柔性和特异性要求。AntiBMPNN 针对抗体结构特征进行了权重微调,是开发新型抗体药物、提高亲和力的强力武器。

深度定制交互:从“操作参数”到“掌控设计”
我们始终认为,优秀的工具应当是科学思想的延伸,而非阻碍。 因此,SciMiner自研了一系列提升交互体验的“黑科技”。
1. 创新级“残基选择插件”:所见即所得的精准控场
在传统的流程中,指定重设计(Redesign)区域通常需要手动输入一长串残基编号,极易因序号错位导致整个计算任务推倒重来。SciMiner 研发的 Residue Select 插件彻底改变了这一点:
● 智能解析与动态关联: 可直接关联上传文件,点击 Parse 即可瞬间完成结构解析。
● 序列化映射交互:将 3D 结构转化为直观序列流,通过点击或简洁语法(如 1-3)即可快速锚定。
● 可视化反馈: 选中的残基会在序列框中实时呈现。这种直观的确认机制,让研究者可以把精力从“对数字”转向“定策略”,大幅降低了误操作风险。

2. 全参数矩阵的可视化:拒绝算法“黑盒”
SciMiner 为 ProteinMPNN 提供了全量参数配置界面,让每一项科学决策都有据可依:
● 采样温度 (sample_temperature): 精准调节设计的灵活性与保守性。
● 氨基酸偏好 (bias_AA_info): 想要避开半胱氨酸?或是增加带电残基?通过界面即可直接干预算法的生成偏好。
3. “生成-设计-优化”的无缝集成流
SciMiner 的真正核心优势在于其工具链的集成效率。在我们的生态中,ProteinMPNN 与前端的骨架生成工具(如 RFantibody)以及后端的结构验证工具形成了强耦合。骨架生成任务产出的 PDB,可以作为参数流转至 ProteinMPNN 插件中进行序列灌注。最后再调用 AlphaFold3 等进行正向折叠验证。这种全链条的数字化管理,让科研过程变得可追溯、可复现、高效率。
实战场景:PD-L1 靶点 Binder 设计全流程
为了验证实战效能,我们针对明星肿瘤靶点 PD-L1 进行了 Binder 全流程设计。
1. 实验设定与约束
● 靶点:PD-L1 (A 链),锁定核心热点残基 A39(对应 PDB A56)作为设计锚点。
● 设计空间:长度 65–150 aa,旨在生成紧密结合的全新 Binder 链。
2. 路线策略:RFdiffusion + ProteinMPNN + AF3 + Rosetta
Step 1:RFdiffusion 生成 10 个 Binder 骨架。

Step 2:ProteinMPNN 为每个骨架设计 5 条序列。

Step 3:AlphaFold3 结构预测,筛选高置信度复合物。

Step 4:Rosetta InterfaceAnalyzer 统一指标分析。

3. 结果评估与指标分析
通过 SciMiner 的集成流,我们最终得到了 10 条高质量的设计结果。关键界面指标如下:

案例洞察: 在实战中我们发现,虽然 AI 能产出极优样本(如 design4),但样本间的质量波动明显(dG 从约 -54 到 -16 不等)。这进一步证明了:高效的可视化筛选平台对于“后筛与人工甄别”至关重要。 SciMiner 让研究者能在一分钟内通过指标看板锁定那一两颗“明珠”。
结语:让科学家回归科学
AI4Science 的核心目的不是替代科学家,而是将科学家从重复性的数据处理、环境配置和代码纠错中解放出来。SciMiner 部署 ProteinMPNN 家族工具,是我们构建“数字化实验室”的重要一步。我们希望,未来的蛋白质设计,可以像在画布上作画一样直观,像在工厂里组装零件一样精准。
目前,SciMiner 的 ProteinMPNN 模块已全面开放试用。 无论你是学术界的求索者,还是工业界的开发者,欢迎注册体验,开启你的高效设计之旅!
文末互动
-
在蛋白质设计中,你遇到过最大的坑是什么?(欢迎留言分享)
-
你还希望 SciMiner 部署哪些 AI 工具?评论区见!


被折叠的 条评论
为什么被折叠?



