Nature访谈:蛋白设计只靠AI到底够不够?来听听西湖大学卢培龙等三位大佬怎么说

引言

AlphaFold 3 和 RoseTTAFold All-Atom 的出现,让我们觉得自己手里拿着一把能解决所有问题的锤子。但在顶尖结构生物学家眼里,这把锤子还不够完美。

在 Nature Chemical Biology 最新访谈中,Cecilia Clementi(柏林自由大学)、卢培龙(西湖大学)和 Bruno Correia(洛桑联邦理工)三位大佬坐在一起,把目前的AI蛋白设计“剥皮抽筋”,直白地指出了三个“卡脖子”的硬伤和未来的出路。


01 现状与痛点

目前的深度学习模型大多是在静态的PDB数据集上训练的,这导致它们在处理生物学的动态本质时表现出局限性。

▶ 构象系综的缺失:Cecilia Clementi 指出,对于固有无序蛋白(IDPs)或部分无序区域,目前的工具往往强行将其折叠成非天然的固定构象。缺乏能够量化“分布预测”成功与否的指标,是当前的一大障碍。

环境因素的忽略:卢培龙强调,目前的预测模型并未显式整合pH、温度、压力和离子浓度等关键变量。这意味着模型输出的往往是标准生理条件下的平均结构,而无法反映蛋白在特定生化环境下的构象重排。

缺乏“动态人格”:Bruno Correia提出了一个深刻的观点:蛋白质的功能往往由其微小的动态变化或点突变调节,而这些变化很难被基于统计学习的算法捕捉,因为这些算法缺乏物理首要原理的支撑。

【一句话总结:我们急需从“静态结构预测”跨越到“动态系综模拟”。】


02 解决思路

为了解决上述问题,纯数据驱动的方法正在向物理感知的方法演变。

1. 混合建模

未来的趋势是将机器学习的采样效率与分子动力学(MD)的物理准确性结合。

卢培龙特别提到了AI-BMD(AI-based ab initio biomolecular dynamics) 系统。该系统结合了基于量子力学数据训练的机器学习力场,能够以极低的计算成本对超过10,000个原子的生物大分子进行全原子模拟,达到了从头计算的精度。

2. 引入热力学约束

Cecilia Clementi 的团队正在致力于开发多尺度方法,将粗粒化模型与机器学习结合,试图在长时标上模拟蛋白质动力学。她强调,模型必须满足热力学原理和物理约束,才能减少“幻觉”,准确预测构象变化和结合亲和力。

【一句话总结:未来的赢家,是“深度学习+分子动力学”的混血儿。】


03 终极挑战

生成式AI(如RFdiffusion)虽然让蛋白质设计大众化,但设计具有复杂功能的动态蛋白仍是挑战。

膜蛋白设计的深水区:卢培龙指出,目前的挑战已从设计静态支架转向设计动态膜蛋白(如转运体和受体)。这要求我们不仅要模拟静态结构,还要准确模拟自由能图景和配体相互作用,从而实现对跨膜信号的智能调控。

功能设计的瓶颈:Bruno Correia补充道,设计小分子结合位点和酶活性中心依然困难,因为这高度依赖于对侧链细节和蛋白质微观动力学的精确控制。


04 大佬们给社区的喊话:我们需要“失败的数据”

深度学习的上限取决于数据,所以除了更高分辨率的结构数据,学者们呼吁建立新的数据集标准:

1. 把“失败”亮出来:卢培龙呼吁大家共享那些无功能的设计数据(Negative Examples)。AI只有知道什么是“错”的,才能学会什么是“对”的。

2. 要“动态”的数据:别光给PDB晶体结构,我们需要NMR、交联质谱这种能反映中间态的数据。

3. 要“免疫”的数据:Bruno Correia希望能有大规模的深度突变扫描数据,专门预测蛋白药物会不会引起免疫反应,这关系到药能不能进临床。


05 生物安全性:技术中立与源头管控

针对AI辅助蛋白质设计可能带来的生物安全风险(如设计新型病原体),学者们保持了理性的态度:

不要过度监管算法:卢培龙认为,过度监管AI算法本身会阻碍科学进步。

守住DNA合成关口:真正的防线在于商业化DNA合成,通过AI增强的筛查算法,可以有效检测并拦截那些试图逃避传统生物安全筛查的工程化序列,因此解决方案在于提升监控能力,而非限制技术本身。


附录:前沿结构预测与设计工具集

为了方便各位研究者跟进最新技术,我们整理了文中提到的关键工具及其适用场景:

工具名称核心功能与学术定位适用场景
AlphaFold3/Server高精度复合物预测支持蛋白质-核酸小分子配体及修饰的联合预测通用结构预测复合物相互作用分析
RoseTTAFoldAll-Atom全原子互作建模同样具备处理非蛋白组分的能力涉及复杂配体或核酸的系统建模
RFdiffusion条件生成式设计能够以原子分辨率生成以配体或核酸为条件的蛋白质骨架蛋白质从头设计活性位点定制结合蛋白设计
ProteinMPNN序列恢复(Inverse Folding)极高效率的序列设计工具捕捉序列-结构映射给定骨架设计氨基酸序列优化热稳定性
AI-BMD从头算分子动力学,结合机器学习力场与碎片化策略平衡精度与效率需要高精度全原子动力学模拟但受限于算力的场景

结语:从“看清结构”到“理解生命”

三位学者的对话实际上向我们传达了一个明确的信号:结构生物学的“黄金时代”并没有结束,而是刚刚换了条赛道。

AlphaFold为我们点亮了地图,但要真正理解生命的奥秘——那些稍纵即逝的构象变化、那些精妙绝伦的能量转换——我们不能只靠AI的“统计直觉”。我们需要把物理学的严谨、化学的复杂性以及生物学的动态本质重新注入模型之中。

正如他们所言,未来的AI不再只是一个生成静态图像的画笔,而是一架能帮我们看清蛋白质“动态人格”、设计“分子机器”的新时代显微镜。

蛋白设计的下半场,才刚刚开始。


参考资料

[1] Johnson R. Harnessing advances in artificial intelligence for protein design. Nat Chem Biol. 2026;22(1):1-4. doi:10.1038/s41589-025-02110-z

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值