2025 年 3 月 22 日,上海交通大学特聘教授洪亮团队发布了蛋白质设计大模型 Venus1。以下是对该模型的具体介绍4:
- 核心功能
- AI 定向进化:Venus 系列模型可以对一个不尽如人意的蛋白质产品的多种性能进行优化,让它成为一个 “六边形战士” 以满足应用需求。如果想要强化目标蛋白质的某个功能,只需要提供该蛋白质的序列信息,Venus 就可以快速给出一批蛋白质序列改造方案,随后结合实验验证得到最优改造方案。
- AI 挖酶:Venus 系列模型基于其海量的未知功能蛋白质数据集,可以 “海选超能力战士”,去精准发掘满足苛刻应用需求的具备超常规功能的蛋白质,比如极度耐热、极度耐酸、极度耐碱、极度耐胃肠消化等。
- 技术原理:团队建立了全球最大的蛋白质序列数据集 Venus - POD,含有近 90 亿条蛋白质序列,包含数亿个功能标签。通过对这一庞大数据集的学习,模型掌握了自然界蛋白质序列的组织规则以及它与功能之间的关系,从而能够精准、高效地预测、设计蛋白质的功能,实现从序列到功能的直接映射,将复杂的蛋白质设计变成以需求为导向、配合少量实验输出结果的简单过程。
- 产业应用:Venus 设计的多款蛋白质已进入产业化阶段。例如,在国内生长激素龙头金赛药业的单域抗体耐碱性改造项目中,不到 1 年将普通单域抗体耐碱性提升 4 倍,每年为金赛药业节约上千万元成本,该成果已实现多个批次 5000 升放大生产;对某体外诊断头部公司碱性磷酸酶(ALP)的改造项目中,成功优化 ALP,使其分子活性超国际头部公司产品 3 倍,为超敏检测诊断(如心肌梗塞、阿尔兹海默症)带来巨大价值,目前改造后的 ALP 已进入 200L 规模放大生产阶段。