Nature推荐!哈佛MIT联手打造ToolUniverse,600个科学工具all in,重塑科研范式

哈佛和麻省理工学院的研究者们,联手打造了一个名为ToolUniverse的生态系统,目标是让每个科研人,都能构建自己的AI科学家。

图片

ToolUniverse,甚至被Nature的一篇《AI智能体将如何改变研究:科学家指南》的文章推荐。

图片

想象一下,未来的科学发现,不再是少数顶尖科学家长年累月泡在实验室里的专利,而是一个任何有点子、有想法的研究者,都能通过一个平台,像搭积木一样,快速构建一个专属的AI助手,一个能自主推理、设计实验、分析数据的“AI科学家”。

人人都能拥有自己的AI科学家

“AI科学家”不是一个只会聊天、画画的通用模型,而是一个能深度参与科学发现过程的计算系统。它得能看懂文献、会用专业软件、能设计实验方案,甚至能在海量数据里发现人类科学家忽略的蛛丝马迹。

ToolUniverse把自己定义成一个生态系统,核心使命是标准化AI科学家调用工具的方式。你可以把它理解成一个超级适配器,或者一个科学工具的“应用商店”。无论你想用的AI模型是开源的GPT系列,还是闭源的Claude、Gemini,也无论你想用的工具是某个生物信息学软件,还是一个化学数据库,ToolUniverse都能通过一套统一的“语言”和“接口”把它们无缝连接起来。

图片

你不再需要为每个模型、每个工具单独写适配代码。你只需要告诉ToolUniverse你的研究目标,它就能帮你找到合适的工具,并指挥AI模型去使用它们。

这个生态系统最酷的地方在于,它提供了一个环绕任何AI模型的统一环境。用户可以在不进行额外模型训练或微调的情况下,创建和完善一个完全定制化的AI研究助手。这意味着,构建AI科学家的成本和技术门槛,被史无前例地拉低了。

ToolUniverse集成了超过600个机器学习模型、数据集、应用程序接口和科学软件包。这个庞大的工具箱,几乎涵盖了从数据分析、知识检索到实验设计的方方面面。

更绝的是,它还能自动优化工具接口,确保AI能正确理解和使用这些工具。甚至,你可以只用几句自然语言描述,ToolUniverse就能帮你凭空创造一个全新的工具出来。

如果一个工具不够用,它还能把多个工具串联起来,组成一个复杂的工作流,自动执行多步骤的科研任务。

这就是ToolUniverse的野心:它要做的,是科学研究领域的“安卓”或“iOS”,一个开放、标准、包罗万象的平台,让开发者和科学家们能专注于创造和发现,而不是把时间浪费在繁琐的系统集成上。

AI科学家的“七种武器”

要支撑起这么大的一个生态,ToolUniverse背后有一套设计精巧的技术架构。它的核心,是一套被称为“AI-Tool交互协议”的规则。这套协议,就像是互联网世界的超文本传输协议(HTTP),它为AI科学家和海量科学工具之间的沟通,建立了一套统一的标准。

这套协议定义了两件事:工具应该如何被描述,以及AI应该如何调用它们。每个工具,无论功能多复杂,都必须按照一个标准的“说明书”模板来介绍自己,包括它的名字、功能描述、需要哪些输入参数、会返回什么样的结果。这样一来,任何AI模型拿到这个说明书,都能立刻明白这个工具是干嘛的、怎么用。

当AI决定使用某个工具时,它会发出一个标准格式的“调用请求”,就像我们在浏览器地址栏输入网址一样。ToolUniverse收到请求后,会负责执行,然后把结果以结构化的形式返回给AI。

整个过程被高度抽象和标准化,AI根本不需要关心这个工具是在本地电脑上运行的一个Python函数,还是远在天边云服务器上的一个复杂模型。它看到的,只是一个即插即用的标准化接口。

在这套核心协议之上,ToolUniverse构建了六个强大的核心组件,它们就像AI科学家的“七种武器”,各司其职,共同支撑起整个系统的运转。

第一个组件叫“工具查找器”(Tool Finder)。

当AI科学家接到一个任务,比如“帮我找一些能预测蛋白质结构的工具”,它就需要这个查找器来帮忙。

工具查找器有三套看家本领来应对这个需求。

一是关键词搜索,简单直接,就像我们在搜索引擎里敲字一样。它会把你的需求拆分成关键词,然后去它的工具库里做匹配。

二是基于大语言模型的上下文搜索。它会把你的任务描述和候选工具的说明书一起打包,扔给一个大语言模型,让模型用它的“智慧”去理解你的真实意图,然后推荐最合适的工具。

三是嵌入搜索,这是一种可扩展的相似性匹配。它会把所有工具的描述都转换成一串数字,也就是“向量”,存进一个专门的数据库。当你提出需求时,它也把你的需求转换成向量,然后在数据库里寻找语义上最接近的工具。这三招结合,保证了找工具这件事,既快、又准、还很聪明。

第二个组件是“工具调用器”(Tool Caller)。

找到工具后,就得用起来。工具调用器就是那个负责执行的伙计。它会先检查AI给的参数格式对不对,确保不会因为一个小数点或者一个字母的错误导致程序崩溃。然后,它会采用一种“动态加载”的策略,只有在你真正需要某个工具的时候,才把它加载到内存里,避免系统资源被大量闲置工具占用。

执行完毕后,它会把结果打包成AI能看懂的结构化数据返回。整个过程,它就像一个严谨的管家,确保每一次工具调用都准确无误、高效可靠。

第三个组件叫“工具管理器”(Tool Manager)。

这个组件负责不断扩充ToolUniverse的工具库。如果你开发了一个新工具,想让它加入这个生态系统,工具管理器提供了非常便捷的注册方式。

对于简单的本地工具,你只需要提供一个符合规范的配置文件和工具代码,用一个简单的函数就能完成注册。对于那些有特殊依赖、或者因为隐私问题不能公开的远程工具,它也提供了一套安全的连接机制,让这些工具能以“远程服务”的形式接入,同样可以被生态系统内的所有AI科学家调用。

第四个组件是“工具组合器”(Tool Composer)。

单个工具的能力是有限的,但科学研究往往需要多步骤、多工具的协同。

工具组合器就是干这个的,它能把现有的单个工具,像串珠子一样串起来,形成一个强大的复合工具或者工作流。它支持多种组合方式,比如“顺序执行”,把上一个工具的输出,当作下一个工具的输入;“并行执行”,让几个互不干扰的工具同时开工,提升效率;还有“反馈驱动执行”,系统会根据中间步骤的结果,动态调整后续的执行路径,让整个工作流变得“智能”和“自适应”。

第五个组件是“工具发现器”(Tool Discover)。

这是ToolUniverse最具创造力的部分。如果你需要的工具在现有库里找不到怎么办?没关系,自己造一个。

你只需要用自然语言描述一下你想要一个什么样的工具,比如“我想要一个能从论文摘要里提取实验数据的工具”。工具发现器这个多智能体系统就会开始工作。它会先去分析现有工具,学习它们的规范和模式,然后为你合成一个形式化的工具规范,接着自动生成可执行的代码,并编写测试用例来验证这个新工具是否符合预期。

整个过程会不断迭代优化,直到生成的工具达到质量标准。这几乎相当于拥有了一个7x24小时待命的程序员。

第六个组件是“工具优化器”(Tool Optimizer)。

有了工具还不够,工具的“说明书”(也就是文档)写得好不好,直接影响AI能不能用好它。

工具优化器就是一个专门给工具文档“挑刺”和“润色”的多智能-体系统。它会自动生成各种测试用例来运行工具,然后比较工具的实际行为和文档描述是否一致。如果不一致,或者描述得不够清晰、准确、简洁,它就会自动生成优化后的描述。

这个过程同样是多轮迭代的,它会从清晰度、准确性、完整性等六个维度给文档打分,直到把文档质量打磨到最优。

这六大组件,环环相扣,从工具的发现、调用、管理,到组合、创造和优化,构成了一个完整的生命周期,让ToolUniverse不仅仅是一个工具的集合,更是一个能自我进化、不断成长的生态系统。

AI科学家亲自下场搞药物研发

理论说再多,不如实际跑一跑。为了验证ToolUniverse的真实能力,研究团队用它构建了一个AI科学家,让它挑战一个真实世界的科研难题:为高胆固醇血症寻找新的候选药物。

图片

这个任务几乎涵盖了早期药物发现的所有关键环节,从靶点识别,到化合物筛选和优化,再到专利验证。

整个过程,AI科学家像一个经验丰富的人类研究员一样,有条不紊地推进工作。

故事开始。

AI科学家的第一个任务是确定攻击目标,也就是“靶点”。

它没有像无头苍蝇一样乱撞,而是首先调用了文献挖掘工具和药物靶点数据库。通过快速分析数千篇研究论文和临床数据,它得出了一个清晰的结论:HMG-CoA还原酶是胆固醇合成通路上的一个关键节点,也是现有他汀类药物的主要作用靶点。

同时,它还敏锐地发现了一个重要信息,过度抑制肝脏外的这种酶,可能会导致肌肉疼痛等副作用。这一步,AI科学家完美复刻了人类科学家的科研逻辑,找到了一个经过验证且有优化空间的关键靶点。

目标明确,接下来是寻找一个合适的“起点”。

AI科学家开始在已上市的降胆固醇药物库中进行筛选。它很快锁定了“洛伐他汀”(lovastatin)作为起始化合物。它给出的理由非常充分:这个药临床验证足够多,证明靶点有效,但它的肝外组织渗透率较高,存在明确的副作用风险,这恰好为后续的优化留下了空间。

接下来,进入了最核心的化合物优化阶段。AI科学家同时启动了三个强大的工具进行协同作战。

它先从ChEMBL数据库中,一口气调取了100多个洛伐他汀的结构类似物,建立了一个庞大的候选库。

然后,它调用了Boltz-2工具,这是一个专门预测分子与靶点结合能的模型。AI科学家让Boltz-2对这100多个类似物逐一进行计算,数值越低,代表结合能力越强,药效可能越好。

与此同时,它还调用了ADMET-AI工具,这个工具负责预测化合物的吸收、分布、代谢、排泄和毒性(ADMET)属性。AI科学家特别关注了肝渗透率、脑渗透率和代谢稳定性这几个指标,因为它记得,优化的目标之一就是要降低副作用。

三大工具同时开工,海量数据瞬间生成。AI科学家对这些数据进行了综合排序和分析,很快,两个最优候选者浮出水面。

第一个是“普伐他汀”(pravastatin)。这是一个已知的药物,其特点就是肝外渗透率低,副作用比洛伐他汀更小。筛选出这个结果,相当于一个“阳性对照”,证明了AI科学家的筛选策略是可靠的、有效的。

第二个是代号为CHEMBL2347006和CHEMBL3970138的新化合物。这个发现让人眼前一亮。根据AI的预测,这个新化合物与靶点的结合能比洛伐他汀高出30%,意味着药效可能更强;同时,它的脑渗透率降低了50%,生物利用度还提升了25%。这几乎是一个完美的候选药物。

图片

图片

任务的最后一步是验证。AI科学家调用了专利检索工具,对这个新发现的化合物进行查询。结果显示,这个化合物的结构已经被注册用于心血管疾病的治疗。虽然这意味着不能直接将其开发成新药,但这个发现本身,为后续的结构修饰和进一步优化,指明了清晰的方向。

回顾整个过程,AI科学家做的绝不仅仅是“调用工具”这么简单。它在每一步都展现出了惊人的科学推理能力。它能清晰地解释“为什么选择这个靶点”,能有理有据地说明“为什么淘汰某个化合物”,甚至能根据副作用风险来动态调整自己的优化策略。

这,才是“AI科学家”和普通工具调用脚本的本质区别。ToolUniverse在这个案例中,充分证明了它作为一个AI科学家铸造平台的强大潜力。

科学研究的未来图景

ToolUniverse的成功,不仅仅在于其强大的技术实现,更在于它背后所倡导的开放、协作的理念。

这个项目背后,站着的是哈佛大学医学院和麻省理工学院的顶尖研究团队。论文的通讯作者Marinka Zitnik是哈佛的助理教授,在生物医学信息学领域声名显赫。第一作者高尚华等一众青年学者,则构成了这个项目的中坚力量。

支持ToolUniverse的资助方列表长得惊人,几乎囊括了美国科研界的半壁江山。从美国国立卫生研究院(NIH)、国家科学基金会(NSF),到谷歌、亚马逊这样的科技巨头,再到阿斯利康、罗氏、辉瑞、默克等全球顶级的制药公司,还有盖茨基金会、陈-扎克伯格倡议等知名基金会。如此豪华的资助阵容,足以说明学术界和工业界对这个方向的高度共识和巨大期待。

但ToolUniverse并没有打算把这一切都关在象牙塔里。它从一开始就建立了一个活跃的开发者社区。他们提供了Slack、微信、GitHub等多种交流平台,鼓励全世界的用户参与进来,无论是报告一个bug,提出一个建议,还是贡献一个新的科学工具。

他们深知,一个真正伟大的生态系统,绝不是靠少数几个人闭门造车就能建成的。科学的疆域如此浩瀚,仅凭一个团队,不可能穷尽所有领域的工具和知识。只有让全世界的智慧汇集于此,ToolUniverse的工具箱才能变得无所不包,它的能力才能真正覆盖科学研究的每一个角落。

ToolUniverse为我们描绘了一幅激动人心的未来图景。

一个年轻的博士生,或许可以利用ToolUniverse,在几天内完成过去需要一个团队数年才能完成的文献综述和数据分析。

一个跨学科的研究团队,可以轻松地将不同领域的模型和数据整合在一起,碰撞出前所未有的火花。

科学发现的模式,正在被从根本上重塑。过去那种依赖个人英雄主义和偶然灵感的时代,或许将一去不复返。取而代之的,将是一种更加系统化、规模化、智能化的科研新范式。

ToolUniverse,就是开启这个新范式的一把钥匙。

参考资料:

https://arxiv.org/abs/2509.23426

https://github.com/mims-harvard/ToolUniverse

https://www.nature.com/articles/d41586-025-03246-7

https://zitniklab.hms.harvard.edu/ToolUniverse/tools/tools_config_index.html

https://aiscientist.tools

https://mims-harvard.github.io/ToolUniverse/

END

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值