告别空谈!从Block与GSK实践中,提炼企业AI Agent落地的四大核心法则

摘要: AI Agent的热潮之下,无数企业和开发者摩拳擦掌,却又常常陷入“不知从何下手”的困境。本文拒绝复述概念,而是深入Block的开源框架“Goose”和GSK的药物研发智能体两大前沿案例,为您提炼出四条经过实战检验的核心法则。这不仅是它们的成功秘诀,更是您在自己公司启动AI Agent项目时,可以参考的实战路线图。

引言:从“期望膨胀”到价值落地,我们需要的是方法论

Gartner的技术成熟度曲线将当前AI Agent置于“期望膨胀的顶峰”,这意味着行业即将迎来泡沫的破裂和冷静期的到来。要在退潮后依然屹立不倒,依靠的绝不是天花乱坠的宣传,而是坚实的方法论。

金融科技巨头Block和制药领军者GSK的探索,恰好为我们提供了这样的方法论。通过剖析它们截然不同却又殊途同归的实践,我们可以总结出构建企业级AI Agent的四大核心法则。

法则一:始于流程,终于人性 —— 设计决定成败

技术圈的一个常见误区是“技术本位”,即先开发一个强大的工具,再去找应用场景。在Agent领域,这是一条死胡同。

Block的实践: Block的技术主管Brad Axen一针见血地指出:“流程是最大瓶颈。你不能仅仅给员工一款工具就期望其自动发挥作用。”

他们的智能体框架“Goose”的设计哲学完美体现了这一点。Goose没有被设计成一个功能繁杂的工具箱,而是作为一个“数字队友”。这个定位的转变至关重要:

  • 单一交互入口: “我们希望用户感受到自己只在与一个人合作”,这极大地降低了用户的学习成本和心理负担。

  • 融入现有工作流: Goose直接在开发环境中运行,能压缩Slack和邮件信息,这都是员工已经在使用的流程。它做的不是创造新流程,而是优化旧流程。

实战启示: 在启动你的Agent项目前,请先放下技术架构图,去和你的最终用户聊一聊。他们当前的工作流程是什么?痛点在哪里?你的Agent应该像一个无声的助手,无缝嵌入现有流程,而不是一个需要用户去学习和适应的“新系统”。

法则二:拥抱不完美,建立信任 —— 可靠性是生命线

大型语言模型(LLM)的随机性是其创造力的源泉,也是企业应用中最大的“雷区”。一次关键任务的“幻觉”或“造假”,就足以摧毁用户的所有信任。

GSK的实践: 在人命关天的药物研发领域,GSK对可靠性的追求近乎偏执。他们的经验极具参考价值:

  • 冗余验证机制: 他们通常会并行运行多个智能体副本或不同的模型,去执行完全相同的任务序列。然后,由人类科学家对结果进行交叉比对和验证。

  • 从事故中学习: GSK全球AI/ML负责人Kim Branson分享了一个宝贵经验:团队早期构建的SQL智能体曾在上万次运行中,出现过一次莫名其妙的数据“造假”。这次事故让他们警醒,并从此将冗余验证作为标准操作。

  • 珍视错误: “我们特别关注智能体出错或出现愚蠢行为的情况,因为那正是学习新知识的机会。” 错误不是要被掩盖的bug,而是完善系统、明确边界的绝佳机会。

实战启示: 不要盲信任何单一模型的输出。在你的Agent系统中,请务必设计“检查与平衡”机制。无论是引入多个模型进行交叉验证,还是在关键决策点强制要求人类审批,都应将建立信任和保障可靠性作为系统的核心功能,而非附加项。

法则三:通用与专用,因地制宜 —— 技术选型之道

市面上的模型和框架琳琅满目,是选择一个通用的开源框架,还是为特定任务从零构建专用模型?Block和GSK给出了两种不同场景下的标准答案。

  • Block的选择(通用框架): 赋能全公司1万名员工,任务场景横跨软件工程、信息处理、销售营销等。这种**“广度优先”**的场景,最适合采用一个可扩展的通用框架。

    • 技术选型: 基于开源标准MCP构建,发布为Apache 2.0许可的Goose框架。

    • 优势: 社区驱动,快速迭代,易于集成不同工具和LLM,能赋能大量非技术人员。

  • GSK的选择(专用模型): 聚焦于药物研发这一高度复杂的垂直领域。通用模型无法理解其深奥的生物学知识。这种**“深度优先”**的场景,必须走专用模型之路。

    • 技术选型: 从零构建基于Cerebras表观基因组语言模型,并结合**本体(Ontology)**进行知识推理。

    • 优势: 知识精准,推理能力强,能处理特定领域的复杂因果关系。

实战启示: 你的应用场景决定了你的技术选型。如果你的目标是提升整个企业的普遍效率,那么一个开放、通用的Agent平台是最佳选择。如果你的目标是攻克某个专业领域的“硬骨头”,那么投入资源构建领域特定的模型和知识库将是无法绕开的路径。

法则四:开放与协作,共建生态 —— 标准化的力量

Agent的潜力在于连接和自主操作。如果每个工具、每个数据源都是一座孤岛,Agent的能力将大打折扣。

Block的实践: Block不仅自己开源了Goose,其技术主管Axen更是大声疾呼,希望行业巨头拥抱开放标准。

“我希望Google能为Gmail提供公开的MCP(模型上下文协议),这会大大简化我的工作。”

这句话道出了所有Agent构建者的心声。当数据和工具能够通过标准化的协议被Agent访问和操作时,整个生态的价值将被指数级放大。Block选择开源,也是希望通过社区的力量,“使工具能够跟上新模型和新产品的步伐”。

实战启示: 在构建自己的Agent系统时,积极采用和支持开放标准。这不仅能让你更容易地集成第三方工具,也能让你自己的产品更容易地被他人集成。在当前这个快速发展的阶段,拥抱开放就是拥抱未来。

总结

从Block和GSK的探索中,我们看到AI Agent的成功落地并非遥不可及。它背后没有魔法,而是遵循着清晰的工程和产品法则。总结一下:

  1. 设计上,以人为本,流程先行。

  2. 工程上,敬畏风险,为信任而设计。

  3. 选型上,场景驱动,权衡通用与专用。

  4. 战略上,拥抱开放,共建生态。

对于走在AI Agent路上的每一位开发者和决策者来说,牢记这四条法则,或许能让我们在穿越“期望膨胀的顶峰”时,少走一些弯路,更快地抵达价值实现的彼岸。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值