AI Agent落地难?看看Block和GSK如何用“数字员工”彻底改变工作流

摘要: AI Agent(智能体)无疑是当下企业技术圈最炙手可热的词汇。然而,当Gartner的“期望膨胀顶峰”警告言犹在耳,许多人仍在质疑这阵风潮究竟是真实的技术革命,还是又一轮的泡沫。本文将深入剖析两家行业巨头——金融科技公司Block和制药巨头GSK的真实案例,揭示它们如何将Agent从概念转化为生产力,以及在落地过程中总结出的宝贵经验。

引言:从炒作到实战,Agent的价值正在被验证

“多智能体绝对是未来趋势,”Block的AI技术主管Brad Axen直言不D諱,“但我们正在探索一种既符合人类使用习惯又方便的实现方式。”

这种冷静而务实的声音,正是当前Agent领域所需要的。当许多供应商还在用PPT描绘宏大蓝图时,Block和GSK已经撸起袖子,在软件工程和药物研发这两个复杂度极高的领域,取得了实实在在的早期回报。他们的探索,为我们提供了一个绝佳的观察窗口,让我们得以一窥Agent在企业中落地的真实路径与挑战。

一、 Block的“Goose”框架:让每个员工都拥有一个“数字队友”

拥有Square、Cash App等知名产品的Block公司,员工规模超过一万名。如何为如此庞大的团队引入Agent能力?他们的答案是代号为“Goose”的可互操作智能体框架。

1. 核心理念:一个队友,而非一群机器人

与市面上许多让用户感觉在指挥一个“机器人军团”的Agent产品不同,Block从一开始就定下了截然不同的交互哲学。

“我们希望用户感受到自己只在与一个人合作,但这个人会在多个场景和方式中代表你行动。” —— Brad Axen

这意味着Goose被设计成一个统一的、拟人化的“数字队友”。它能整合公司内部的各种工具,压缩处理来自Slack、邮件等渠道的庞杂信息,并在需要时自主生成新的子Agent来处理高并发或大规模任务。用户面对的始终是一个单一的协作界面,大大降低了认知负荷。

2. 从软件工程切入,效果惊人

Goose最初的应用场景是软件工程。对于开发者来说,它是一个实时运行在开发环境中的得力助手,能够:

  • 自主编码与测试: 根据LLM的输出进行搜索、导航、编写代码,并能自主读写文件、运行测试、安装依赖。

  • 代码生成: 目前平台生成的代码量约占总量的90%。

  • 效率提升: 通过自动化编码、调试和信息筛选,每周为每位工程师节省约10小时的工作时间。

目前,Goose已被Block内部4000名工程师使用,并且采用率每月翻倍,其价值得到了充分验证。

3. 技术揭秘与开源之道

Goose并非空中楼阁,它的技术选型和开源策略值得我们开发者关注:

  • 技术基石: 构建于Anthropic的**模型上下文协议(Model Context Protocol, MCP)**之上。这是一套日益流行的开源API和端点标准,旨在将Agent与数据、工具和环境无缝连接。Axen甚至公开呼吁:“我希望Google能为Gmail提供公开的MCP,这会大大简化我的工作。”

  • 开放姿态: Goose已基于 Apache License 2.0 (ASL2) 协议开源。这意味着任何人都可以免费使用、修改和分发,包括商业用途。这种开放性旨在建立一个活跃的社区,让工具能够跟上日新月异的模型和产品迭代。

  • 易用性: 框架内置了桌面应用和CLI,并允许开发者构建自定义UI。它甚至能让非技术人员通过自然语言访问Databricks数据库并执行SQL查询,真正实现技术平权。

二、 GSK的实践:在不确定性中加速药物研发

如果说Block的场景是提升确定性工作的效率,那么制药巨头GSK则是在用Agent探索充满不确定性的科学前沿。

1. 挑战:当没有“标准答案”时,AI如何推理?

药物研发与软件工程最大的不同在于,很多时候并不存在所谓的“基准真相”(Ground Truth)。它是一个基于假设、不断探索、整合证据的复杂推理过程。

“我们不总是有绝对真相可依,否则我的工作会容易很多。” —— Kim Branson, GSK全球AI/ML负责人

面对从基因组学、蛋白质组学到可穿戴设备收集的海量异构数据,人类科学家几乎不可能进行全面分析。GSK的目标就是利用多智能体架构,加速这一迭代和发现的过程。

2. 解决方案:领域模型 + 本体 + 严格测试

GSK的智能体系统并非简单的LLM套壳,而是一套严谨的科学工具链:

  • 领域特定模型: 他们并不过分依赖通用大模型。例如,GSK基于Cerebras从零开始构建了表观基因组语言模型,专门用于生物学领域的推理和训练。

  • 本体(Ontology): 结合本体(用于表示概念、属性和关系的知识图谱),让Agent能够理解复杂的生物学概念和逻辑,从而进行“如果这是真的,X意味着什么?”这类深层推理。

  • 数据过滤: Branson强调,大的上下文窗口并非万能解药。“不能随意堆叠上下文,不能把所有数据丢进去就指望LLM自己搞定。”精准的数据过滤至关重要。

3. “偏执”的测试:交叉验证与从错误中学习

在制药这个人命关天的行业,可靠性是第一位的。GSK对Agent系统的测试堪称“偏执”:

  • 并行验证: 他们通常会并行运行多个Agent副本和不同模型,执行完全相同的任务序列,然后由科学家进行交叉验证。这极大地降低了单一模型出现“幻觉”的风险。Branson分享了一个早期案例:一个SQL Agent在运行“1万次”后,莫名其妙地“造假”了一次数据。这次经历让他们深刻认识到冗余验证的必要性。

  • 内部基准: 公开的学术基准往往无法反映真实世界工作的复杂性。因此,GSK建立了大量内部基准,生成生物学问题并评分,再用LLM进行验证和排名。

  • 拥抱错误: “我们特别关注智能体出错或出现愚蠢行为的情况,因为那正是学习新知识的机会。”他们将人类专家的判断置于关键环节,形成一个主动学习的闭环。

三、殊途同归:成功的AI智能体项目有哪些共同点?

尽管Block和GSK的应用领域天差地别,但他们的成功经验却指向了几个共同的关键原则:

  1. 流程大于技术: Axen强调,最大的瓶颈在于流程。“你不能仅仅给员工一款工具就期望其自动发挥作用,智能体必须反映员工已在使用的流程。”技术必须服务于人,贴近真实的工作流。

  2. 人类专家不可或缺: Agent不是要取代人,而是成为专家的“新表达工具”。无论是Block需要人工审核代码的合规性与安全性,还是GSK需要科学家在关键节点做出专业判断,人类的专业知识和经验始终是最终质量的保障。

  3. 人机交互是核心挑战: 如何让强大的AI能力在后台静默运行,同时提供一个简单、无感的交互界面,是Agent能否被广泛接受的关键。Block将此视为最难实现的部分。

  4. 开放与标准化是催化剂: Block对开源的拥抱和对MCP等行业标准的呼吁表明,一个开放、协作的生态系统将极大加速Agent技术的发展和落地。

结语

Block和GSK的案例雄辩地证明,AI Agent已经走出了概念炒作的阶段,开始在企业核心业务中创造真实价值。然而,成功并非一蹴而就。它需要深思熟虑的交互设计(如Block的“数字队友”),严谨的科学方法(如GSK的多重验证),以及一个共同的认知——技术终究是为人服务的,将Agent无缝融入现有的工作流程,并始终保留人类专家的核心地位,才是通往未来的正确道路。

对于广大开发者和技术决策者而言,与其等待一个完美的通用智能体出现,不如从现在开始,像Block和GSK一样,从解决一个具体的业务问题入手,将人和流程放在首位,开启自己的Agent探索之旅。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值