AI Agent,下一个万亿风口?我扒了份报告,发现创始人最大的痛点根本不是技术

一个说法是,未来十年都会是 agent 之年。从下边这个企业部署 agent 的进来可以看出来。

 

但 Agent 的部署是否成功,最核心的并不是技术。

我们先把目光往前移,其实 Agent 并不是新鲜事:

20 年前,微软的 Office 就上线过这个功能, 叫 Clippy,内置在 Office 97、Office 2000、Office XP 等版本中。它的核心功能是通过弹窗气泡形式,主动提示或协助用户完成常见任务。

 

你写个开头,它跳出来问「需要我帮忙吗?」;你改个格式,它又跳出来说「我发现你在做XX,要不要试试这样?」。

一个爹味十足、又总在错误时机提供无效建议的「虚拟助理」,最终在 2007 年被扫进了历史的垃圾堆,成了全世界最招人恨的虚拟助手,没有之一。

历史不会重复,但总押着相同的韵脚。

现在铺天盖地的 AI Agent (AI 代理)又火了,连微软 CEO 萨提亚·纳德拉自己都说,Copilot 就像是「去健身房练了十年的 Clippy」。

听着就有点慌,别又搞出个爹来教我做事。

最近,我扒了一份欧洲顶级风投 MMC 发布的《AI Agent 现状报告:创始人版》(报告链接见文末阅读原文),他们调研了 30 多位 AI Agent 领域的创业公司创始人和 40 多位企业高管。

看完我长舒一口气,还好,创始人们脑子很清醒。

他们发现,部署 AI Agent 最大的挑战,根本不是技术问题。

最大的坑,不是技术,而是「人」

你以为搞不定 AI Agent 是因为模型不够强、代码不够骚?

错了。

报告里,创始人们票选出的 Top 3 部署难题是:

  1. 1. 工作流整合和人机交互(60%)

  2. 2. 员工抵制和非技术因素(50%)

  3. 3. 数据隐私和安全(50%)

 

太真实了。

作为一个用研,我天天跟这些问题打交道。你技术再 nb,用户不接受、流程融不进、数据不安全,全都白搭。

AI Agent 不是一个孤立的软件,它得像一个新同事一样,嵌入到公司现有的、混乱的、充满历史遗留问题的流程里去。

它要面对的,是人类同事的怀疑、不解、甚至恐惧(「它是不是来抢我饭碗的?」)。

所以,那些聪明的创始人是怎么做的?

成功的秘诀:「Think Small」,先搞定一件小事

报告发现,最成功的部署策略,总结起来就俩字:先从小的搞起(Think Small)。

别一上来就想着「颠覆整个行业」、「重塑人类工作方式」。

先从一些低风险、中等影响力、结果容易验证的小事做起。

最好是那种人类员工自己都烦得要死的重复性任务。

那到底怎么“搞小的”呢?这就涉及到一对要命的平衡:准确率(Accuracy)和自主权(Autonomy)。

准确率 vs. 自主权:一个要命的平衡

简单说,准确率就是 Agent 干的活儿有多靠谱,自主权就是它多大程度上能自己做主,不用人管。

报告的数据很有意思:超过 90% 的创业公司能做到 70% 以上的准确率,但只有 66% 的公司敢给 Agent 70% 以上的自主权。

看到了吗?活儿干得还行,但老板(用户)还是不放心让它自己瞎搞。这就是信任差距。

聪明的创始人,会根据业务场景,在这两者间找到绝佳的平衡点,玩出三种主流模式:

中等准确率 + 高自主权: 把它当成一个“实习生”。让它去干那些低风险、易验证、量大管饱的活儿。比如自动抓取信息、整理初步材料。就算错了,人看一眼就能改过来,但节省下的时间是实打实的。

高准确率 + 低自主权: 把它当成一个“专家顾问”。在医疗、金融这种高风险领域,人命关天,一分钱都不能错。Agent 可以提供非常精准的分析和建议,但最后拍板的,还得是人。它负责提供顶级弹药,但不能替你扣扳机。

高准确率 + 高自主权: 这就是“明星员工”了。在客户支持、网络安全这些相对成熟的领域,让它放手去干。报告发现,要做到这一点,光靠大模型还不够,往往需要把大模型(LLM)和更确定的传统 AI 方法结合起来,才能保证又准又能干。

所以你看,“搞小的”不是瞎搞,而是基于对风险和价值的判断,选择最合适的“人设”和“授权范围”。

好消息:已经开始花「业务」的钱了

当然,也有好消息。

报告显示,62% 的 AI Agent 创业公司已经开始花企业「核心业务部门」的钱了,而不是什么虚头巴脑的「创新预算」。

 

设么意思?

意味着 AI Agent 已经不再是 PPT 里的玩具和高管们拿来发朋友圈的「实验品」,它正在真正进入业务的核心,创造价值。

不过,怎么收费,大家依然很头疼。

按用户数?按任务量?还是按最终效果?报告里也提到了,按效果付费(Outcome-based)听着最美,但实际操作起来巨难。比如,一个销售单子拿下了,到底有多少是 AI 的功劳?很难算清楚,最后就是无尽的扯皮。

 

所以,大部分公司还是采用「混合模式」,收个基础费,再加点用量费,稳妥。

决胜点:搞定「人机交互」的 3E 框架

说到底,AI Agent 能不能成,关键还是看它和「人」的关系处理得怎么样。

报告里提到了一个我觉得还挺 nb 的观点,叫 3E 框架

  • • Education (教育)

  • • Entertainment (娱乐)

  • • Expectation management (预期管理)

教育:AI 不能是个黑盒子,它得想办法让用户明白它能干嘛、不能干嘛,怎么跟它合作效率最高。它得是个好老师。

娱乐:交互过程得有点意思,至少不能烦人。谁愿意天天跟一个板着脸的 sb 机器人打交道?带点幽默感、有点个性的 Agent,用户才愿意用。

预期管理:这是最重要的。别吹牛逼,也别让用户低估你。上来就说「我能搞定一切」,结果连个简单的任务都出错,用户马上就把它打入冷宫。清晰地告诉用户,我在什么场景下准确率 90%,在什么场景下可能只有 60%,把选择权和判断权交给用户。

你看,这哪里是技术问题?这全是用户体验和心理学的问题。

所以,AI Agent 的未来,技术突破当然重要,但真正的决胜点,可能在于谁能更好地理解「人」,搞定那些乱七八糟的流程和微妙的人性。

最后:

别总想着做个无所不能的「神」,先试着做个用户愿意聊天的「人」。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值