我对Agen2Agent以及MCP的浅显理解

最近MCP比较火,谷歌也出了A2A 协议。其实我很早就想过这个问题。今天来快速的记一下。

why-- 为什么要出这些个协议?

首先,要聊下背景。

本质矛盾是因为当前的虚拟助理(大模型等)不能满足人类复杂的任务需求。

要想满足人类复杂的任务需求,它得是个“超人”,既要能得到各种感知,还要能分析,能回顾历史,能决策,能执行,能交互,等等。当前,大模型最核心的能力,就是解决了历史上最难的问题:能相对全面的分析并给出建议(决策),能根据各种具体情况去分析,而不是走人工设计的套路。换句话说,具备了人类一定的分析判断能力,相当于大脑。

所以,之前就有个经典的Agent设计结构, 大模型作为决策中心,给它装上 感知器,给它安上记忆,让它可以查找资料,最后让它可以操控 其他 软件或者硬件,经过思维链技术,一步步推理、执行、返回、再执行,直到最后完成任务。

现在的技术路线发展,其实就是按照这个大致的脉络来走的。理解了这个需求和实现的策略,就不难理解当前技术的各种“风口”。

what-- 这些个协议干嘛的?

简单来讲,这些协议就是让 大模型和其他 大模型、智能体、工具(接口)、硬件(驱动程序) 进行交互的。 大模型是大脑的能力,但是它需要和其他的感知、执行、次级大脑进行交互,才能灵活的完成复杂任务。怎么交互呢?它们之间的语言是什么?现在设定的这些协议,就是它们之间的语言规范。

当然,除了语言规范,还得有 “交互约定”,即面对什么事情,我要告诉你什么,你要告诉我什么,等等。

好,我觉得,MCP协议,是语言规范;而A2A,是交互约定。

用比喻来说,MCP,是咒语;A2A是魔法师们沟通的约定,毕竟不同的魔法师擅长的不一样,他们之间需要交流。比如,我要发一个大火球,我需要念动火球术,这就是我和底层魔法规则沟通的媒介,就是MCP;比如我是火系魔法师,我需要临时增强我的力量、幸运值,我找到一个祝福系法师,也就是另一个Agent,通过它身上的标签找到它,直到它有这个能力,于是我给它发出任务请求,它就采取一系列独特的咒语(MCP),综合调动不同类型的力量,对我加持了大祝福术,这就是agent2agent。

这个比喻很好,还能解释更多。比如,同样是问位置,我可以调用谷歌的接口(MCP),假设也可以调用 百度的接口,两者的咒语不同,但是能实现类似的功能,就好比 我用一个咒语来召唤出火球,用另一个咒语来召唤出 火弹,大体差不多,但是咒语不同。同样的,我可以找观音菩萨给我祝福,也可以找上帝,Ta们施展的各种咒语组合、原理可能不尽相同,那就是不同的Agent的能力,我只需要按照Ta告诉我的能力和召唤方法,召唤出来即可,比如我去跪拜观音菩萨的佛像,或者找个教堂去忏悔,这是Ta的约定,这就是A2A。

当然,MCP和A2A在某个意义上 又是相同的东西。都是在尝试调用对方的能力,只是呢,MCP控制的是底层能力;而A2A则是尝试调用高阶、复杂的能力。而所谓“高阶、复杂”,是相对的。

How-- 大模型怎么做到的呢?

MCP应该是通过Function calling的方式来做到的,需要接口按照MCP协议的要求去注册,让大模型知道,然后大模型按照MCP组织数据去调用,得到返回。

A2A,则更加灵活,应该不需要MCP协议那样”死板“的接口格式去发送数据,我猜测,当前用自然语言交互可能是最合适的(人也能看懂,从而可以设计、调整)。A2A协议,目前来看,更有可能是类似于“个人介绍”这种东西,即一个Agent在自己身上贴标签,告诉别的Agent它能做什么。

使用A2A协议做任务的步骤大概是,你的主Agent根据你的任务命令,结合它对其他Agent的理解,拆分任务项目步骤和顺序,把子项目外包给其他Agent,它最后再进行组合。这里边的关键,除了它能否拆解任务外,就是它要知道别的Agent能干啥。

谈到这里,我觉得这里会有一个难点,未来一定会遇到,并成为超级智能执行体构成的阻碍:谁去描述Agent能干啥?描述的是否合理?Agent的描述和别的Agent对这个描述的理解,是否一致?肯定不会完全一致,人人之间交流会有这个问题,Agent之前如果靠描述来互相了解,一样会遇到问题。或许,未来,抛弃所谓A2A协议,用人类看不懂的 三体人 沟通方式,可能更适合Agent之间的交互。

所以,我认为,A2A只是个阶段性产物,有长远意识的人,应该已经在想如何让Agent之间更加准确高效的交流了,比如,让它们互相读对方源码,存储为它们自己理解的“记忆”?

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值