聊一聊Tool、MCP和Agent来龙去脉 | 大白话技术科普系列

将与 Jomy 共同完成一系列技术科普,让最一线的工程师、用通俗的语言、讲最前沿的技术。这是系列第一篇,主题是最近大火的 MCP 和 Agent

读完本文,你一定会感叹:终于搞懂了!原来!竟然!这么简单!

文 | Jomy @302.AI

编 | 南乔River @ShowMeAI

✦✦✦

我们 302.AI 做 MCP 和 Agent 相关开发有一段时间了,期间一直与开发者和用户们保持着密切的交流。

有一个普遍的感受:尽管行业内几乎所有人都听过 MCP、Agent 这些术语,但只有极少数人真正理解它们的本质

今天,我就基于 302.AI 的实践和成果,分享一些自己的见解,帮大家厘清概念的来龙去脉,并大胆预测一下未来的发展方向。



1. 缸中之脑:只能说不能做的大模型

让我们先从大语言模型(Large Language Model,LLM)说起。

语言模型,顾名思义,就是一个只能处理和输出文字的系统。

早期的大语言模型,输出非常不稳定,准确率很低,经常「一本正经地胡说八道」。所以,人们最多把它当成一个顾问:咨询意见,但不敢让它直接拍板决策或上手干活

这个时期的大模型,有点像被限制在「缸」里的「大脑」(借用哲学上的「缸中之脑」假说)。

它能思考、能滔滔不绝地输出观点。但它没手没脚,不能对「缸」外的物理世界/数字世界直接做点什么

✦✦✦

但是,AI 技术发展飞快。

随着模型参数规模的扩大和训练方法的革新,语言模型的「智力」得到了肉眼可见的提升。人们惊喜地发现,AI 写出的文案、给到的建议、生成的代码,几乎不需要修改就能直接使用了!

眼看着 AI 越来越靠谱,一种想法自然而然地浮现出来:既然大模型这么能干,是时候解开 AI 的禁锢,让它不只能「动动嘴」,也能「动动手」了?



2. 调用工具:大模型学会了「动手」

怎么解开 AI 的「禁锢」呢?

答案就是**让大模型能够自行使用工具,**也就是我们常说的 Function Call(函数调用)或 Tool Use(工具使用)

✦✦✦

那么,一个只会输出文字的模型,是如何调用工具的呢?

这里需要做一个必要的澄清:模型调用工具,并不是模型真的「动手」去操作工具。

本质上,还是模型生成文本(结构化的文本),然后配套的程序接收到指令,再去调用工具。而所谓的「工具」,就是各种各样的程序接口(API)或者软件操作,例如搜索、编辑数据库、编辑文件等。(下图是 gpt-4o 调用工具的命令(JSON 格式))

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ShowMeAI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值