上周老金我让AI帮我写个周报。
它说:
“好的,我来帮你写一份周报。”
然后?
然后它给我列了一堆要点,让我自己去Word里敲。
我说你能帮我直接生成文档吗?
它说抱歉,我无法直接操作您的电脑。
卧槽。
这不就是"动嘴不动手"吗?
但最近Google放出了一份50页的官方指南,专门讲怎么让AI从"只会说"变成"能干活"。
老金我花了3小时啃完,今天用大白话给你讲明白。
一、先搞懂一个词:Agent
别被这个英文词吓到。
Agent = 能自己干活的AI
普通AI:你问它问题,它回答你,完事。
Agent:你给它任务,它自己想办法完成,中间不用你管。
打个比方
普通AI就像百度百科。
你问它"怎么做红烧肉",它告诉你步骤,但你得自己去做。
Agent就像私人厨师。
你说"我想吃红烧肉",它自己去买菜、切肉、炒糖色、炖40分钟,最后端给你。
这就是本质区别。
二、Google说Agent由3部分组成
Google给了一个很清晰的公式:
Agent = 大脑 + 手 + 协调系统
第一部分:大脑(Model)
就是ChatGPT、Claude、Gemini、Deepseek、Qwen、GLM、Minimax这些大模型。
负责思考:
1、用户想要什么?
2、下一步该做什么?
3、这个结果对不对?
简单说,大脑负责"想"。
第二部分:手(Tools)
让AI能"动手"的工具。
比如:
1、搜索工具:能上网查资料
2、计算工具:能算数
3、API工具:能调用外部服务(订机票、发邮件、查天气)
普通AI没有"手",所以只能动嘴。
Agent有"手",所以能干活。
第三部分:协调系统(Orchestration)
负责协调大脑和手。
它的工作流程是一个循环:
1、想:让大脑思考下一步做什么
2、做:调用工具执行
3、看:观察执行结果
4、回到第1步,继续想
这个循环就是Agent的灵魂。
如果对你有帮助,记得关注一波~
三、举个例子你就懂了
假设你让Agent帮你"查一下明天北京的天气,如果下雨就帮我订一把伞"。
普通AI的反应:
明天北京有小雨,建议您带伞出门。
完事。
它不会帮你订伞。
Agent的反应:
第一轮循环:
想:用户想知道明天天气,还想在下雨时订伞
做:调用天气API查询
看:明天北京有小雨
第二轮循环:
想:下雨了,需要帮用户订伞
做:调用电商API搜索雨伞
看:找到了10款雨伞
第三轮循环:
想:需要选一款合适的
做:筛选评分最高、价格合理的
看:选中了一款39元的折叠伞
第四轮循环:
想:需要下单
做:调用下单API
看:订单创建成功
最终返回:已帮您订购了一把折叠伞,39元,预计明天上午送达。
看到区别了吗?
Agent会自己想、自己做、自己检查,直到任务完成。
四、Google推荐的方法:ReAct
Google在指南里推荐了一个方法叫ReAct。
别被名字吓到,其实很简单:
ReAct = 先想再做
每一步都要:
1、先说出自己在想什么(Reasoning)
2、再去执行动作(Acting)
为什么要这样?
因为如果AI不说出思考过程,你不知道它在干嘛。
万一它理解错了,你也发现不了。
让它"说出来",就像让员工汇报工作进度。
出问题能及时发现。
五、一个Agent不够用怎么办?
Google说:用多个Agent协作。
就像公司一样:
1、小项目一个人干
2、大项目要组团队
三种协作模式
模式1:流水线
Agent A做完 → 交给Agent B → 再交给Agent C
比如写文章:
1、Agent A负责搜集资料
2、Agent B负责写初稿
3、Agent C负责润色
模式2:并行
Agent A、B、C同时干活 → 最后汇总
比如做调研:
1、Agent A查国内市场
2、Agent B查国外市场
3、Agent C查竞品
4、最后汇总成报告
模式3:老板+员工
一个"老板Agent"负责分配任务,其他Agent负责执行。
老板Agent说:你去查资料,你去写代码,你去测试。
然后各干各的,最后老板汇总。
六、怎么防止AI瞎编?
这是Google强调的重点。
问题:AI有时候会"幻觉"(简单说就是一本正经地胡说八道)。
解决方案:让AI基于真实数据回答,不要让它瞎猜。
Google管这个叫Grounding(接地)。
方法有三个:
1、RAG:让AI先查资料库,再回答
2、调用API:让AI查实时数据,不要靠记忆
3、搜索:让AI先搜索,再回答
老金的理解
Grounding就是让AI"脚踏实地"。
不要让它凭空想象,要让它查资料。
七、怎么判断Agent好不好?
Google给了几个指标:
最重要的4个指标
1、任务完成率:能不能完成任务(最重要!)
2、准确率:完成得对不对
3、响应速度:快不快
4、成本:花多少钱
老金建议:先看任务完成率。
Agent能不能完成任务是最重要的。
其他都是锦上添花。
八、想自己做Agent怎么入门?
Google推荐用LangChain这个工具。
它是专门用来做Agent的框架。
一个简单的例子:
# 1、准备工具(手)tools = [搜索工具, 计算工具]# 2、准备大脑llm = ChatGPT或Claude# 3、组装Agentagent = 创建Agent(大脑=llm, 工具=tools)# 4、让Agent干活结果 = agent.执行("帮我查一下今天的股票行情")
就这么简单。
想学的话,官方文档在这:python.langchain.com
那么,如何系统的去学习大模型LLM?
作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。


👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

被折叠的 条评论
为什么被折叠?



