吴恩达Agentic AI课程,第一课精华整理(上)

 Datawhale干货 

作者:陈辅元,Datawhale成员

人工智能著名学者、斯坦福大学教授吴恩达在社交平台 X 上发帖介绍了一门新课程 —— Agentic AI,这几天在全网都特别火。

课程介绍:吴恩达教授开新课了!还是亲自授课

我们梳理了第一课《Introduction to Agentic Workflows》的内容,大家可以配合视频一起学习。

一、什么是Agentic Al?

An agentic Al workflow:指基于大语言模型(LLM)的应用程序执行多个步骤以完成任务的过程。

换成通俗点话说:将一个复杂的任务拆分为具体的Steps,并且指挥多个LLM(可以是不同的LLM)完成每个不同的具体的Step,最终生成可交付的结果。

举个例子:Agentic AI 工作流就像请了一支“AI厨房天团”帮你做西红柿炒鸡蛋:你把任务拆成准备食材、炒菜、装盘三个步骤,分别指挥 Qwen 洗菜打蛋、Deepseek 掌勺控火、KIMI 精致摆盘,要是味道不对,还能让 ChatGPT 复盘问题、打回重做——全程你只动嘴不动手,靠多个大模型分工协作,一步步把复杂任务搞定。

所以在例子中最主要的是如何把一个复杂任务拆解成多个小步骤,让agent逐步去执行每一个步骤,从而得到你需要的结果!!!

二、Agentic Workflows的导论:自主性程度

我们已经有'agent'这个词,为什么还要创造'Agentic'?
与其去争论哪些工作算是智能体,哪些不算“真正的智能体“,不如让我们承认不同系统在主动性方面的不同程度

Less autonomous(低自主性)

  1. 你告诉 LLM:“写一篇关于黑洞的论文”

  2.  LLM → 写出搜索关键词

  3. 去网页搜

  4. 抓取网页内容

  5. LLM 把这些内容整合成文章

这就像你指挥一个“听话但不会动脑”的助手:你得一步步告诉它做什么、什么时候查资料、怎么整理。AI 只负责“写”,其他事都得你来操心。

More autonomous(高自主性)

  1. 你告诉 LLM:“写一篇关于黑洞的论文”

  2. LLM 自己决定:先“web search”查资料 → 并且能调用“news”和“arXiv”等工具,找最新科研动态

  3. 找到结果后,它自己判断:“我要选5个最好的来源” → 调用“web fetch” + “pdf to text”工具提取内容

  4. 然后它写初稿 → 再自己反思:“这个段落逻辑不够强,数据没引用清楚” → 主动改进草稿

  5. 最后输出高质量论文!

这就像请了一个“聪明又有责任心的实习生”:它知道该查什么、怎么筛选、怎么写、怎么改,全程自己规划步骤、调用工具、自我优化,最后交给你一份“成品”。

总结:Agentic AI 的精髓不是“能干活”,而是“会自己想怎么干、用什么工具、干完还能自己检查改错”——这才是真正意义上的“agent”,而不是“高级打字机”。

三、AgenticAI的好处

  1. 性能飞跃(Much Better Performance)

  2. 并行加速(Faster than Humans because of Parallelization)

  3. 模块化设计(Modular: Can Add/Update/Swap Components)

性能跃升 (Much Better Performance)

Coding Benchmark (HumanEval) 展示的是不同 AI 系统在编程任务上的表现——重点是对比 Non-agentic 和 Agentic的能力差异。

横轴 → 是“通过率”(正确完成编程题目的比例),从 40% 到 100%,越高越好。

纵轴 → 区分模型版本:GPT-3.5 vs GPT-4(GPT-4 更强)。

在编程这个硬核任务上,有没有“agentic”,决定了 AI 是“码农”还是“架构师”

并行加速 (Faster than Humans because of Parallelization)

智能体工作流能够并行处理任务,从而比人类更快地完成特定工作。

  • 实例: 以“撰写一篇关于黑洞的论文”为例。

    • 人类方式: 需要顺序地进行搜索、阅读网页、再搜索、再阅读,效率低下。

    • 智能体工作流方式:

  1. 并行搜索: 可以同时启动三个 LLM 实例,各自生成不同的搜索关键词并执行网络搜索。

  2. 并行抓取: 基于每次搜索的结果,每个 LLM 可以再并行抓取多个网页内容。

  3. 最终整合: 将所有并行获取的信息汇总,输入给一个 LLM 来撰写最终的论文。

虽然整个流程步骤更多,但由于大量的并行操作,其总耗时反而比人类顺序操作快得多。

模块化与可替换性 (Modular: can add or update tools, swap out models)

智能体工作流是高度模块化的,允许开发者自由地添加、更新工具或替换模型。

  • 替换工具: 例如,在“网络搜索”这个环节,可以轻松地将默认的搜索引擎替换Bing、Google 或专门为 AI 设计的工具。

  • 切换功能: 可以将通用的“web search”替换为“news search”,以便获取最新的科学突破资讯。

  • 优化模型: 不必在所有步骤中使用同一个 LLM。可以根据不同步骤的需求,尝试不同的模型提供商,选择在该步骤表现最佳的模型,从而优化整个系统的表现。

图片

一起“赞”三连

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值