李宏毅《生成式人工智能导论》 | 第9讲 AI Agent

大模型未来趋势:以大型语言模型打造的Agent

人类需要做多步骤的复杂任务,AI可以做到这件事吗?

如果可以我们将其称为AI Agent,这里指AI可以做多步骤复杂任务,可以做计划能够修改计划。

目前已有的AI Agent例子

2022年7月,在ChatGPT之前,就有研究由语言模型操控机器人。

23年12月有人研究用大型语言模型开自驾车。

AI Agent运行的可能原理

理想中AI Agent应该具备的能力

Agent有一个终极目标,可能有记忆,记忆里存储过去和环境互动时获得的经验。

1.Agent从外界环境中了解外界的状态(比如通过文字输入、看见的图片、音频、触觉等)

2.根据终极目标、记忆和状态,Agent产生一个计划(短期目标)-达到终极目标之前,需要采取的行动

3.根据计划,Agent执行行为

4.Agent行动后,会对外界环境产生影响,会改变当前外界环境的状态。- 可以根据外界环境的状态学习到新的经验修改Agent的记忆,有可能修改原来的计划 - 可以通过反思修改原来的计划或者获取到新的经验(参考论文ReAcr和Reflexion)

具体的例子可以看老师的视频:https://www.bilibili.com/video/BV1XS411w7qr

当外界环境发生变化时,Agent产生新的行动计划

Agent反思之后,得到一些经验,经验会影响行动的决策。

有记忆的ChatGPT

有短期记忆的ChatGPT,ChatGPT没有长期记忆,只能记忆发生在同一个对话里的内容。如果开启新对话,ChatGPT不会有之前对话的记忆。

ChatGPT尝试去做有长期记忆,目前(25年6月)以已经实现了持久记忆功能Memory。持久记忆允许在不同会话之间保留信息,该功能支持的模型主要版本时GPT-4 Turbo(及以后)。

老师课程里介绍有记忆的ChatGPT可能的原理

当用户和ChatGPT对话结束后,ChatGPT可能会对对话的关键信息进行摘要,存储在记忆中。

当开启新对话时,过去对话的内容虽然不知道,但是根据记忆里的摘要信息可以知道之前对话的主要内容。

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与大语言模型(LLM)生成能力的技术架构,旨在通过动态引入外部知识提升模型回答的准确性、时效性,并减少“幻觉”(即模型虚构信息)问题

### 李宏毅生成式AI导论课程资料概述 #### 课程简介 李宏毅教授的《生成式AI导论》是一门深入浅出介绍生成式人工智能理论和技术的课程。该课程不仅涵盖了生成式AI的基础概念和发展历程,还探讨了当前最前沿的研究成果及其实际应用场景[^1]。 #### 主要内容概览 - **第0:课程说明** - 对整个系列座的内容框架进行了详细介绍。 - **第1生成式AI是什么?** - 解释了生成式AI的核心定义以及其与其他类型的人工智能的区别所在。 - **第二:今日的生成式人工智慧厲害在哪裡?從「工具」變為「工具人」** - 探讨现代生成式AI的强大之处,并分析这些进步如何使机器不仅仅作为辅助工具存在,而是能够承担更多自主任务的角色转变过程。 - **第三:训练不了人工智能?你可以训练你自己(上)** - 讨论个人技能提升的重要性,特别是在面对复杂多变的技术环境时自我调整和适应的方法论建议。 #### 结构化学习与生成式学习的关系 在过去,“结构化学习”指的是让计算机学会处理具有特定格式的数据;而如今所说的“生成式学习”,则是指通过大量无标注数据来构建可以创造新样本或模拟真实世界现象的概率分布模型。尽管两者名称不同,但在某些方面确实存在着一定的联系——它们都涉及到模式识别、特征提取等关键技术环节。然而值得注意的是,在具体实现方式和技术细节层面二者之间差异巨大,尤其是在近十年间随着深度学习算法的发展,后者取得了前所未有的突破性进展[^2]。 #### 获取资源途径 为了方便国内学生获取最新版本的教学材料,《李宏毅2024生成式人工智能导论》提供了中文镜像版指导文档及配套练习题库,所有相关内容均已托管至GitHub平台供免费下载使用。这一举措得到了原作者正式授权许可,体现了教育工作者对于知识传播开放共享精神的支持态度[^3]。 ```bash git clone https://github.com/user/repo.git cd repo ``` 上述命令可以帮助用户轻松克隆仓库并浏览其中包含的各种教学素材。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值