【HelloAgent零基础入门】day1-优快云博客

11.8开营

开营直播：

陈思州介绍了整本书的主要章节内容。每一章内容在前一章上扩展更新。

下一步计划：

腾讯优图RAG技术的架构设计与创新实践：

上下文工程资料：

了解发展进程，并理解什么是Agent：让AI不仅仅是一个有问必答的工具，而是成为一个能自主规划、调用工具、解决复杂问题的行动者。

MSA多智能体系统

本项目重点是应用和构建。

项目章节划分：

code文件夹里存放了项目代码。

掌握智能体的本质。

智能体被定义为任何能够通过传感器感知其环境，并自主地通过执行器采取行动以达成特定目标的实体。

环境：摄像头、麦克风、雷达或各类应用程序编程接口API返回的数据流，都是其感知能力的延伸

行动：通过执行器改变状态，例如物理设备（机械臂、方向盘）或虚拟工具（执行一段代码，调用一个服务）

自主性Autonomy：进行独立决策

理解案例：智能旅行助手案例，LLM智能体将一整个规划流程整合起来，实现规划与推理、工具使用、动态修正等操作。

核心不再是编写代码，而是引导一个通用的“大脑”去规划、行动和学习。

大语言模型驱动的智能体是神经符号主义的一个极佳实践范例。其内核是一个巨大的神经网络，使其具备模式识别和语言生成能力。然而，当它工作时，它会生成一系列结构化的中间步骤，如思想、计划或 API 调用，这些都是明确的、可操作的符号

使用PEAS描述一个任务环境：

几乎所有任务都发生在序贯且动态的环境中，序贯意味着当前动作会影响未来。

了解智能体并非一次性完成任务，而是通过一个持续的循环与环境进行交互，这个核心机制被称为智能体循环Agent Loop，描述了智能体与环境之间的动态交互过程，构成了其自主行为的基础。

利用图片加以理解：智能体循环

在这里插入图片描述

但是智能体的循环如何有效驱动呢？需要一套明确的交互协议Interaction Protocol来规范其与环境之间的信息交换

输出不再是单一的自然语言回复，而是一段遵循特定格式的文本，其中明确地展示了其内部的推理过程与最终决策

包含了两个核心部分：

思考Thought
行动Action：理解这里的action，实际就是决定对环境施加的具体操作，通常以函数调用的形式表示

action字段构成了对外部世界的指令→外部解析器捕捉到这个指令→调用相应的函数→行动执行后返回一个结果→感知系统对结果数据进行处理，封装并处理成一段简洁、清晰的自然语言文本→反馈给智能体，作为下一轮循环的主要输入信息

循环使得LLM智能体得以将内部的语言推理能力与外部环境的真实信息和工具操作能力有效地结合起来。