文章通过简历筛选案例,系统介绍了AI系统架构的四个发展阶段:纯LLM架构、RAG系统、AI工作流和AI Agent。强调应根据实际需求选择合适架构,避免盲目追求先进技术。简单任务只需基础提示词工程,复杂业务流程才需要Agent的自主规划能力。建议从简单模式入手,按需增加复杂度,优先考虑系统可靠性和稳定性,而非功能丰富性。

AI Agent 是当前的一个热门话题,但并非所有 AI 系统都需要采用这种架构。
虽然 Agent 具有自主决策能力,但更简单、更具成本效益的解决方案往往更适合实际业务场景。关键在于根据具体需求选择恰当的架构方案。
本文将探讨大语言模型(LLMs)的最新进展,并解析 AI 系统的核心设计理念。
我们实践过从不包含示例的提示词技术(zero-shot prompting)到思维链推理,从基于 RAG 的架构到复杂工作流及 autonomous agents 等不同复杂度的 LLM 项目。
这个新兴领域的术语体系仍在演进,不同概念之间的边界尚未界定,分类标准仍不固定。随着该领域的发展,新的框架和工程实践不断涌现,推动构建更可靠的 AI 系统。
为直观展示不同系统的差异,我们将通过简历筛选这个典型案例,揭示不同架构层级在能力和系统复杂度上的非线性跃升。
1、纯 LLM 架构
纯 LLM 本质上是互联网信息的有损压缩包,是从其训练数据中提取的知识快照。 它尤其擅长处理依赖其参数化知识(即训练阶段内化的信息)的任务,典型场景包括:总结小说内容、撰写关于全球变暖的论述、用 5 岁儿童能理解的语言解释狭义相对论、或者创作俳句(译者注:日本有一种特定格式的诗歌,叫做“俳(pái)句”,在形式上堪称世界文学中最短的格律诗。)。
但若没有额外的功能扩展,LLM 无法提供实时信息(例如纽约的当前气温)。这正是纯 LLM 与 ChatGPT 等对话式应用的区别 —— 后者通过实时搜索和其他工具增强了核心 LLM 的能力。
不过,并非所有功能增强都需要外部上下文。通过提示词工程(如上下文学习、小样本学习等技术),LLM 无需检索外部信息也能处理特定问题。
应用示例:
只需采用使用单个示例的提示词技术(one-shot prompting)结合上下文学习,就能让 LLM 根据职位描述对简历进行「通过/不通过」的二分类判断。

2、RAG(检索增强生成)
检索方法通过提供相关上下文来增强 LLM 的能力,使其输出更具时效性、精确性和实用性。 借助这一技术,可以让 LLM 访问并处理内部数据。这些上下文信息使 LLM 能够提取信息、生成摘要并生成响应。RAG 还能通过实时数据检索获取最新信息。
应用示例:
在简历筛选场景中,通过检索公司的内部数据(如工程操作手册、招聘政策及历史简历资料)来丰富上下文信息,从而做出更准确的分类判断。
检索过程通常需要借助向量化工具、向量数据库和语义搜索等技术实现。

3、工具调用(Tool Use)与 AI 工作流(AI Workflow)
LLM 能够通过定义明确的路径实现业务流程自动化,这类系统最适合处理结构清晰、标准统一的任务。
通过使用工具调用(Tool use)可以实现工作流自动化。通过对接各类 API(包括计算器、日历、邮件服务或搜索引擎等),LLM 可以利用可靠的外部工具,而非依赖其存在非确定性的原生能力。
应用示例:
这个 AI 工作流可以连接招聘门户获取简历和职位描述 → 根据经验、学历和技能评估投递简历者的资质 → 发送相应的邮件回复(拒信或面试邀请)。
要实现这个简历筛选工作流,LLM 需要访问数据库、邮件 API 和日历 API,并按照预设步骤以编程方式实现全流程自动化。

4、AI Agent
AI Agent 是具备自主推理能力和决策能力的系统。 它们能够:将任务分解为多个步骤、根据需要调用外部工具、评估执行结果、并自主决定后续动作(存储执行结果/请求人工干预/继续执行下一步)。
这代表着在工具调用和 AI 工作流之上的又一层抽象,实现了规划和决策的自动化。
与 AI 工作流需要明确的用户触发器(如按钮点击)且必须遵循预设路径不同,AI Agent 可以自主启动工作流,并动态决定各环节的执行顺序和组合方式。
应用示例:
AI Agent 可以管理完整的招聘流程,包括:解析简历、通过聊天或邮件协调面试时间、安排面试会议、以及处理日程变更等。
这项综合性任务要求 LLM 具备以下访问权限:数据库、邮件和日历 API,以及聊天和通知系统。

那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

为什么要学习大模型?
我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。


👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。


👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!
1473

被折叠的 条评论
为什么被折叠?



