- 博客(927)
- 收藏
- 关注
原创 万字长文AI智能体:17种智能体架构详解
AI 智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。
2026-01-07 18:07:28
353
原创 新范式!字节提出智能体上下文折叠框架,1/10活跃量突破长周期任务瓶颈
智能体在执行长周期任务时,始终受限于上下文长度。为此,字节联合提出**上下文折叠(Context-Folding)框架**,使智能体能够主动管理其工作上下文。该框架允许智能体通过程序分支进入子轨迹以处理子任务,完成后将中间步骤折叠压缩,仅保留结果摘要。为使该行为可学习,研究人员开发了端到端强化学习框架FoldGRPO,通过特定过程奖励鼓励有效的任务分解与上下文管理。
2026-01-07 18:06:21
585
原创 大模型应用评测体系完整解析,小白也能快速上手
本文详细介绍了淘宝闪购技术部在AI产品落地过程中面临的挑战及解决方案,构建了一套贯穿AI产品全生命周期的评测体系。文章从"评什么"、"怎么评"、"怎么度量"和"线上效果评估"四个维度阐述了评测方法,并介绍了评测平台的架构与成果,最后展望了多模态评测、可视化标注和开放插件市场等未来方向。这套体系旨在保障大模型AI产品质量,促进持续迭代和价值落地。
2025-12-31 18:22:32
883
原创 Agentic AI与RAG技术选型指南:从原理到实战,一文搞懂何时用、何时避
本文深入解析了Agentic AI与RAG两大AI技术的本质、适用场景及结合方式。Agentic AI的核心是自主决策循环,适合多步骤工作流;RAG虽强大但非万能,规模化后需Context Engineering优化。文章提供了清晰的技术选型决策树:静态知识库适合纯RAG,多步骤任务适合纯Agentic AI,而需要"查资料+推理决策"的复杂场景则适合Agentic RAG。同时,本地模型作为成本优化方案也得到详细讨论,帮助开发者根据实际需求做出明智技术选择。
2025-12-31 18:21:15
822
原创 大模型核心原理与实战:Transformer架构与工程实践指南
文章详细解释了大语言模型从输入到输出的完整工作流程,包括文本分词与嵌入、Transformer架构与自注意力机制、位置编码等核心技术概念。文章以非技术方式阐述了模型如何将用户输入转换为矩阵、如何通过自注意力机制理解上下文、以及如何将内部表示"翻译"回人类语言。同时,文章提供了工程实践指导,包括上下文优化、耗时控制、多Agent协同等实用策略,帮助读者更好地应用大模型技术。
2025-12-27 18:26:32
863
原创 构建稳健高效的AI智能体:7种核心模式详解(收藏版)
本文深入探讨AI智能体的设计模式,区分工作流(遵循预定义路径)与智能体(具有更高自主权)。系统介绍3种工作流模式(提示链、路由、并行化)和4种智能体模式(反思、工具使用、规划、多智能体),详细阐述各模式适用场景与实现方法。强调构建智能体系统时应优先考虑简单方案,权衡成本收益,通过实证评估持续优化,而非过度设计。这些模式可作为灵活构建模块,组合应用于复杂智能体系统开发。
2025-12-27 18:25:15
732
原创 深入理解RAG索引:构建高效大模型检索系统的核心
RAG索引是将知识转化为可搜索数值数据的过程,是检索增强生成的关键基础。文章详解了六种索引策略:块索引、子块索引、查询索引、摘要索引、分层索引和混合索引,每种策略适用于不同场景和数据类型。成功的RAG系统需选择适当的索引策略,遵循数据结构,提高相关性并减少噪音,从而降低模型幻觉,提供准确可靠的系统响应。
2025-12-23 15:50:41
730
原创 为什么说泛化能力是AI的灵魂?小白也能看懂的AI核心原理
AI最本质的特点是泛化能力,即触类旁通、举一反三的能力。与传统计算机和人类相比,AI具有就近泛化优势,但缺乏远程泛化能力。这使AI能识别图像、编写代码,却难以提出创新假设。研究表明AI对职业替代率约11.7%,未来发展方向包括提升泛化能力和开发专业AI系统。理解泛化能力是把握AI精髓的关键。
2025-12-23 15:49:38
821
原创 用Coze搭建零代码智能客服:职场人必备的AI提效神器
本文详细介绍了如何使用Coze平台零代码搭建智能客服系统,解决职场人士重复回答客户咨询的问题。通过三大步骤:1)构建知识库作为"大脑",导入各类文档和知识;2)设计工作流实现"逻辑",包括问题理解、知识检索、语言优化等节点;3)创建智能体将两者结合,实现7×24小时自动回复。最后介绍了发布部署方式,帮助用户解放双手,提升服务质量与转化率。
2025-12-20 17:36:04
863
原创 谷歌5篇Agent白皮书深度剖析:AI智能体全链路技术详解,助力开发者领先行业
谷歌悄然发布5篇AI Agent白皮书,全面阐述智能体从定义到生产部署的全链路技术。文章强调AI Agent代表新计算范式,具备目标、能力、状态和行动循环;探讨工具扩展与安全挑战;提出结构化长期记忆系统;构建基于推理过程的评估范式;以及安全部署策略。这些内容将帮助从业者把握AI Agent发展方向,领先行业2-3年。
2025-12-20 17:35:03
853
原创 Python+LangGraph+RAGAS构建复杂RAG系统:哈利波特案例实战
本文详细介绍了使用Python+LangGraph+RAGAS技术栈构建复杂RAG系统的过程。以《哈利·波特》系列书籍为示例数据,展示了三种文档拆分方式(传统拆分、按章节拆分、引号拆分)并基于此构建了三个知识库。教程提供了完整的源码和视频指导,帮助读者从零开始打造可用于生产的RAG系统。
2025-12-19 19:09:37
1150
原创 RAG系统的成败关键:知识库建设与管理的完整指南
知识库是RAG系统的核心和生命线,其质量直接决定了智能问答系统的效果。一个完善的知识库系统需处理多数据源、复杂格式文档、数据更新与版本管理、文档召回优化等多个环节。随着数据量增长,需要通过模块化架构设计提升管理效率。高质量知识库是RAG系统稳定性和扩展性的基础,为大模型时代智能问答提供可靠数据支撑。
2025-12-19 19:08:46
942
原创 AI Agent实战指南:从原理到落地,企业数字化转型最后一公里》
AI Agent是能够自主规划、主动执行的新一代AI系统,解决了传统AI被动响应、技术栈复杂、运维成本高的痛点。其核心技术包括目标驱动规划、上下文感知记忆和生态系统交互能力。文章通过车险理赔案例,解析了AI Agent的资源调度架构与协作模式,讨论了落地挑战与解决方案。AI Agent代表了AI从"工具"向"同事"的进化,将降低AI应用门槛,但其成功落地70%取决于企业数字化基础设施完备度。
2025-12-16 18:54:33
793
原创 斯坦福、伯克利与IBM联合报告:AI智能体在生产中的真实状态与2026发展预测
斯坦福、伯克利与IBM联合报告揭示,成功落地的AI智能体以"低调、受控、人机协同"方式存在:73%用于提升生产力,68%仅具有限自主权,80%采用预定义工作流,70%直接使用闭源模型。未来趋势包括协同工作流、推理模型重要性提升、评估体系标准化及私有数据护城河。最有前景的应用领域包括软件工程、金融服务、医疗健康等十大领域,建议从内部高频重复场景入手部署。
2025-12-16 18:53:25
810
原创 LangGraph入门指南:构建复杂AI工作流的必学神器
LangGraph是构建复杂AI工作流的神器,其核心三要素为State(状态机)、Node(干活/函数)和Edge(流程控制)。它将复杂流程抽象为可维护的节点,每个节点可引入LLM或工具处理,使工作流清晰可控。作为图形处理引擎,通过compile和invoke执行,state作为共享数据结构在节点间传递更新,适合需要流程控制的应用场景。
2025-12-12 18:33:27
680
原创 RAG系统Chunking策略全解析:从基础到高级,收藏这篇就够了!
本文全面介绍了RAG系统中的Chunking策略,从基础固定大小分块到高级语义、LLM驱动和自适应分块等多种方法。文章详细分析了不同分块策略的适用场景、优缺点及实施步骤,帮助开发者根据文档类型和系统需求选择最佳方案。同时提供了LangChain和LlamaIndex等工具实现指南,并给出了企业落地测试和优化的实用建议,是构建高效RAG系统的重要参考。
2025-12-12 18:32:35
697
原创 大模型RAG完全指南:原理、实战、优化与架构
本文全面介绍RAG(检索增强生成)技术与LlamaIndex框架应用,通过《长安的荔枝》实例解析RAG工作原理、参数优化策略及内部架构。提供从概念到实战代码的完整指导,展示如何用30行代码实现问答系统,以及chunk_size、top_k等参数的调优方法。最后探讨RAG系统与AgentBay工具集成,增强执行能力。内容兼顾理论与实践,适合不同水平读者学习参考。
2025-12-11 18:10:01
898
原创 零代码实现大模型微调!LLaMA Factory全流程保姆级教程
本文详细介绍LLaMA Factory这一零代码大模型微调工具,通过Web界面实现本地模型微调。文章从工具安装开始,讲解模型选择、微调方法(全参数/冻结/LoRA)、模型量化技术及对话模板配置等关键步骤。LLaMA Factory支持100+主流模型,提供多种微调算法和精度选择,适合资源受限场景的企业应用和个人开发者使用,是小白入门大模型微调的理想选择。
2025-12-11 18:09:14
1406
原创 Dify与LangChain v1.0实战:从环境配置到企业级RAG系统构建全指南
本文通过五个关键步骤,详解如何将Dify与LangChain v1.0集成,构建企业级RAG应用。内容包括Dify核心功能解析、LangChain v1.0新特性、环境配置、API调用、数据流转设计、实战案例演示及性能优化策略。文章提供完整代码示例和最佳实践,帮助开发者掌握AI应用开发技术,平衡易用性与灵活性,释放AI生产力。
2025-12-09 10:32:37
759
原创 从RAG到GraphRAG:打造懂业务的新一代智能客服技术指南
文章探讨了智能客服从传统规则系统向大模型驱动的智能体的技术演进,提出新一代智能客服需要"领域大模型的脑"与"知识图谱的骨架"深度融合。通过RAG和GraphRAG技术,结合高质量数据训练和强化学习,构建能理解业务、准确回答的客服系统。未来智能客服将发展为多模态AI智能体,实现从文本问答到实际业务办理的跨越,重塑企业服务模式。
2025-12-09 10:30:22
689
原创 RankLLM:Python包实现大模型文档重排,信息检索新范式
RankLLM是一个开源Python包,利用大语言模型强大的语义理解能力对文档进行重排,提升信息检索质量。它支持多种重排策略(逐点、逐对、列表)和各类模型(闭源与开源),提供高灵活性和自定义能力。RankLLM将各种重排方法整合到模块化框架中,为研究人员提供统一实验平台,也为RAG应用提供可靠工具,已集成到LlamaIndex和LangChain等框架中,广泛被社区采用。
2025-12-05 18:32:26
861
原创 不依赖LangChain,手写精简ReAct Agent框架全流程解析
本文介绍如何从零构建不依赖第三方框架的精简ReAct模式Agent,通过感知、思考、行动、执行的循环实现智能行为。文章提供完整Python代码实现(含模拟模式),深入解析意图理解、规划能力和工具调用三大核心原理,并展示实际运行效果。最后提供了扩展思路,包括增加内存、搜索工具和错误处理机制,帮助读者彻底理解大模型智能行为的底层实现。
2025-12-05 18:31:32
798
原创 Agent Never Give Up MCP:让AI Agent自主脱困的实用工具,提升大模型开发效率!
Agent Never Give Up MCP是一个帮助AI Agent自主脱困的工具集,通过内置常见问题解法注入Prompt,使Agent在逻辑复杂、Bug修复失败、需求不明等场景中自主恢复。工具采用双层场景组织结构,包含核心和扩展场景,支持自定义工具配置。云端托管无需本地安装,只需添加服务器配置即可使用,帮助AI Agent识别困境、重新思考、制定新策略,实现无需人工干预的自主恢复。
2025-11-29 11:01:29
957
原创 从入门到精通:构建实时RAG架构,解决数据滞后问题
文章讨论了RAG系统中的数据时效性问题,提出了通过CDC机制、消息队列和增量索引更新构建实时RAG架构的解决方案。核心包括:实时捕获数据变更、事件驱动的索引服务、向量数据库的CRUD操作,以及确保ID策略和分块一致性的最佳实践。这种架构能有效解决传统全量索引更新的延迟问题,使RAG系统真正"活"起来,为业务提供最新、准确的信息支持。
2025-11-29 10:58:46
981
原创 程序员必备:AI Agent工作原理解析与高效使用技巧
AI Agent是从聊天助手进化而来的全能助理,其核心是"思考→行动→观察"的循环工作流程,由大模型(大脑)、工具(手脚)和流程组成。本文详解了Agent底层逻辑,并提供三个实用技巧:帮助Agent强化思考过程、提供精确的背景信息、创新式使用工具,帮助读者高效利用这些AI工具,不再被复杂功能所困惑。
2025-11-28 14:28:06
544
原创 大模型技术演进:从RAG到自主智能体的产品化之路
文章分析了自主智能体技术的发展历程,指出从RAG到Deep Research的演进是产品化落地的必然趋势。RAG技术在处理复杂认知任务时存在静态pipeline、无法自主规划等瓶颈,而自主智能体通过Planning、ReAct、Multi-Tool Execution等机制实现了任务拆解与自主执行。未来智能体发展将围绕标准化、深度集成、模型小型化、合成数据和Memory机制五大方向展开,真正拐点在于基础设施的完善而非单一模型升级。
2025-11-28 14:26:47
459
原创 珍藏必读:大型语言模型微调全攻略——14种主流方法原理与实战指南!
本文系统介绍大型语言模型微调技术,涵盖全微调与14种参数高效微调方法,包括BitFit、Prefix Tuning、Prompt Tuning、Adapter、LoRA等。详细分析各类方法的原理、优缺点、适用场景及实践指南,帮助开发者根据任务需求、计算资源等因素选择合适的微调策略,在保持模型性能的同时降低训练成本,实现高效的大模型应用适配。
2025-11-27 13:50:09
736
原创 AI Agent全解析:从本质构成到行业落地实践,一文掌握智能体开发
本文全面解析AI Agent的概念、构成、发展历史及行业应用。作者将AI Agent比作具有"大脑"(LLM+记忆+规划)、"感官"(多模态感知)和"手脚"(行动能力)的智能体,详述其从AI 1.0到AI 2.0的进化历程,并按决策能力与技术实现进行分类。文章强调理解AI Agent是为了提供解决问题的工具箱和结构化思维方式,帮助实践者精准选择和应用适合的Agent解决方案,而非停留在理论层面。
2025-11-27 13:48:39
769
原创 企业LLM落地三大支柱:RAG+MCP+Agent实现从对话到执行
文章阐述企业级大模型落地需三大核心组件:RAG提供企业内外知识访问能力,MCP封装企业服务为可调用工具,Agent整合两者实现任务自主规划与执行。三者结合使大模型从"能回答问题"升级为"能完成任务",构成完整的企业智能化架构,推动AI真正在业务中发挥价值。
2025-11-26 13:59:11
560
原创 别再混淆了!RAG、LangChain与Agent的真实关系,看这篇就够了
这是个极具代表性的问题——过去十八个月里,无论是刚入行的算法工程师,还是从传统开发转型AI的技术人,几乎都问过我同样的困惑。RAG、LangChain、Agent这三个词总是被捆绑出现,以至于很多人误以为它们是同一维度的技术,甚至必须组合使用才能落地。但事实恰恰相反:一个是业务架构模式,一个是开发工具框架,一个是智能应用形态,三者本质上泾渭分明。
2025-11-26 13:58:03
945
原创 解决智能体上下文难题:文件系统让AI更聪明
本文探讨了构建可靠智能体的核心挑战——上下文工程,分析了Token爆炸、信息量超载、找不到细分信息和无法学习进化四大难题。LangChain团队提出用文件系统管理智能体状态的创新解决方案,让智能体能灵活存储、检索和更新无限量上下文。该方法将抽象的上下文管理转化为具体文件操作,显著提升智能体可靠性,已被Deep Agents、Manus等实践项目验证,有望成为下一代智能体开发标准。
2025-11-25 15:25:35
636
原创 从零开始学向量数据库:RAG系统的基石
本文介绍了RAG技术栈中的核心组件——向量数据库,详细阐述了其定义、核心功能及在RAG系统中的关键作用,包括高效检索、语义理解、实时更新和多模态融合。文章对比分析了业界主流的六种向量数据库(Pinecone、Milvus、Faiss、Vespa、Annoy和ChromaDB),分别介绍了它们的特点、应用场景及代码示例,为开发者选择合适的向量数据库提供了全面参考。
2025-11-25 15:24:28
455
原创 解锁AI潜能!提示词工程完全指南
本文详细介绍了AI提示词工程的原理与实践。阐述了提示词的核心要素(角色、背景、任务、输出格式)和实用技巧(角色扮演、范例提供、迭代追问等)。进阶部分包含功能性提示词设计和行业级系统提示词构建。作者强调提示词工程是一种"表达艺术",通过清晰具体的描述能让AI更好理解需求,输出更精准的答案。文章提供了丰富实例和框架,帮助读者掌握与AI高效沟通的方法。
2025-11-24 17:42:03
722
原创 大模型应用开发实战:LangChain提示词模板全解析
本文详细介绍了LangChain框架中的提示词模板技术,包括文本提示词模板(PromptTemplate)、对话提示词模板(ChatPromptTemplate)、少量样本提示词模板(FewShotPromptTemplate)和消息占位符提示词模板(MessagesPlaceholder)等。通过丰富的代码示例,展示了各种模板的创建方法、参数配置和实际应用场景,帮助开发者掌握如何构建高效的结构化提示词,提升与大语言模型的交互质量,为大模型应用开发提供技术支持。
2025-11-24 17:40:03
1087
原创 程序员必学:RAG技术如何解决大模型的幻觉问题
RAG(检索增强生成)技术通过引入外部知识检索,解决了大语言模型知识时效性差、幻觉频发等问题。其系统包含四个核心阶段:Chunking将文档划分为知识块并转化为向量;Retrieval通过相似度匹配检索相关内容;Reranking对候选结果重新排序以提高精确率;Generation基于筛选后的知识块生成答案。这一"信息获取→筛选→理解→生成"的智能链路,大幅提升了大模型回答的准确性和领域适应能力。
2025-11-22 18:08:51
1084
原创 LangGraph Agent记忆持久化完全指南:从内存到Redis/MongoDB的4种方案实战对比
本文详细解析了LangGraph Agent的四种记忆持久化方案:内存记忆(MemorySaver)、Redis持久化、MongoDB持久化及文件持久化(FileSaver)。通过完整代码示例与实战对比,帮助开发者根据不同场景选择最合适的技术方案,解决AI Agent从"玩具"到"工具"的关键升级问题,实现对话记忆持久化。
2025-11-22 18:06:59
830
原创 构建自主LLM智能体的四大支柱:感知、推理、记忆、执行全解析
该文解读了《Fundamentals of Building Autonomous LLM Agents》综述,系统介绍了构建自主LLM智能体的四大核心组件:感知(处理环境输入)、推理(制定和调整计划)、记忆(提供长期知识存储)和执行(将决策转化为行动)。文章详细阐述了各组件的技术实现和设计原则,为LLM从"文本生成器"向"任务执行者"的演进提供了理论框架和实践指导。
2025-11-21 18:41:16
804
原创 智能客服的GraphRAG革命:从关键词匹配到认知智能
GraphRAG技术通过融合知识图谱与检索增强生成(RAG),重构传统智能客服系统,使其从基于规则的关键词匹配进化为具有认知能力的智能系统。该技术解决了传统客服的三大瓶颈:规则僵化、知识碎片化和服务冷机械,通过双核驱动架构实现语义理解、记忆存储和业务执行三层能力跃迁。实施后可显著提升客服效率和用户体验,并正向企业级AI Agent演进,预示着未来客服将向多模态交互、主动服务和行业深度渗透方向发展。
2025-11-21 18:40:22
906
原创 手把手带你从零开始掌握 LangChain,构建自己的 AI 应用
本文详细介绍 LangChain 框架如何解决大模型知识过期、无记忆能力和缺乏工具使用能力的三大局限。通过五阶段实战教程,从基础环境搭建到记忆功能、RAG检索增强、Agents工具使用,再到Streamlit网页界面和LangGraph流程编排,手把手教读者构建自己的AI应用。文章提供完整可运行代码,适合零基础读者学习,助力开发者快速掌握大模型应用开发技能。
2025-11-21 18:38:46
668
原创 大模型少样本提示完全指南:3-5个示例让AI表现飙升
少样本提示是通过提供少量(2-5个)任务示例引导大语言模型理解任务需求的技术。其优势在于提升表现、快速适配和降低数据需求。设计时需注意提示结构清晰、任务描述明确、示例排序合理,确保示例具有典型性、一致性和多样性。示例质量受数量、排序、标签分布等因素影响,大模型更善于利用少样本学习。为消除模型偏见,可采用校准技术,而强化型和无监督上下文学习可帮助构造更多示例。
2025-11-20 11:37:22
1207
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅