- 博客(1606)
- 收藏
- 关注
原创 【收藏必备】RAG检索优化实践:混合检索与重排序解决检索失效问题
本文分析了RAG应用中检索失效的两大问题:专有名词匹配失败和语义漂移。提出解决方案为混合检索(结合向量检索和BM25关键词检索)与重排序技术。混合检索通过RRF算法融合两种检索结果提高召回率,重排序使用Cross-Encoder模型对候选文档精确评分提升精度。这种"粗排+精排"的分层架构在不同领域均有重要应用价值,是构建高精度RAG系统的基石。
2025-11-24 11:25:07
602
原创 【超详细】构建具备五大核心能力的多智能体开发平台,建议收藏学习!
文章详细介绍了如何构建一个具备自主规划、编排、执行、反思和优化能力的多智能体开发平台。系统架构由认知引擎(ACE)、记忆系统、工具执行层、编排控制层和协作通信层组成,包含感知、记忆、规划、行动、反思、协作和控制七大核心能力。重点阐述了记忆系统的三层架构(RAG+知识图谱+多模态)、自主规划机制、工作流编排技术和多智能体协作模式,并提供了从设计到工程化落地的完整路径。
2025-11-24 11:20:01
850
原创 必学!大模型Agent规划模式详解:让AI从“不知道怎么做“到“主动规划“(建议收藏)
本文详解AI Agent规划模式,解决Agent不知道"怎么做"的问题。通过任务分解和动态调整,让Agent自主将复杂目标拆解为可执行步骤序列,实现"先规划后执行"。文章阐述四大要素、与其他模式区别、实战实现(CrewAI/OpenAI API)、应用场景及工程化实践。掌握此模式能让AI从"被动响应"升级为"主动规划",显著提升自主能力和适应性。
2025-11-24 11:00:45
555
原创 【深度收藏】上下文工程实践:如何构建高效、稳定的AI智能体系统
本文分享了Manus团队在构建AI智能体过程中总结的上下文工程实践经验,包括围绕KV缓存设计、遮蔽而非移除工具、以文件系统为上下文、通过复述操控注意力、保留错误内容、打破少样本局限等六项关键技术。这些方法帮助团队将产品迭代周期从数周压缩至数小时,使智能体与底层模型保持灵活适配,避免重蹈从零开始训练模型的覆辙。作者强调上下文工程已成为AI智能体开发的核心支柱,其重要性不亚于底层模型的升级优化。
2025-11-24 10:51:50
753
原创 必学!大模型Agent规划模式详解:让AI从“不知道怎么做“到“主动规划“(建议收藏)
本文详解AI Agent规划模式,解决Agent不知道"怎么做"的问题。通过任务分解和动态调整,让Agent自主将复杂目标拆解为可执行步骤序列,实现"先规划后执行"。文章阐述四大要素、与其他模式区别、实战实现(CrewAI/OpenAI API)、应用场景及工程化实践。掌握此模式能让AI从"被动响应"升级为"主动规划",显著提升自主能力和适应性。
2025-11-24 10:44:22
450
原创 建议收藏 | 大模型从零到精通:Stanford CS336系统性学习笔记与实战指南
本文基于Stanford CS336课程,系统介绍了大语言模型从零构建的关键技术,包括BPE分词器设计、计算复杂度与显存估算、网络结构选择(如RMSNorm、RoPE等)、超参数优化、训练稳定性技巧、MoE架构、GPU优化策略、分布式并行训练方法、推理优化技术、Scaling Law规律以及模型评估与数据处理等,为构建大语言模型提供了完整的系统性框架。
2025-11-24 10:40:40
347
原创 【必学收藏】从零开始掌握RAG检索增强生成技术:18种提升大模型效果的方法详解
本文详细介绍了18种RAG(检索增强生成)技术,包括Simple RAG、语义分块、上下文增强检索等多种方法。通过测试比较,自适应RAG评分最高(0.86),表现最佳。文章指出不同技术适用于不同场景,选择最适合的技术对提高检索准确性和生成回答质量至关重要,为开发者提供了全面的技术选择参考。
2025-11-23 08:00:00
820
原创 AI智能体入门到精通:五大特征、应用场景与实战案例(必看收藏)
AI智能体是将大模型嵌入闭环系统,具备感知、决策、行动和记忆能力的系统,具有自主性、反应性、交互性、主动性和学习能力五大特征。它从简单的聊天机器人发展到能协作完成复杂任务的系统,架构包括感知层、记忆层、推理层、工具层、执行层和监控层。开发者可通过选择模型、开发工具、整合系统构建智能体,实现从"会说"到"能做"的转变,解决现实问题。
2025-11-22 10:05:43
1088
原创 【干货收藏】AI大模型应用架构设计10个必会面试题及解答
文章介绍了10个精选的AI大模型应用架构设计面试问题,涵盖RAG评估、幻觉减少、模型微调、检索系统设计等关键领域。每个问题详细分析考察点和解决方案,帮助求职者掌握大模型应用架构设计核心知识,应对企业面试需求,同时也强调了学习大模型技术的重要性。
2025-11-22 10:02:21
711
原创 收藏必学!从RAG到REFRAG:大模型检索增强技术的效率革命
文章介绍了大型语言模型的知识静态性问题及解决方案。传统RAG技术通过检索外部知识增强模型能力,但存在效率瓶颈。REFRAG技术革新性地将检索到的信息压缩为向量表示,通过智能过滤只保留最关键文本,大幅减少处理词元数量,实现高达30倍的速度提升和2-4倍的成本降低,同时保持甚至提高回答质量,使大模型能够高效处理实时和私有信息。
2025-11-22 09:59:49
374
原创 LinearRAG:零成本高性能图检索增强生成框架,收藏级大模型知识检索解决方案
LinearRAG解决了现有GraphRAG因知识图谱质量差导致的性能问题。通过Tri-Graph架构、两阶段精准检索和零Token范式,避免了关系提取错误,提高了检索准确率,同时大幅降低索引时间和成本。在多个基准数据集上全面超越现有方法,成为大规模企业知识库检索的生产级解决方案。
2025-11-22 09:57:08
854
原创 【必学收藏】从RAG到GraphRAG:知识图谱如何让大模型实现从“搜索数据“到“推理洞察“的质变
本文剖析了传统RAG架构在处理复杂关系和全局性问题时的局限性,介绍了GraphRAG如何通过知识图谱将非结构化数据转化为结构化认知,实现从搜索到推理的质变。GraphRAG在多跳推理、全局总结和可解释性方面实现三大跨越,但也面临构建成本高、质量维护等挑战。最佳实践是采用Vector+Graph混合模式,根据问题复杂度选择不同检索策略。
2025-11-21 15:23:06
556
原创 RAG系统性能优化指南:从局部优化陷阱到系统级解决方案(收藏级)
文章指出大规模RAG系统的延迟优化需要从系统级角度出发,而非仅关注局部优化。通过多层次策略包括检索阶段优化(多级召回、混合检索)、上下文管理(重排序、压缩)、生成阶段优化(高效推理框架)以及系统级编排与缓存(多级缓存、请求路由),才能实现真正的低延迟高吞吐。系统性工程是解决大规模RAG延迟问题的关键。
2025-11-21 15:20:19
877
原创 收藏必备:大模型微调实战:如何让模型成为你的“风格大师“而非“知识库“
微调(Fine-tuning)主要教会大模型的是"行为模式"而非"事实知识"。它适合调整模型风格、格式和特定任务映射,但不适合注入新知识或增强推理能力。正确使用微调可让模型成为"风格大师",错误使用则浪费资源。最佳实践包括明确教模式而非知识、提供清晰输入输出映射、多样化数据等。区分微调、RAG和预训练的功能,才能高效使用大模型。
2025-11-21 15:15:06
694
原创 【必学】大模型技术全解析:PEFT微调、模型压缩与量化技术详解
本文全面介绍大语言模型(LLM)核心知识,包括基础概念、架构与预训练。重点讲解参数高效微调(PEFT)技术如适配器、LoRA和QLoRA,以及提示工程策略。详细探讨模型压缩方法,包括剪枝、量化技术(GPTQ、NF4、GGML)和知识蒸馏,帮助开发者优化模型性能和资源使用。文章还介绍推理技术和微调方法对比,提供完整大模型技术学习框架。
2025-11-21 15:12:02
1020
原创 【精华收藏】大模型Agent架构设计:10个高频问题全解析,从入门到实战
本文精选10个高频且极具挑战性的AI大模型Agent设计问题,从RAG性能评估到多模态模型评估,每个问题提供解决方案和示例代码。内容涵盖减少幻觉现象、GPU有限情况下的微调、多语言检索系统设计、法律领域评估、欺诈检测调试、客服延迟优化、生物医学检索提升、Agent持续改进及多模态评估等方面。旨在帮助开发者掌握大模型应用架构精髓,从"怎么做"到理解"为什么这样做"。
2025-11-21 14:59:22
852
原创 【必藏】吴恩达AI Agent落地五步法+大模型学习路线,从入门到实战企业级应用
吴恩达提出AI Agent构建核心在于任务拆解、流程建模、评估机制与工具认知。文章详细阐述企业AI Agent落地的五步循环路径:业务痛点识别与流程解构、最小可行Agent构建、评估体系工业化、规模化扩展与体验优化、持续反馈与领域增强,并结合采购合同审查案例说明实施方法。同时提供大模型学习资源,帮助开发者抓住AI风口。
2025-11-20 10:24:11
821
原创 【必收藏】大模型Agent设计实战:10个高频问题解决方案与代码实现,从小白到进阶
文章精选大模型Agent设计的10个高频问题解决方案,涵盖RAG系统评估、幻觉减少、多语言检索、延迟优化等关键领域,提供详细解决策略与可执行代码示例。同时系统介绍大模型学习路径,从基础理论到实战应用,帮助开发者掌握Agent架构核心技术,提升构建高效AI系统能力,适合各类学习者从零基础进阶。
2025-11-20 10:19:04
835
原创 收藏必备!小白到专家的AI大模型学习全攻略,程序员必看
本文系统介绍了人工智能的基础知识、分类与应用,详细阐述了AI如何改变工作、医疗、交通等各领域。文章强调,随着AI大模型技术的迅速发展,掌握相关技能已成为程序员和职场人士的必备能力。文中提供了从入门到进阶的完整学习路线和实战资源,帮助读者系统学习大模型技术,抓住AI时代的机遇,实现职业发展突破。
2025-11-20 10:15:48
544
原创 【干货】大语言模型(LLM)微调核心:数据集准备全流程详解,建议收藏!
本文详细介绍了大语言模型(LLM)微调数据集的完整准备流程,包括数据集概念、不同格式选择(原始语料、指令、对话等)、数据来源、Unsloth工具应用、合成数据生成及视觉微调特殊场景处理。通过清晰的代码示例和实际操作建议,帮助读者从零开始打造高质量微调数据集,提升模型性能。
2025-11-20 10:10:55
1004
原创 大模型Function Call优化全攻略:5个方法让你告别“不稳定“,程序员必藏
本文针对大模型Agent中Function Call的稳定性问题,提出5个体系化优化方法:动态函数路由减少工具噪音、CoT+Plan-Execute强制模型先规划后执行、结果校验层拦截参数错误、长程记忆保持上下文连贯、日志驱动持续调优。通过真实案例展示这些方法可显著降低错误率,强调系统性思维而非单一知识点是构建可靠Agent的关键。这些实战策略帮助开发者打造稳定可控的大模型应用系统。
2025-11-20 10:04:25
972
原创 Google最新Agent白皮书:构建可靠AI系统的完整指南(程序员必读收藏)
Google最新Agent白皮书是一份正式指南,帮助开发者从概念验证过渡到生产级系统。文章介绍了Agent的四大核心要素(模型、工具、编排层、部署)及五步工作循环,提出五级分类法,强调专家团队模式。白皮书详细讨论了部署、运维、评估、交互性和安全性等内容,以及Agent如何通过经验和反馈进行学习和进化,为构建可靠AI系统提供了全面指导。
2025-11-19 10:52:33
709
原创 【必收藏】小白程序员必看:如何选择最适合的Embedding模型?实用评估框架全解析
文章提供系统化Embedding模型选择框架,包括明确业务需求、评估数据特性、调研可用模型、评估候选模型和集成部署规划六个步骤。详细介绍了文本、图像、音频、多模态模型在语义搜索、分类、推荐等场景的应用,并提供评估基准和集成策略,帮助开发者根据实际需求选择最合适模型而非仅看基准测试分数。
2025-11-19 10:49:14
785
原创 【收藏必备】2025年AI Agent全面解析:五大框架带你快速上手大模型智能体开发
本文详细介绍了AI Agent的概念、特性及在企业中的广泛应用,重点解析了2024年五大主流Agent框架(Phidata、Swarm、CrewAI、Autogen和LangGraph)的功能特点、使用方法及代码示例。这些框架通过提供内置工具、知识库集成、记忆功能等特性,简化了AI Agent的开发流程,助力开发者快速构建高效智能助手,提升产品开发速度和质量。
2025-11-19 10:45:20
1074
原创 必学收藏!Agent RFT智能体强化学习微调:从根本上改变大模型权重,提升任务性能与效率
Agent RFT是一种智能体强化学习微调技术,允许模型在训练过程中调用外部工具并从中学习,从根本上改变模型权重。通过自定义奖励信号(Grader)引导智能体探索最佳任务路径,可显著提升特定领域任务性能、提高工具使用效率并降低延迟。该技术已在FinQA基准测试及Cognition等客户案例中得到验证,是优化AI智能体性能的有效方法。
2025-11-19 10:42:30
875
原创 如何构建真正自主的LLM代理?四大核心架构与实现指南
本文深入探讨如何构建真正自主的LLM代理,而非简单的工作流。基于最新研究论文,详细解析了代理的四大核心系统架构:感知系统(环境理解)、推理系统(任务规划与反思)、记忆系统(知识存储)和执行系统(行动转化)。文章对比了工作流与代理的本质区别,分析了当前技术挑战,并指出从"提示词工程"转向"系统工程"的重要性,为AI工程师提供了构建自主代理的实用指导。
2025-11-18 10:34:54
897
原创 必读收藏 | LLM与SLM大对决:企业级AI选型完全指南
本文对比分析了小型语言模型(SLM)与大型语言模型(LLM)的特点与适用场景。SLM参数规模小、部署灵活、成本低,在垂直领域精度高;LLM参数规模大、通用性强但成本高。企业应根据业务需求选择:中小企业、边缘设备部署、垂直领域任务优先考虑SLM;开放式创意任务、复杂推理需求则适合LLM。SLM与LLM并非替代关系,而是互补关系,未来将形成混合架构,共同推动AI技术发展。
2025-11-18 10:30:55
950
原创 大模型RAG系统构建:从零开始攻克检索增强生成的核心难点(建议收藏)
本文深入剖析了大模型检索增强生成(RAG)系统的构建难点,强调RAG是系统工程而非单点技术。文章详细解析四大关键难关:数据准备、检索召回、Query理解和生成控制。真正的挑战在于各环节的高效协同与稳定上线,需要同时掌握算法设计与系统搭建能力。RAG作为大模型落地的"脊梁骨",其质量直接决定应用成败,是体现算法工程师综合能力的关键模块。---
2025-11-18 10:21:59
1150
原创 RAG面试加分项:首字延迟(TTFT)优化实战,从Embedding到系统架构,收藏级指南
本文详细介绍了RAG系统首字延迟(TTFT)的工程优化方案,从Embedding层、向量检索层和系统架构层三个维度展开。Embedding阶段通过批处理、异步并发和缓存减少等待时间;向量检索阶段采用HNSW索引、分区过滤和批量查询提升速度;系统层实现全链路异步流水线和三层缓存体系,整体可将首字延迟降低数十至上百毫秒,适合大模型项目实战和面试准备。
2025-11-17 11:21:17
868
1
原创 【必学收藏】2025向量数据库全解析:AI大模型落地的关键基础设施,从入门到精通指南
文章详细介绍了向量数据库作为AI大模型时代关键基础设施的重要性,系统梳理了开源与闭源两大阵营的各类数据库产品及其技术特点、性能表现和适用场景。针对不同规模数据需求、技术能力和运维成本,提供了针对性的选型建议,帮助开发者解决大模型幻觉、算力成本和数据利用等核心挑战。
2025-11-17 11:11:41
962
原创 【必学收藏】从零构建单/多智能体系统:LangGraph实战Agentic AI开发指南
作者通过构建科技趋势追踪的Agentic AI系统,对比了单智能体与多智能体的差异。单智能体虽灵活但易出错,多智能体通过分工协作产出更高质量结果。LangGraph作为图形化框架,使多智能体能协同工作,虽工程复杂但效果显著。作者建议快速验证用单智能体,高质量输出用多智能体,最佳方案是混合模式,强调Agentic AI是人脑逻辑与机器执行的结合体。
2025-11-17 11:04:46
988
原创 大模型文本编码完全指南:三种微调策略详解,让你的大模型应用效果提升10倍(建议收藏)
文本编码是将自然语言转化为高维向量的能力,决定大模型应用效果上限。本文详解三种技术路线:直接取预训练模型隐藏状态(零成本但效果有限);微调编码头(分类或对比学习,提升特定任务精度);专为RAG场景微调(问题与答案编码到同一空间,实现高效检索)。根据业务场景和数据量选择合适策略,可用1%算力换取10%业务提升,实现"四两拨千斤"。
2025-11-17 10:23:43
888
原创 【必看收藏】零基础3个月掌握大模型开发能力!完整学习路线与核心知识点详解
文章系统介绍了AI大模型的五大核心技术(Prompt Engineering、LangChain、Fine-tuning、RAG、LlamaIndex)和四阶段学习路线,帮助零基础学员3个月内掌握工业级开发能力。内容涵盖技术架构、实战案例、避坑指南,并强调掌握Prompt+LangChain+RAG三大技术可带来45%的薪资溢价。文章提供从基础到进阶的完整学习路径,适合转型开发者及AI爱好者。
2025-11-16 09:00:00
599
原创 一文带你看懂什么是人工智能体(AI_Agent)?看完这篇就够了!
AI智能体正从被动工具进化为主动伙伴,具备规划、记忆和工具使用三大核心能力,通过"观察-决策-行动"循环机制完成任务。实在智能的"实在Agent"等产品已实现"一句指令,自动完成"的工作模式,广泛应用于客服、跨境、内容创作、数据分析、制造业等领域。未来,AI智能体将重塑人机协作模式,人类专注于创新决策,AI负责执行任务。学习大模型技术已成为抓住AI风口的关键,掌握AI智能体技术将带来职业发展新机遇。
2025-11-16 08:45:00
767
原创 【深度收藏】为什么Python成为大模型智能体开发的首选?Java开发者的AI转型必读
文章分析了Java在开发大模型智能体方面的局限性,指出Java生态系统不适用于智能体开发,语言本身"太重"不适合快速迭代。而Python已形成完整的AI技术栈,在实际落地中占据90%以上市场份额。作者强调Java更适合作为智能体的调用层而非开发层,Java开发者若要进入AI领域,需转向Python生态。
2025-11-15 08:00:00
498
原创 【珍藏干货】从零开始实现RLHF:DeepSpeed-Chat训练大模型完整指南与踩坑实录
本文详细介绍了基于人类反馈的强化学习(RLHF)技术,从基本概念到实践应用。重点阐述了三步法中的奖励模型训练和强化学习过程,分享了使用DeepSpeed-Chat框架训练大模型时的实际问题和解决方案,包括模型生成重复文本、强制生成到最大长度等问题,并提供了如奖励缩放等实用技巧,帮助读者成功训练出效果提升的自己的大模型。
2025-11-15 08:00:00
1507
原创 【收藏】为什么大模型开发流程正确却结果不佳?智能问答系统优化实录
本文分享了智能问答系统的开发与优化过程。作者最初采用纯RAG技术按场景划分知识库,但因结构化与非结构化数据混合、场景区分不清导致效果不佳。后转变思路,按数据类型而非场景划分知识库,并设计相应的条件查询和相似度查询工具,解决了场景判断和混合查询问题。文章强调,大模型开发中思路问题往往比技术问题更重要,正确的架构设计比单纯的技术实现更关键。
2025-11-14 11:35:33
1049
原创 大模型技术精要:Transformer、MoE、RAG等核心技术全解析,程序员收藏必备
本文系统介绍了大模型领域的多项关键技术,包括Transformer架构与混合专家模型(MoE)原理、5种大模型微调方法、多种RAG系统对比分析、文本分块策略、智能体系统等级划分以及KV缓存优化技术。内容从基础架构到高级应用全面覆盖,既有理论深度又有实践指导,为初学者和程序员提供一站式大模型学习指南,助您快速掌握核心技能。
2025-11-14 11:31:31
877
原创 【收藏级干货】让AI记住一切:Agent记忆模块的完整实现方案
Agent记忆模块分为短期记忆(上下文缓存)和长期记忆(向量存储),通过"Retrieve→Reason→Update"闭环实现。短期记忆维护上下文连续性,长期记忆提供知识持久化。工程落地需考虑存储方式、内容选择和更新机制,实现灵活与效率、容量与可控的平衡。记忆系统让AI从短期问答进化为具备长期状态感的智能体。
2025-11-13 10:50:34
1090
原创 从零开始学大模型:分类、训练、Token与参数控制,收藏级技术指南
文章系统介绍大模型基础知识,包括AI分类、LLM训练过程、Token概念、Temperature与Top P参数,以及AI Chat的联网搜索、文件读取和记忆功能。同时分析全球AI发展现状、中美对比、美国对华AI限制影响及中国主要AI公司,是一份适合小白和程序员的全面学习指南。
2025-11-13 10:45:04
1042
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅