- 博客(1795)
- 收藏
- 关注
原创 【必收藏】超越提示工程:上下文工程(Context Engineering)重塑大模型应用范式
从数学角度看,上下文工程的核心是从将上下文视为单一字符串(C = prompt)转变为一个动态组装的、结构化的信息集合。这个转变是理解其科学性的第一步。这里的A代表一个编排函数(Orchestration Function),它就像一位指挥家,将各种不同来源的信息(c)智能地组合成一段连贯、高效的最终上下文,然后才送入大语言模型。只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。
2026-01-08 11:12:09
687
原创 【强烈收藏】AI Agent实战指南:从工具到智能伙伴,大模型技术全解析
人工智能体(AI Agent)是AI发展的新阶段,具备自主性、环境感知和持续学习能力三大特征。它能从工具进化为智能伙伴,理解目标、制定计划并执行任务。AI Agent在电商、办公、生活等场景有广泛应用,将降低重复劳动、提升决策效率,成为企业数字化转型的"超级引擎"。未来,AI将与人类并肩工作,带来机遇与挑战。学习大模型技术,掌握AI Agent开发能力,是抓住AI风口的关键。
2026-01-08 11:09:13
264
原创 必学!从“实习生“到“专家“:算法工程师的大模型Prompt工程心法(收藏)
文章分享交易风控算法工程师如何通过循序渐进的Prompt工程,将通用大语言模型逐步调教成精准识别电商风控风险的AI专家。从"角色扮演+结构化输入输出"框架,到注入业务常识、提升分析深度,最终实现"双假设裁决框架",使AI能区分"真团伙"与"假聚集"。作者提炼Prompt工程心法:始于模仿终于框架、规则是骨架背景是血肉、反例是最佳老师、从"指令"到"思维模型",展示如何将领域专业知识转化为AI可理解的语言,实现人机协作最佳实践。
2026-01-08 11:06:14
466
原创 收藏必备!多智能体系统实战指南:让AI Agent协作解决复杂任务的终极方案
文章介绍了多智能体系统(MAS)作为解决复杂AI任务的关键范式,分析了其在分布式任务、异构处理、系统鲁棒性和多方博弈等场景的应用优势。通过新闻生成器案例展示了研究分析师和内容撰稿人的协作流程,并详细解析了Agents as Tools、Swarm、Graph和Workflow等主流设计框架。多智能体系统通过角色分工和协同合作,有效突破了单智能体处理复杂多维任务的局限性,是构建下一代AI应用的重要技术。
2026-01-08 11:03:23
477
原创 收藏必备!DeepSeek与Qwen大模型实战对比:Web、Python、小程序、Cocos全方位评测
文章对DeepSeek和Qwen两大大模型进行了全面对比评测,从价格和编程效果两方面进行了测试。编程测试包括Web页面、Python、微信小程序和Cocos小游戏四个场景。结果显示DeepSeek价格更优惠,而Qwen在编程效果上更胜一筹。作者根据自己的需求决定继续使用Qwen的Token服务,并分享了AI大模型学习资料。
2026-01-08 11:00:21
422
原创 RAG实战:手把手教你用LlamaIndex存取Embedding向量!
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。
2026-01-08 10:51:22
392
原创 Agent Engineering 的 10 大核心工程维度:构建生产级智能体系统的完整指南
【定义与使命】所以,智能体工程就是:将不确定的基于LLM的系统, 迭代优化为可靠生产级应用的工程化过程。它强调一个循环往复的迭代周期: 构建 → 测试 → 部署 → 观测 → 优化,再重复。在智能体工程中,“上线”不再是终点,而是获取真实反馈、持续改进的起点。其原因在于:传统软件工程依赖确定性逻辑,你可以通过严格的单元测试和代码审查,在上线前杜绝大部分bug;而Agent 系统内部包含概率模型(LLM),无法靠预先测试保证万无一失。
2026-01-07 11:11:45
983
原创 【干货收藏】告别金鱼记忆:MemMachine通用记忆层解决方案详解
文章介绍了MemMachine通用记忆层解决方案,它解决了AI Agent"金鱼记忆"问题。采用图+SQL+向量的混合架构,比传统RAG更准确处理用户记忆。提供开箱即用的Profile Memory,支持私有化部署和MCP协议,能降低开发门槛,构建产品壁垒,适合医疗、金融等需要精准记忆的场景,但对简单任务可能过于复杂。
2026-01-07 11:07:16
522
原创 AI Agent 如何记住一切?短期对话 + 长期知识的记忆架构全解析→建议收藏!
会话级记忆(短期记忆):特指用户与 AI Agent 在单次会话中的多轮交互数据,包括用户查询、Agent 响应、工具调用及执行结果等,直接服务于当前会话的实时交互。跨会话记忆(长期记忆):从多次会话中抽取提炼的通用信息,涵盖用户偏好、核心事实、领域经验等,能够跨会话辅助 Agent 进行个性化推理。需要注意的是,短期记忆与长期记忆并非单纯以时间维度划分,核心区别在于是否能够跨 Session 复用。
2026-01-07 11:05:01
877
原创 Agentic RAG 实战:用 LangGraph 构建可自我修正的 RAG 系统
标准 RAG 把检索当黑盒,查询丢进去、文档出来,至于相不相关全凭运气。Agentic RAG 打开这个黑盒在关键位置加了质量控制。LangGraph 加 Redis 的组合提供了一个可以直接上生产的骨架。流程编排的复杂度 LangGraph 消化掉了,向量检索的性能 Redis 兜住了,剩下的评分和重写逻辑负责兜底那些简单系统搞不定的边角案例。只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
2026-01-07 11:02:43
913
原创 不用懂数学!大语言模型训练流程通俗图解→建议收藏!
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。
2026-01-07 11:00:16
487
原创 收藏!AI Agents开发10条实战经验+大模型全套学习资料,助你快速入门
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。
2026-01-06 11:26:24
512
原创 程序员必看!AI Agent术语指南:掌握这60个概念,轻松玩转大模型开发
文章详细介绍了AI Agent的60个核心术语,涵盖感知、思考、决策和执行全过程,并提供大模型学习路径与资源,包括基础理论、RAG开发、Agent设计等,旨在帮助读者从零入门到实战,掌握AI时代核心技能。
2026-01-06 11:24:18
976
原创 大模型预训练全攻略:从零到精通,收藏必备的技术指南
文章详细介绍了大模型预训练的全流程,包括预训练架构、语言建模任务、数据收集清洗、参数设置及评估方法。同时提供了系统化学习路径,涵盖基础理论、RAG开发、Agent设计、模型微调与部署等实战内容,适合不同背景人群学习AI大模型技术,助力向AI全栈工程师转型。
2026-01-06 11:20:44
704
原创 【收藏必备】LangChain+Embedding实战:从零构建本地知识问答系统,小白程序员必学指南
LangChain作为当前最热门的开源RAG(Retrieval-Augmented Generation,检索增强生成)框架,正在重塑我们处理非结构化数据的方式。在RAG框架中,检索环节至关重要,而Embeddings技术则是实现高效检索的核心组件之一。文本预处理与分块通过Embedding模型转换为向量表示存储到向量数据库查询时进行相似性检索将检索结果输入生成模型。
2026-01-06 11:17:13
992
原创 收藏必备!GenAI应用工程师崛起:从零到精通大模型技术与学习全攻略
文章介绍了GenAI应用工程师这一新兴职业,详细阐述了其所需的核心能力:一是驾驭AI构建模块(提示工程、代理框架等),二是精通AI辅助编程;产品设计能力是重要加分项。文章还提供了大模型学习路径,从基础理论到热门技术,适合不同背景人群入门进阶,帮助技术人才抓住AI时代机遇。
2026-01-06 11:14:45
654
原创 【干货收藏】RAG效果不佳?重排序(Rerank)技术全解析,提升大模型问答精准度
本文深入探讨RAG技术中的重排序(Rerank)环节,解决传统RAG效果不佳的问题。分析召回率与上下文窗口的矛盾,解释两阶段检索策略中重排序的关键作用。重排序模型虽速度较慢,但能更精准评估文档相关性,显著提升结果质量,特别适合处理复杂问答任务。
2026-01-06 11:09:53
755
原创 【干货收藏】避开99%开发者踩过的坑:大模型Agent设计的五个难度级别实战
本文详细介绍了大模型Agent设计的五个难度级别:基础工具使用、知识与记忆集成、长期记忆与推理能力、多Agent团队协作,以及完整的Agent系统。文章强调构建Agent应从简单开始,逐步增加复杂性,注重基础架构而非盲目追求最新功能。每个级别都配有可运行代码示例,帮助开发者避开常见陷阱,构建真正实用的AI Agent系统。
2026-01-06 11:07:24
873
原创 【干货收藏】从零开始:将你的LLM武装成超级助理的四大关键技术
文章介绍了如何将基础LLM从简单的概率预测模型武装成功能强大的AI Agent。详细阐述了四大关键技术:Prompt工程(沟通基础)、RAG(解决知识滞后和幻觉)、Function Calling(赋予行动能力)和MCP(提供标准通信协议)。这些技术协同工作,使LLM克服了知识滞后、幻觉和行动无能等局限,同时利用其强大的推理和规划能力,构建出能够处理复杂任务的智能系统。
2026-01-05 20:16:46
1116
原创 【必学收藏】从入门到精通:Prompt工程的演变、价值与实战技巧
文章阐述了Prompt工程在大模型应用中的演变与价值。从ChatGPT初期的"答非所问"到如今模型的自然语言理解能力提升,Prompt设计从简单对话工具演变为需要精心设计的复杂系统。一个有效的Prompt包含角色定义、任务描述、上下文管理等要素,需考虑用户体验、业务逻辑、风险控制等多维度。当Prompt达到极限时,可考虑模型微调。Prompt工程是一个持续优化的过程,需要不断测试、调整、迭代,才能让AI真正发挥价值。
2026-01-05 20:13:08
714
原创 【必学收藏】MoE架构深度解析:大模型高效训练的核心技术与实战应用
Mixture of Experts (MoE) 是一种将复杂任务分解并由专业专家网络处理的神经网络架构。通过将传统Transformer中的FFN层替换为MoE层,实现稀疏激活和负载平衡,使模型在保持较低计算成本的同时显著扩大规模。MoE技术已成为GPT-4、Mixtral等大模型的核心技术,代表着大模型架构的重要转折点,为构建更大、更强且相对高效的模型提供了经济可行的路径。
2026-01-05 20:10:29
868
原创 程序员必看:RAG技术构建智能问答平台全流程,附学习资源收藏
本文详细介绍了RAG检索增强生成技术构建智能问答平台的完整流程。数据准备阶段包括数据收集清洗、文本解析分割、向量化转换及入库;应用阶段涵盖用户提问、问题解析、向量检索、答案重排、Prompt注入及LLM生成。通过对比测试,推荐使用bge-m3模型进行向量化处理,并采用语义分割提升效果。文章还提供大模型学习资源,帮助开发者掌握AI时代的核心技术。
2026-01-05 20:08:31
754
原创 收藏必备!从零构建AI Agent:知识库、工作流与Prompt工程实战指南
本文详解AI Agent五大核心组件,重点解析知识库构建(收集、整理、存储、检索策略)、工作流设计(任务执行路径)及Prompt工程(角色设定、示例优化)。提供大模型学习路径与实战资源,帮助开发者掌握减少模型"幻觉"的RAG技术、复杂任务自动化逻辑及精准提示词设计,从零入门AI Agent开发。
2026-01-05 20:05:43
1126
原创 为什么大模型如此强大我们还要微调?程序员必收藏的微调详解
本文探讨了在大模型背景下微调的必要性与应用场景,详细解释了微调与提示词的本质区别("改造"vs"引导"),并通过实例介绍了意图识别、关键词抽取等微调任务的实践方法。文章强调了数据质量对微调效果的关键影响,指出当需要将模糊口语转化为稳定、低延迟的结构化输出时,微调是必要的工具。
2026-01-05 20:03:06
849
原创 【必学收藏】大模型架构深度解析:一文读懂自注意力机制原理与代码实现
文章详细解析了大语言模型的架构,重点介绍了自注意力机制的原理和实现过程。通过token解析器将文本转换为嵌入向量,Transformer块中的自注意力组件通过Query、Key、Value三个矩阵计算单词间的关联性,生成上下文向量。文章还提供了Python代码实现,帮助读者直观理解自注意力机制的工作原理,是掌握大模型核心技术的必备知识。
2026-01-05 20:00:00
707
原创 【干货收藏】RAG系统切片技术全攻略:决定检索效果上限的关键步骤
本文详细介绍了RAG系统中决定检索效果上限的关键环节——切片(Chunking)技术。文章阐述了切片的必要性,包括技术约束、检索效果和成本控制,并详细讲解了六种常见切片方法:固定长度、语义、结构化、重叠、递归和混合切片。最后提供了控制切片粒度、合理使用重叠和用指标评估等实战建议,强调RAG效果上限不在模型,而在切片的正确策略选择。
2026-01-04 10:55:58
1001
原创 【必学收藏】大模型RAG技术演进:从基础检索到Graph-R1智能推理的完整指南
文章详解了大模型检索增强生成(RAG)技术的三大演进架构:基础RAG适合简单快速问答;Agentic RAG引入智能体能力,支持多步检索和跨源信息整合;Graph-R1融合知识图谱与强化学习,实现多跳推理和深度逻辑分析。选择何种架构应基于业务需求,未来AI将具备更强的认知与推理能力,成为真正的智能伙伴。
2026-01-04 10:47:37
900
原创 RAG系统掉链子?揭秘检索引擎工程黑盒(建议收藏)
文章解析了RAG系统中检索引擎的工程化实现,包括亿级向量索引架构(HNSW、IVF、DiskANN)、进阶检索技术(HyDE、Contextual Chunk Headers)、重排序算法和量化评估体系。强调检索引擎作为RAG系统的"大脑",其设计精细度直接影响系统性能上限,并提供生产级RAG检索技术清单,帮助开发者构建高效可靠的检索增强生成系统。
2026-01-04 10:44:11
869
原创 程序员必藏:大模型退潮,AI Agent崛起:把握AI未来发展趋势
文章指出AI正经历从"中心化大脑"向"分布式、具身化、规范化"的深层变革,到2026年将呈现四大转变:多智能体协同解决透明度问题;具身智能使AI理解物理世界;边缘推理实现本地化智能思考;全球AI规范化框架建立。这将使AI从"数字玩具"转变为渗入物理世界与行业逻辑的成熟生态,重塑技术格局。
2026-01-04 10:27:30
711
原创 【必学收藏】大模型知识增强技术:RAG与CAG原理与应用全解析
本文详细对比了大模型两种知识增强技术:RAG通过实时检索获取最新信息,适合动态知识场景但存在延迟;CAG预加载信息到缓存,响应快但知识易过时。文章解析了两者原理、优缺点及适用场景,提供了选型框架和行业应用案例,指出混合方案能兼顾信息时效性与响应效率,是未来发展方向。
2026-01-04 10:24:26
837
原创 【技术前瞻】大模型退潮,AI Agent崛起:2026年AI四大变革趋势详解(建议收藏)
文章讨论了AI到2026年的四个战略性转变:从单兵作战到多智能体协同,提高透明度和可靠性;具身智能让AI理解物理世界,通用人形机器人将量产;边缘侧推理使设备本地化思考,解决隐私和延迟问题;《欧盟AI法案》将规范AI研发,提高透明度和责任感。这些变化将使AI从"数字玩具"转变为真正融入物理世界的成熟技术体系。
2026-01-04 10:18:25
828
原创 大模型学习宝典:从历史脉络到核心技术,一篇掌握AI前沿,收藏不迷路
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。
2026-01-02 09:15:00
1603
原创 【必收藏】CAP框架:AI智能体提示词设计的全维度指南,小白/程序员必学!
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。
2026-01-02 09:00:00
612
原创 收藏必备!RAPTOR:大模型RAG系统的智能索引优化技术全解析
在构建递归函数之前,我们需要定义 RAPTOR 中的“A”:抽象组件。这是一个机制,将相关的文本分块集群用 LLM 合成为单一的高质量摘要。这一步至关重要,因为它不仅仅提取信息;它创建新的更高层次知识。集群的摘要成为我们树的父节点,代表其所有子文档的精华。这是我们从具体细节上升到更广泛概念的方式。我们将为此创建一个简单的 LangChain Expression Language(LCEL)链。提示被设计为指示 LLM 扮演专家技术作者的角色,确保我们的摘要连贯、详细,并捕捉主要思想。# 定义总结链。
2026-01-02 08:45:00
1583
原创 【必学收藏】从零开始学企业AI:三阶六步大模型开发实践指南
文章提出企业AI和大模型落地的"三阶六步"方法论:第一阶段进行认知导入,建立AI基础认知;第二阶段打造标杆智能体应用,创造颠覆性价值;第三阶段进行蓝图规划、平台建设和场景运营,实现规模化应用。该方法论强调循序渐进,以业务价值为导向,避免"为AI而AI"的技术陷阱,帮助企业务实落地AI应用。
2026-01-02 08:30:00
894
原创 【必看收藏】提示词工程从小白到精通:解锁AI智能协作的完整指南
提示词工程是大型语言模型应用的关键技术,通过精心设计的指令序列引导AI输出高质量内容。文章系统解析了提示词的四大构成要素(背景信息、指令、输入数据、输出指示器)和七项设计原则,并介绍了思维链、ReAct等高级技巧。通过淘宝Agent和科研论文分析两大案例,展示了提示词工程如何将AI从工具升级为智能协作者,实现人机高效协作。
2026-01-02 08:15:00
1242
原创 【强烈收藏】解锁大模型长期记忆:TIM、CoPS、MaLP、MemoryBank和HippoRAG五大框架详解
本文系统介绍五种大语言模型长期记忆框架:TIM通过记忆内思考避免重复推理;CoPS结合认知记忆机制实现个性化搜索;MaLP采用双过程增强记忆优化医疗助手;MemoryBank引入艾宾浩斯遗忘曲线实现动态更新;HippoRAG受海马体理论启发,利用知识图谱和PageRank算法实现高效信息整合。这些框架旨在解决大模型长期记忆问题,提升交互能力与个性化服务水平。---
2026-01-02 07:45:00
1623
原创 【珍藏】解决AI“健忘“问题:8种大模型记忆技术详解,让你的智能体记住一切!
本文详细剖析了8种AI智能体记忆策略:全量记忆、滑动窗口、相关性过滤、摘要压缩、向量数据库、知识图谱、分层记忆和类OS内存管理。每种策略从原理、特点、适用场景和实现方法进行了分析,帮助开发者根据不同应用场景选择最合适的记忆方案。文章不仅提供了理论指导,还包含模拟代码实现,为解决大模型上下文限制和长期记忆问题提供了实用参考。
2026-01-01 09:00:00
1691
原创 【值得收藏】AI智能体架构设计12原则:让大模型从“玩具“变“生产力“
文章详解了构建生产级AI智能体的12条核心架构原则,围绕"感知-决策-执行"闭环,涵盖自然语言转结构化调用、提示词工程、上下文状态管理、工具设计、生命周期控制等关键领域。这些原则旨在帮助开发者设计出可用、可扩展、可维护的AI系统,将大模型从实验性工具转变为企业级生产力引擎,实现人机高效协作。
2026-01-01 08:45:00
1721
原创 LangChain从入门到精通,构建强大LLM应用的必学指南(建议收藏)
这是 LangChain 架构的基础,定义了所有组件的通用接口和交互标准,确保不同模块可无缝协作。BaseLanguageModel:统一各类 LLM(如 GPT、Claude、开源模型)的调用接口,屏蔽不同模型的底层差异。PromptTemplate:标准化提示词格式,支持动态填充变量(如用户输入、外部数据),确保输入一致性。BaseRetriever:定义检索接口,统一向量数据库(如 Pinecone、Milvus)、文档检索工具的调用逻辑。
2026-01-01 08:00:00
551
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅