自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1801)
  • 收藏
  • 关注

原创 收藏必读:AI系统架构演进与安全威胁全解析:从GenAI到Agentic AI

文章详细分析了AI系统从GenAI到AI Agents再到Agentic AI的架构演进过程,探讨了三种架构的定义、特点和区别,并针对不同架构分析了其面临的主要安全威胁,包括GenAI的12种威胁、AI Agents的OWASP Top 10威胁和Agentic AI的15种威胁,为理解AI系统安全提供了系统性方法论。

2026-01-09 10:50:44 223

原创 收藏必看:Dify大模型平台部署全攻略:从零搭建AI应用开发环境

本文详细介绍了Dify开源大模型平台的本地化部署方法,以Mac M1为例,通过Docker实现快速搭建。内容包括Docker安装、Dify部署流程、服务状态查看及web端配置等步骤,并提供了镜像拉取超时、80端口占用等常见问题的解决方案。同时分享了AI大模型学习资源,涵盖教学内容、学习路线图、行业报告和面试资料等,帮助开发者快速入门大模型技术。

2026-01-09 10:48:00 362

原创 AI开发者的珍藏指南:MCP架构模式全解析,助你构建智能AI Agent

本文详细介绍了构建AI Agent的10种MCP架构模式,包括多级安全、本地资源访问、分层提示、API封装、组合服务等模式。这些模式帮助企业根据业务需求选择合适架构,提升系统扩展性、稳定性和维护效率,是AI应用开发的重要参考框架。

2026-01-09 10:40:07 247

原创 【干货收藏】AI智能体推理架构深度剖析:程序员必备的大模型应用开发指南

本文系统解析了AI智能体的三大推理架构:单智能体、基于工具和多智能体方法,探讨了不同场景下的架构匹配规律。文章指出智能体推理框架对行业智能化改造的重要性,为AI大模型应用提供了技术指导,对程序员掌握AI智能体开发具有重要参考价值。

2026-01-09 10:29:54 133

原创 【必藏】谷歌云重磅发布:AI Agents技术全栈指南 - 从原型到生产的完整路线图

谷歌云发布《AI Agents技术指南》,提出构建生产级AI Agent需超越模型选型,成为跨领域工程学科。指南以ADK为核心,Vertex AI为底座,AgentOps为运维理念,系统解析了Agent的五大核心组件(模型、工具、编排、数据架构、运行时)及三大路径(构建、使用、集成)。文章详细介绍了从RAG到Agentic RAG的接地技术演进,以及四层AgentOps评估框架,为开发者提供从原型到规模化生产的全栈技术路线图。

2026-01-09 10:25:54 462

原创 【收藏必学】MCP架构OAuth安全认证实战:Python+SDK实现企业级LLM应用安全访问

本文详细介绍了在MCP架构中集成OAuth 2.0安全认证的方法,通过Python+SDK+Google OAuth的完整示例项目,展示了从基础概念到实战实现的全过程,并探讨了与不同安全方案的配合,为构建安全的企业级LLM应用提供了实用指南。

2026-01-09 10:16:42 557

原创 【必收藏】超越提示工程:上下文工程(Context Engineering)重塑大模型应用范式

从数学角度看,上下文工程的核心是从将上下文视为单一字符串(C = prompt)转变为一个动态组装的、结构化的信息集合。这个转变是理解其科学性的第一步。这里的A代表一个编排函数(Orchestration Function),它就像一位指挥家,将各种不同来源的信息(c)智能地组合成一段连贯、高效的最终上下文,然后才送入大语言模型。只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。

2026-01-08 11:12:09 738

原创 【强烈收藏】AI Agent实战指南:从工具到智能伙伴,大模型技术全解析

人工智能体(AI Agent)是AI发展的新阶段,具备自主性、环境感知和持续学习能力三大特征。它能从工具进化为智能伙伴,理解目标、制定计划并执行任务。AI Agent在电商、办公、生活等场景有广泛应用,将降低重复劳动、提升决策效率,成为企业数字化转型的"超级引擎"。未来,AI将与人类并肩工作,带来机遇与挑战。学习大模型技术,掌握AI Agent开发能力,是抓住AI风口的关键。

2026-01-08 11:09:13 264

原创 必学!从“实习生“到“专家“:算法工程师的大模型Prompt工程心法(收藏)

文章分享交易风控算法工程师如何通过循序渐进的Prompt工程,将通用大语言模型逐步调教成精准识别电商风控风险的AI专家。从"角色扮演+结构化输入输出"框架,到注入业务常识、提升分析深度,最终实现"双假设裁决框架",使AI能区分"真团伙"与"假聚集"。作者提炼Prompt工程心法:始于模仿终于框架、规则是骨架背景是血肉、反例是最佳老师、从"指令"到"思维模型",展示如何将领域专业知识转化为AI可理解的语言,实现人机协作最佳实践。

2026-01-08 11:06:14 466

原创 收藏必备!多智能体系统实战指南:让AI Agent协作解决复杂任务的终极方案

文章介绍了多智能体系统(MAS)作为解决复杂AI任务的关键范式,分析了其在分布式任务、异构处理、系统鲁棒性和多方博弈等场景的应用优势。通过新闻生成器案例展示了研究分析师和内容撰稿人的协作流程,并详细解析了Agents as Tools、Swarm、Graph和Workflow等主流设计框架。多智能体系统通过角色分工和协同合作,有效突破了单智能体处理复杂多维任务的局限性,是构建下一代AI应用的重要技术。

2026-01-08 11:03:23 477

原创 收藏必备!DeepSeek与Qwen大模型实战对比:Web、Python、小程序、Cocos全方位评测

文章对DeepSeek和Qwen两大大模型进行了全面对比评测,从价格和编程效果两方面进行了测试。编程测试包括Web页面、Python、微信小程序和Cocos小游戏四个场景。结果显示DeepSeek价格更优惠,而Qwen在编程效果上更胜一筹。作者根据自己的需求决定继续使用Qwen的Token服务,并分享了AI大模型学习资料。

2026-01-08 11:00:21 422

原创 RAG实战:手把手教你用LlamaIndex存取Embedding向量!

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-01-08 10:51:22 392

原创 Agent Engineering 的 10 大核心工程维度:构建生产级智能体系统的完整指南

【定义与使命】所以,智能体工程就是:将不确定的基于LLM的系统, 迭代优化为可靠生产级应用的工程化过程。它强调一个循环往复的迭代周期: 构建 → 测试 → 部署 → 观测 → 优化,再重复。在智能体工程中,“上线”不再是终点,而是获取真实反馈、持续改进的起点。其原因在于:传统软件工程依赖确定性逻辑,你可以通过严格的单元测试和代码审查,在上线前杜绝大部分bug;而Agent 系统内部包含概率模型(LLM),无法靠预先测试保证万无一失。

2026-01-07 11:11:45 983

原创 【干货收藏】告别金鱼记忆:MemMachine通用记忆层解决方案详解

文章介绍了MemMachine通用记忆层解决方案,它解决了AI Agent"金鱼记忆"问题。采用图+SQL+向量的混合架构,比传统RAG更准确处理用户记忆。提供开箱即用的Profile Memory,支持私有化部署和MCP协议,能降低开发门槛,构建产品壁垒,适合医疗、金融等需要精准记忆的场景,但对简单任务可能过于复杂。

2026-01-07 11:07:16 522

原创 AI Agent 如何记住一切?短期对话 + 长期知识的记忆架构全解析→建议收藏!

会话级记忆(短期记忆):特指用户与 AI Agent 在单次会话中的多轮交互数据,包括用户查询、Agent 响应、工具调用及执行结果等,直接服务于当前会话的实时交互。跨会话记忆(长期记忆):从多次会话中抽取提炼的通用信息,涵盖用户偏好、核心事实、领域经验等,能够跨会话辅助 Agent 进行个性化推理。需要注意的是,短期记忆与长期记忆并非单纯以时间维度划分,核心区别在于是否能够跨 Session 复用。

2026-01-07 11:05:01 877

原创 Agentic RAG 实战:用 LangGraph 构建可自我修正的 RAG 系统

标准 RAG 把检索当黑盒,查询丢进去、文档出来,至于相不相关全凭运气。Agentic RAG 打开这个黑盒在关键位置加了质量控制。LangGraph 加 Redis 的组合提供了一个可以直接上生产的骨架。流程编排的复杂度 LangGraph 消化掉了,向量检索的性能 Redis 兜住了,剩下的评分和重写逻辑负责兜底那些简单系统搞不定的边角案例。只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

2026-01-07 11:02:43 913

原创 不用懂数学!大语言模型训练流程通俗图解→建议收藏!

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-01-07 11:00:16 488

原创 收藏!AI Agents开发10条实战经验+大模型全套学习资料,助你快速入门

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-01-06 11:26:24 512

原创 程序员必看!AI Agent术语指南:掌握这60个概念,轻松玩转大模型开发

文章详细介绍了AI Agent的60个核心术语,涵盖感知、思考、决策和执行全过程,并提供大模型学习路径与资源,包括基础理论、RAG开发、Agent设计等,旨在帮助读者从零入门到实战,掌握AI时代核心技能。

2026-01-06 11:24:18 976

原创 大模型预训练全攻略:从零到精通,收藏必备的技术指南

文章详细介绍了大模型预训练的全流程,包括预训练架构、语言建模任务、数据收集清洗、参数设置及评估方法。同时提供了系统化学习路径,涵盖基础理论、RAG开发、Agent设计、模型微调与部署等实战内容,适合不同背景人群学习AI大模型技术,助力向AI全栈工程师转型。

2026-01-06 11:20:44 705

原创 【收藏必备】LangChain+Embedding实战:从零构建本地知识问答系统,小白程序员必学指南

LangChain作为当前最热门的开源RAG(Retrieval-Augmented Generation,检索增强生成)框架,正在重塑我们处理非结构化数据的方式。在RAG框架中,检索环节至关重要,而Embeddings技术则是实现高效检索的核心组件之一。文本预处理与分块通过Embedding模型转换为向量表示存储到向量数据库查询时进行相似性检索将检索结果输入生成模型。

2026-01-06 11:17:13 992

原创 收藏必备!GenAI应用工程师崛起:从零到精通大模型技术与学习全攻略

文章介绍了GenAI应用工程师这一新兴职业,详细阐述了其所需的核心能力:一是驾驭AI构建模块(提示工程、代理框架等),二是精通AI辅助编程;产品设计能力是重要加分项。文章还提供了大模型学习路径,从基础理论到热门技术,适合不同背景人群入门进阶,帮助技术人才抓住AI时代机遇。

2026-01-06 11:14:45 654

原创 【干货收藏】RAG效果不佳?重排序(Rerank)技术全解析,提升大模型问答精准度

本文深入探讨RAG技术中的重排序(Rerank)环节,解决传统RAG效果不佳的问题。分析召回率与上下文窗口的矛盾,解释两阶段检索策略中重排序的关键作用。重排序模型虽速度较慢,但能更精准评估文档相关性,显著提升结果质量,特别适合处理复杂问答任务。

2026-01-06 11:09:53 756

原创 【干货收藏】避开99%开发者踩过的坑:大模型Agent设计的五个难度级别实战

本文详细介绍了大模型Agent设计的五个难度级别:基础工具使用、知识与记忆集成、长期记忆与推理能力、多Agent团队协作,以及完整的Agent系统。文章强调构建Agent应从简单开始,逐步增加复杂性,注重基础架构而非盲目追求最新功能。每个级别都配有可运行代码示例,帮助开发者避开常见陷阱,构建真正实用的AI Agent系统。

2026-01-06 11:07:24 873

原创 【干货收藏】从零开始:将你的LLM武装成超级助理的四大关键技术

文章介绍了如何将基础LLM从简单的概率预测模型武装成功能强大的AI Agent。详细阐述了四大关键技术:Prompt工程(沟通基础)、RAG(解决知识滞后和幻觉)、Function Calling(赋予行动能力)和MCP(提供标准通信协议)。这些技术协同工作,使LLM克服了知识滞后、幻觉和行动无能等局限,同时利用其强大的推理和规划能力,构建出能够处理复杂任务的智能系统。

2026-01-05 20:16:46 1116

原创 【必学收藏】从入门到精通:Prompt工程的演变、价值与实战技巧

文章阐述了Prompt工程在大模型应用中的演变与价值。从ChatGPT初期的"答非所问"到如今模型的自然语言理解能力提升,Prompt设计从简单对话工具演变为需要精心设计的复杂系统。一个有效的Prompt包含角色定义、任务描述、上下文管理等要素,需考虑用户体验、业务逻辑、风险控制等多维度。当Prompt达到极限时,可考虑模型微调。Prompt工程是一个持续优化的过程,需要不断测试、调整、迭代,才能让AI真正发挥价值。

2026-01-05 20:13:08 714

原创 【必学收藏】MoE架构深度解析:大模型高效训练的核心技术与实战应用

Mixture of Experts (MoE) 是一种将复杂任务分解并由专业专家网络处理的神经网络架构。通过将传统Transformer中的FFN层替换为MoE层,实现稀疏激活和负载平衡,使模型在保持较低计算成本的同时显著扩大规模。MoE技术已成为GPT-4、Mixtral等大模型的核心技术,代表着大模型架构的重要转折点,为构建更大、更强且相对高效的模型提供了经济可行的路径。

2026-01-05 20:10:29 868

原创 程序员必看:RAG技术构建智能问答平台全流程,附学习资源收藏

本文详细介绍了RAG检索增强生成技术构建智能问答平台的完整流程。数据准备阶段包括数据收集清洗、文本解析分割、向量化转换及入库;应用阶段涵盖用户提问、问题解析、向量检索、答案重排、Prompt注入及LLM生成。通过对比测试,推荐使用bge-m3模型进行向量化处理,并采用语义分割提升效果。文章还提供大模型学习资源,帮助开发者掌握AI时代的核心技术。

2026-01-05 20:08:31 754

原创 收藏必备!从零构建AI Agent:知识库、工作流与Prompt工程实战指南

本文详解AI Agent五大核心组件,重点解析知识库构建(收集、整理、存储、检索策略)、工作流设计(任务执行路径)及Prompt工程(角色设定、示例优化)。提供大模型学习路径与实战资源,帮助开发者掌握减少模型"幻觉"的RAG技术、复杂任务自动化逻辑及精准提示词设计,从零入门AI Agent开发。

2026-01-05 20:05:43 1127

原创 为什么大模型如此强大我们还要微调?程序员必收藏的微调详解

本文探讨了在大模型背景下微调的必要性与应用场景,详细解释了微调与提示词的本质区别("改造"vs"引导"),并通过实例介绍了意图识别、关键词抽取等微调任务的实践方法。文章强调了数据质量对微调效果的关键影响,指出当需要将模糊口语转化为稳定、低延迟的结构化输出时,微调是必要的工具。

2026-01-05 20:03:06 849

原创 【必学收藏】大模型架构深度解析:一文读懂自注意力机制原理与代码实现

文章详细解析了大语言模型的架构,重点介绍了自注意力机制的原理和实现过程。通过token解析器将文本转换为嵌入向量,Transformer块中的自注意力组件通过Query、Key、Value三个矩阵计算单词间的关联性,生成上下文向量。文章还提供了Python代码实现,帮助读者直观理解自注意力机制的工作原理,是掌握大模型核心技术的必备知识。

2026-01-05 20:00:00 707

原创 【干货收藏】RAG系统切片技术全攻略:决定检索效果上限的关键步骤

本文详细介绍了RAG系统中决定检索效果上限的关键环节——切片(Chunking)技术。文章阐述了切片的必要性,包括技术约束、检索效果和成本控制,并详细讲解了六种常见切片方法:固定长度、语义、结构化、重叠、递归和混合切片。最后提供了控制切片粒度、合理使用重叠和用指标评估等实战建议,强调RAG效果上限不在模型,而在切片的正确策略选择。

2026-01-04 10:55:58 1002

原创 【必学收藏】大模型RAG技术演进:从基础检索到Graph-R1智能推理的完整指南

文章详解了大模型检索增强生成(RAG)技术的三大演进架构:基础RAG适合简单快速问答;Agentic RAG引入智能体能力,支持多步检索和跨源信息整合;Graph-R1融合知识图谱与强化学习,实现多跳推理和深度逻辑分析。选择何种架构应基于业务需求,未来AI将具备更强的认知与推理能力,成为真正的智能伙伴。

2026-01-04 10:47:37 900

原创 RAG系统掉链子?揭秘检索引擎工程黑盒(建议收藏)

文章解析了RAG系统中检索引擎的工程化实现,包括亿级向量索引架构(HNSW、IVF、DiskANN)、进阶检索技术(HyDE、Contextual Chunk Headers)、重排序算法和量化评估体系。强调检索引擎作为RAG系统的"大脑",其设计精细度直接影响系统性能上限,并提供生产级RAG检索技术清单,帮助开发者构建高效可靠的检索增强生成系统。

2026-01-04 10:44:11 869

原创 程序员必藏:大模型退潮,AI Agent崛起:把握AI未来发展趋势

文章指出AI正经历从"中心化大脑"向"分布式、具身化、规范化"的深层变革,到2026年将呈现四大转变:多智能体协同解决透明度问题;具身智能使AI理解物理世界;边缘推理实现本地化智能思考;全球AI规范化框架建立。这将使AI从"数字玩具"转变为渗入物理世界与行业逻辑的成熟生态,重塑技术格局。

2026-01-04 10:27:30 711

原创 【必学收藏】大模型知识增强技术:RAG与CAG原理与应用全解析

本文详细对比了大模型两种知识增强技术:RAG通过实时检索获取最新信息,适合动态知识场景但存在延迟;CAG预加载信息到缓存,响应快但知识易过时。文章解析了两者原理、优缺点及适用场景,提供了选型框架和行业应用案例,指出混合方案能兼顾信息时效性与响应效率,是未来发展方向。

2026-01-04 10:24:26 837

原创 【技术前瞻】大模型退潮,AI Agent崛起:2026年AI四大变革趋势详解(建议收藏)

文章讨论了AI到2026年的四个战略性转变:从单兵作战到多智能体协同,提高透明度和可靠性;具身智能让AI理解物理世界,通用人形机器人将量产;边缘侧推理使设备本地化思考,解决隐私和延迟问题;《欧盟AI法案》将规范AI研发,提高透明度和责任感。这些变化将使AI从"数字玩具"转变为真正融入物理世界的成熟技术体系。

2026-01-04 10:18:25 828

原创 大模型学习宝典:从历史脉络到核心技术,一篇掌握AI前沿,收藏不迷路

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-01-02 09:15:00 1603

原创 【必收藏】CAP框架:AI智能体提示词设计的全维度指南,小白/程序员必学!

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-01-02 09:00:00 612

原创 收藏必备!RAPTOR:大模型RAG系统的智能索引优化技术全解析

在构建递归函数之前,我们需要定义 RAPTOR 中的“A”:抽象组件。这是一个机制,将相关的文本分块集群用 LLM 合成为单一的高质量摘要。这一步至关重要,因为它不仅仅提取信息;它创建新的更高层次知识。集群的摘要成为我们树的父节点,代表其所有子文档的精华。这是我们从具体细节上升到更广泛概念的方式。我们将为此创建一个简单的 LangChain Expression Language(LCEL)链。提示被设计为指示 LLM 扮演专家技术作者的角色,确保我们的摘要连贯、详细,并捕捉主要思想。# 定义总结链。

2026-01-02 08:45:00 1583

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除