打造全国最全的AI Agent开发知识领域的博客

实战级AI Agent以及相关架构博客，生产级设计与代码示例，以喂饭式教程带领读者从浅入深学习最前沿的技术。

原创 AI工程化：从“炼丹”到“建药厂”的60分钟通关指南

AI模型再聪明，不工程化就是玩具。本文系统拆解AI工程化的核心目标、关键技术与典型陷阱，带你理解如何将一个Notebook里的模型，变成高可靠、低延迟、低成本的线上服务。

2026-01-08 17:27:13 61

原创讲透知识图谱Neo4j在构建Agent时到底怎么用（二）

RAG 回答不准？因为缺少结构化逻辑。本文详解如何用 Neo4j 知识图谱为 Agent 提供确定性规则支撑，实现精准推理与冲突消解，让 AI 回答既聪明又可靠。

2026-01-08 16:37:56 668

原创讲透知识图谱Neo4j在构建Agent时到底怎么用（一）

本文深入剖析 Neo4j 如何作为 Agent 的“认知骨架”，并通过一个实际工程中的例子来说明知识图谱如何实现结构化推理，解决大模型在复杂规则与多跳关系下的幻觉与模糊问题。

2026-01-07 23:33:11 1234

原创 Agent 可靠性为何总是崩于细节？LangChain 创始人亲授系统性解法

Agent 从 Demo 走向生产，失败往往源于对“可靠性”的误解。本文基于 LangChain 创始人对 LangSmith 新功能的深度解读，系统拆解如何通过 Insights 与 Thread Evals 构建数据驱动的质量保障闭环，真正解决 Agent 在真实场景中的稳定性问题。

2026-01-07 15:40:02 430

原创来看19.8k Star的谷歌开源复杂文档结构化信息抽取工具据説无需微调LLM即可精准提取

谷歌开源LangExtract，仅用自然语言指令与少量示例，即可从复杂长文档中精准提取可溯源的结构化信息。它通过原文定位、多轮分块、交互验证三大机制，有效抑制大模型幻觉，让信息抽取真正“有据可依”。

2026-01-07 15:31:13 632

原创一起来围观46C6法提示词书写技巧是什么意思？

大多数提示词失效，并非因为模型能力不足，而是提问者忽略了结构化表达。46C6 提供了一套最小完备的提示工程框架——从任务四要素、六大优化策略、思维链显性推理，到 KERNEL 工程化原则，系统性解决“说不清、跑偏、不可复现”三大顽疾。

2026-01-06 21:51:28 1253

原创慢思考，深搜索：MiroThinker 1.5 如何重塑 AI 研究智能体范式

MiroThinker 1.5 不追求“秒回”，而是以严谨的慢思考机制，在复杂问题上击败参数量更大的模型。本文解析其多轮主动搜索、交叉验证与长时推理能力，探讨它如何代表 AI 从聊天机器人向研究智能体的根本转型。

2026-01-06 20:01:41 882

原创 2026，多智能体不是噱头：企业AI从“工具人”走向“虚拟团队”

2026年将是多智能体在企业落地的关键元年。零一万物提出六大预判，指出AI将从“一人一工具”升级为“一人一团队”，通过角色分工、流程协同与业务闭环，真正嵌入组织主干。本文系统拆解多智能体为何不是过渡概念，而是当前最可行的企业AI路径。

2026-01-05 15:58:54 784

原创 mHC架构：用数学约束驯服超宽残差，大模型训练的新范式

DeepSeek最新论文提出mHC架构，通过将超连接投影到双随机矩阵流形上，一举解决梯度爆炸与显存墙问题。仅6.7%额外开销，即可实现训练稳定、性能提升与良好扩展性，为大模型宏观架构设计开辟新路径。

2026-01-04 23:45:11 1117

原创 AnyGen真能取代NotebookLM？别急，先看它到底解决了什么问题

AnyGen并非简单复刻NotebookLM，而是以“可交付成果”为核心，打通从碎片信息到可编辑办公产物的全链路。本文从五大典型场景出发，系统对比其与NotebookLM、豆包在内容生成、结构化处理及最终可用性上的差异，揭示AnyGen作为AI工作空间的独特定位。

2026-01-04 23:37:16 910

原创 AI项目能不能稳定解决问题的8大关键工程能力

当你的AI Demo惊艳全场却上线崩盘，问题从来不在模型本身。真正决定AI能否稳定落地的，是围绕模型构建的一整套工程体系——从提示词设计到上下文管理，从RAG架构到智能体调度，再到部署、优化与可观测性。本文系统拆解支撑生产级AI应用的8大核心技能，告诉你如何把“会调Prompt”的手艺，转化为可复现、可评测、可迭代的稳定系统。

2025-12-15 15:46:42 823

原创什么是RAG?什么是CAG？一文来搞清

RAG 解决了大模型“说错话”的问题，CAG 则让 AI 学会记住、理解并保持一致。本文系统剖析两者的技术差异、演进逻辑与未来方向，揭示 AI 如何从工具走向真正可信赖的智能伙伴。

2025-12-15 15:36:04 566

原创 RAG中的语义理解与语义检索：别再混为一谈

语义理解和语义检索在RAG中各司其职——前者是模型“读懂”问题的能力，后者是系统“找到”答案的手段。本文系统拆解二者原理、分工与协同逻辑，澄清常见误区。

2025-12-12 18:22:12 747

原创大模型知道自己在瞎说，却停不下来背后的原理是什么？

大模型在长推理任务中常生成大量语义重复、逻辑空转的“词语沙拉”，虽能感知自身胡说却无法自主停止。最新研究通过监控隐藏状态识别冗余输出，并提出轻量干预策略，在不牺牲正确率的前提下显著提升效率。

2025-12-12 18:07:23 648

原创智能体长期记忆的真正解法：不只是知识库，而是可演化的“第二大脑”

智能体长期记忆不能只靠RAG和向量库。MemMachine 提供了一套可自部署、支持记忆演化、兼容国产大模型的完整方案，通过 MCP 协议无缝接入 Claude 等主流 Agent，让 AI 真正“记得你、理解你、为你改变”。

2025-12-11 14:03:57 975

原创多轮 Function Call 为什么是微调中最难的一环？

Function Call 的真正难点不在工具调用，而在多轮对话的状态管理。本文系统拆解多轮对话的三类结构、追问逻辑、数据构建方法和防“乱跳”机制，揭示其本质是一个状态机调度问题，并给出工程实践与面试应答策略。

2025-12-10 12:14:53 941

原创 Agent热潮下的冷思考：一盆凉水浇在Agent身上

当前AI Agent热潮席卷全球，但基础设施薄弱、推理成本高昂、软件生态不兼容等问题正成为其规模化落地的瓶颈。本文系统剖析Agent发展的真实困境与底层逻辑，并探讨未来突破方向。

2025-12-10 12:04:11 1355

原创 GLM-4.6V：多模态大模型首次打通“看图—理解—执行”闭环

GLM-4.6V开源，首次在视觉大模型中原生集成工具调用能力，实现从图像感知到可执行动作的端到端闭环，支持图文创作、识图购物、前端复刻与长文档视频理解四大典型场景，9B轻量版免费开放。

2025-12-09 13:07:42 1049

原创 Query重写：RAG系统被忽视的“第一公里”优化

传统RAG框架常忽略原始查询与真实检索需求之间的鸿沟。微软亚研院提出的Rewrite-Retrieve-Read框架，通过在检索前引入Query重写机制，从源头提升检索质量，在多跳问答、消歧任务及弱模型增强等场景中显著提效，为黑箱大模型下的RAG优化提供了低成本、高回报的新路径。

2025-12-08 16:53:11 879

原创国产之光-Qwen3 Embedding为何能终结MTEB竞赛？

Qwen3 Embedding不只是又一个榜单刷分者——它用“架构适配+数据合成+模型融合”三重机制，首次系统性地将大语言模型的生成能力反哺到嵌入学习中。0.6B参数模型硬刚7B级别对手、8B模型登顶多语言MTEB榜首，背后是一套可复现、可扩展的新范式。本文解析其技术内核，并探讨这一路径对整个文本表征领域的深远影响。

2025-12-06 03:16:39 647

原创 Ingress-Nginx即将退役，我们该怎么办？这里有你想知道的一切

Ingress-NGINX将于2026年3月正式退役，现有部署可继续运行但将不再获得安全更新。本文系统分析退役原因、风险评估，详细比较迁移至Gateway API或其他Ingress控制器的方案，帮助企业做出稳妥的技术决策。

2025-12-05 15:21:13 1214

原创 Agent不是“更聪明的大模型”，而是“会思考的流程”——一线工程师拆解构建有效Agent的三大核心能力

大模型本身不会自动变成能办事的员工。真正让Agent在真实世界中可靠、高效、可扩展的关键，在于围绕模型设计一套结构化的认知流程。本文系统拆解了构建有效Agent必须具备的三种底层能力：结构化思考流程、高效记忆压缩机制、与现实交互的工具触手，并结合控制论与信息论解释其科学原理，同时探讨当前工程实践中提升性能的四大突破方向。

2025-12-03 11:17:29 797

原创 LLM推理引擎选型实战指南：用Transformers、llama.cpp 还是 vLLM 之争

本文深入解析Transformer、llama.cpp和vLLM三大主流LLM推理引擎的技术特点与适用场景，通过操作系统概念的类比帮助开发者根据硬件条件、使用场景和性能需求做出明智选择。无论您是个人开发者还是企业用户，都能找到最适合的推理解决方案。

2025-12-02 14:01:23 888

原创 Claude 4.5给AI注入灵魂，到底是个什么东东？一起来围观

一份神秘的"灵魂文档"引发AI界震动，Anthropic可能正在为AI注入哲学思辨能力。本文深入解析这份文档的技术内涵，探讨AI自我意识构建的伦理边界，思考人类与智能体关系的未来走向。

2025-12-01 22:12:59 1140

原创 Docker Model Runner 杀到！Ollama 的护城河还剩多少？

Docker Model Runner整合vLLM直插生产环境，Ollama的“易用性护城河”正被企业级需求瓦解。本文拆解DMR双轨架构如何用OCI标准重构LLM部署，对比精度控制、供应链管理等核心差异。技术选型关键转折点已到，大家一起来围观！

2025-12-01 19:00:00 846

原创来围观AI的未来形态是什么？：一个能规划、执行、纠错的自主AI

本文深入探讨了智能体的核心技术架构和应用场景，揭示其从简单的文本生成到复杂任务执行的演进路径。文章详细拆解了智能体的五大核心组件——大脑（大模型）、记忆系统、工具调用、框架调度和云原生部署，并分析其在自动化流程、垂直领域专家、动态环境交互等领域的实际应用。同时，文章直面智能体落地中的可靠性、长程任务、复杂环境适应等挑战，并展望了从专用到通用、多模态融合、标准化等未来趋势。

2025-12-01 18:49:19 682

原创智能客服做成烧钱无底洞？需要注意些什么避坑技巧呢？

别再把智能客服当成“AI玩具”！本文从客服与销售的本质差异出发，揭示企业盲目上马AI客服的常见误区，并系统拆解强需求与弱需求场景下的不同落地路径，帮助技术人和决策者看清：真正的智能客服，是业务逻辑的数字化延伸，不是大模型的简单堆砌。

2025-11-30 14:45:44 1052

原创先分块再向量化已经过时？先embedding再chunking？一起来看看这是怎么回事

传统RAG流程中“先分块再向量化”已显疲态。本文系统解析“先embedding再chunking”新范式，详解Max–Min语义分块原理、优势与局限，并结合工程实践给出可落地的优化建议，助你显著提升RAG检索准确率。

2025-11-30 14:30:05 735

原创单卡也能并行炼丹？来看TRL + RapidFire AI 如何让大模型调参效率飙升20倍

你还在用一张 GPU 串行跑微调实验？Hugging Face TRL 集成 RapidFire AI 后，单卡即可并发运行多个大模型微调任务，通过自适应分块调度与共享内存机制，在不增加硬件成本的前提下将调参效率提升16–24倍。本文详解其原理、工程实现与实战价值。

2025-11-25 13:45:38 1050

原创来看实现零人类数据下的大模型自我演进，这讲得到底是什么呢？

斯坦福等团队提出 Agent0 框架，在完全零人类标注数据的前提下，通过双智能体协同对抗与工具集成，让大模型实现自我演进。本文系统拆解其机制、实验效果与工程细节，并结合笔者在企业大模型落地中的经验，探讨这一范式对实际应用的深远意义。

2025-11-24 19:02:43 1281

原创 RAG知识库评估框架应该有点什么呢？

本文系统介绍了一套可量化、可复现、可对比的RAG知识库评估框架，围绕Recall Score、Correctness与Groundedness三大核心指标，结合真实企业研发场景，详细阐述如何从“凭感觉”走向科学评估。笔者通过构建轻量级评测Pipeline，验证了该框架的有效性，并分享了后续优化路径与实践经验。

2025-11-24 18:52:08 735

原创 AI Agent开发第82课-手把手教你把paddleocr-vl做成mcp使其在DIFY里运行

本文详解如何将国产顶尖多模态 OCR 模型 PaddleOCR-VL 封装为标准 MCP（Model Calling Protocol）服务，并通过自研的 HTTP-based MCP Client 接入 Dify 1.10，实现 AI Agent 在对话中自动识别并调用 OCR 能力。该方案已在某头部保险公司真实业务流程中落地，使用了当前最先进的“Agentic AI 原生”设计思想。

2025-11-23 22:10:47 1363

原创 BERT 和 GPT，谁才是你该用的大模型？——从原理到落地场景的深度拆解

BERT 与 GPT 是当前 NLP 领域两大基石模型，一个擅长理解，一个长于生成。本文将从底层架构、训练机制、适用场景到企业落地实践，系统剖析二者差异，并结合笔者多年工程经验，告诉你何时该选 BERT，何时该用 GPT，以及如何在真实业务中做出最优技术选型。

2025-11-21 14:31:58 1111

原创 GPU 空转 96%？看TiDAR团队如何榨出近 6 倍推理速度而不牺牲质量

你的 LLM 推理慢，不是因为 GPU 不行，而是因为 96% 的算力在发呆。英伟达华人团队提出 TiDAR 架构，利用“空闲 Token 槽”在一次前向中并行生成多个 token，吞吐提升近 6 倍且质量无损。本文深入剖析其原理、优势、限制及对推理系统架构的颠覆性影响，为大模型落地提供新思路。

2025-11-21 14:25:51 710

原创 AI 编程没有取代程序员，它在放大你的技术领导力

过去一年我深度使用 AI Coding 工具完成各类项目，逐渐意识到：AI 并非替代程序员，而是将工程师的技术领导力——架构设计、任务拆解、问题诊断与团队引导能力——前所未有地放大。这篇文章系统拆解这一认知的形成过程、实践方法与底层逻辑。

2025-11-20 16:00:08 975

原创 AI的下一场胜负手，不在规模而在“小而专”的智能体

当万亿参数的大模型逐渐陷入成本与实用性的泥潭，企业真正需要的，不再是能写诗的“通才”，而是能精准完成报销、对账、审批等具体任务的“专家助理”。本文系统剖析为何AI落地的关键正从“大”转向“小而美”，并结合多智能体协同架构、业务流程嵌入逻辑与真实ROI重构，为企业大模型实践者提供一条务实可行的路径。

2025-11-20 09:50:31 804

原创 AI Agent同质化危机：企业如何跨越“伪智能”陷阱？

企业AI Agent项目正经历严重疲劳症，40%项目面临取消。表面繁荣下隐藏着同质化陷阱——巨头产品底层均依赖相同模型，真正具备自主能力的供应商仅130家。本文剖析Agent Washing现象背后的技术断层与商业价值缺失，指出从Demo到生产级落地的核心挑战，为企业提供穿越炒作周期的实战路径。

2025-11-20 09:43:22 1045

原创 AI 的真正瓶颈不是算力，而是我们还没搞懂“怎么学”

Sam Altman 在最新访谈中直言，AI 领域最大的难题不是数据耗尽或算力不足，而是“学习效率”远逊于人类。本文系统拆解他提出的九大核心议题，结合工程实践与教育变革视角，深入探讨为何“AI 系统防护”被严重低估、开发者角色将如何重构、以及我们该如何为“AI 原住民”时代重新设计知识体系。这不是一篇技术综述，而是一份面向落地的思考地图。

2025-11-19 10:05:06 957

原创小模型干大事：一起来看义团队提出“环境Scaling”新范式到底是什么原理

通义团队提出“环境Scaling”新范式，通过自动构建可验证的模拟环境，让30B参数模型在工具调用任务中媲美万亿级大模型。本文深入拆解其原理、方法与实践价值，告诉你为何“环境多样性”才是代理智能成长的关键。

2025-11-18 15:49:20 667

原创 Transformer 与 MoE 不是二选一，而是“谁在干活”和“怎么派活”的关系

你以为 MoE 是 Transformer 的替代者？错了。它们根本不在同一维度。本文讲清 Transformer 如何处理序列信息，MoE 又如何通过“动态派活”实现高效扩容。告诉你什么时候该用哪种结构，以及为什么顶级模型都在悄悄组合使用二者。看完你就明白，大模型的真正秘密不在参数量，而在调度机制。

2025-11-18 10:42:27 1010

mnist手写数字训练集

mnist手写数字训练集，用于训练神经网络识别手写阿拉伯数字用。

2025-11-01

fox999_workflow_features_2004A

银狐写的著名的工作流功能列表

2007-09-14

高杰的JBPM从入门到精通

JBPM是一个扩展性很强的工作流系统，百分百用JAVA语言开发，持久层采用Hibernate实现，理论上说，只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上

2011-04-04

Experience J2EE! Using WebSphere Application Server V6.1

IBM公司的Websphere application server6.1 红皮开发技术书之一(图文并茂),极适合初学者

2011-04-04

此为本人原版word文档，用于在公司内部作技术强化用，原名为“通向八段的道路”，因为本系列计划想写365天，研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师，自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”，而此次上传的为原版精排版word文档，带有目录和完整正确格式的文档，希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合，但是由于其是从linux/unix下编译过来的，因此它的一些目录与配置文件尚保留着linux/unix下的格式，比如说你装在d:\openssl目录下，它的conf文件内对于内带ca的引用还是/home/democa这样的格式，因此这些目录与资源的引用需要改成windows下的目录和路径相关。为方便大家使用，我已经进行了相关的修改，大家下载此openssl for win后解压后直接在windows环境变量设置相关的： OPENSSL_HOME与openssl_conf 即可使用，为此我收取资源分1点！

2012-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

mnist手写数字训练集

ibatis 开发指南

fox999_workflow_features_2004A

高杰的JBPM从入门到精通

Experience J2EE! Using WebSphere Application Server V6.1

原版精美通向架构师的道路第十四天至第十七天Word文档

openssl for win

通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力的sample工程

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子

SSH_Alpha工程人附属lib包

通向架构师的道路第十八到第二十三天的例子

maven-ant-tasks-2.1.3.jar

hypersonic

IBM RAD7.5开发指南part1(全图文教程,超灵)

mod_jk for apache 2.2.x

spring in action

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM RAD7.5开发指南part3(全图文教程,超灵)

jbossgettingstart

空空如也