自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

打造全国最全的AI Agent开发知识领域的博客

实战级AI Agent以及相关架构博客,生产级设计与代码示例,以喂饭式教程带领读者从浅入深学习最前沿的技术。

  • 博客(984)
  • 资源 (19)
  • 收藏
  • 关注

原创 AI工程化:从“炼丹”到“建药厂”的60分钟通关指南

AI模型再聪明,不工程化就是玩具。本文系统拆解AI工程化的核心目标、关键技术与典型陷阱,带你理解如何将一个Notebook里的模型,变成高可靠、低延迟、低成本的线上服务。

2026-01-08 17:27:13 61

原创 讲透知识图谱Neo4j在构建Agent时到底怎么用(二)

RAG 回答不准?因为缺少结构化逻辑。本文详解如何用 Neo4j 知识图谱为 Agent 提供确定性规则支撑,实现精准推理与冲突消解,让 AI 回答既聪明又可靠。

2026-01-08 16:37:56 668

原创 讲透知识图谱Neo4j在构建Agent时到底怎么用(一)

本文深入剖析 Neo4j 如何作为 Agent 的“认知骨架”,并通过一个实际工程中的例子来说明知识图谱如何实现结构化推理,解决大模型在复杂规则与多跳关系下的幻觉与模糊问题。

2026-01-07 23:33:11 1234

原创 Agent 可靠性为何总是崩于细节?LangChain 创始人亲授系统性解法

Agent 从 Demo 走向生产,失败往往源于对“可靠性”的误解。本文基于 LangChain 创始人对 LangSmith 新功能的深度解读,系统拆解如何通过 Insights 与 Thread Evals 构建数据驱动的质量保障闭环,真正解决 Agent 在真实场景中的稳定性问题。

2026-01-07 15:40:02 430

原创 来看19.8k Star的谷歌开源复杂文档结构化信息抽取工具据説无需微调LLM即可精准提取

谷歌开源LangExtract,仅用自然语言指令与少量示例,即可从复杂长文档中精准提取可溯源的结构化信息。它通过原文定位、多轮分块、交互验证三大机制,有效抑制大模型幻觉,让信息抽取真正“有据可依”。

2026-01-07 15:31:13 632

原创 一起来围观46C6法提示词书写技巧是什么意思?

大多数提示词失效,并非因为模型能力不足,而是提问者忽略了结构化表达。46C6 提供了一套最小完备的提示工程框架——从任务四要素、六大优化策略、思维链显性推理,到 KERNEL 工程化原则,系统性解决“说不清、跑偏、不可复现”三大顽疾。

2026-01-06 21:51:28 1253

原创 慢思考,深搜索:MiroThinker 1.5 如何重塑 AI 研究智能体范式

MiroThinker 1.5 不追求“秒回”,而是以严谨的慢思考机制,在复杂问题上击败参数量更大的模型。本文解析其多轮主动搜索、交叉验证与长时推理能力,探讨它如何代表 AI 从聊天机器人向研究智能体的根本转型。

2026-01-06 20:01:41 882

原创 2026,多智能体不是噱头:企业AI从“工具人”走向“虚拟团队”

2026年将是多智能体在企业落地的关键元年。零一万物提出六大预判,指出AI将从“一人一工具”升级为“一人一团队”,通过角色分工、流程协同与业务闭环,真正嵌入组织主干。本文系统拆解多智能体为何不是过渡概念,而是当前最可行的企业AI路径。

2026-01-05 15:58:54 784

原创 mHC架构:用数学约束驯服超宽残差,大模型训练的新范式

DeepSeek最新论文提出mHC架构,通过将超连接投影到双随机矩阵流形上,一举解决梯度爆炸与显存墙问题。仅6.7%额外开销,即可实现训练稳定、性能提升与良好扩展性,为大模型宏观架构设计开辟新路径。

2026-01-04 23:45:11 1117

原创 AnyGen真能取代NotebookLM?别急,先看它到底解决了什么问题

AnyGen并非简单复刻NotebookLM,而是以“可交付成果”为核心,打通从碎片信息到可编辑办公产物的全链路。本文从五大典型场景出发,系统对比其与NotebookLM、豆包在内容生成、结构化处理及最终可用性上的差异,揭示AnyGen作为AI工作空间的独特定位。

2026-01-04 23:37:16 910

原创 AI项目能不能稳定解决问题的8大关键工程能力

当你的AI Demo惊艳全场却上线崩盘,问题从来不在模型本身。真正决定AI能否稳定落地的,是围绕模型构建的一整套工程体系——从提示词设计到上下文管理,从RAG架构到智能体调度,再到部署、优化与可观测性。本文系统拆解支撑生产级AI应用的8大核心技能,告诉你如何把“会调Prompt”的手艺,转化为可复现、可评测、可迭代的稳定系统。

2025-12-15 15:46:42 823

原创 什么是RAG?什么是CAG?一文来搞清

RAG 解决了大模型“说错话”的问题,CAG 则让 AI 学会记住、理解并保持一致。本文系统剖析两者的技术差异、演进逻辑与未来方向,揭示 AI 如何从工具走向真正可信赖的智能伙伴。

2025-12-15 15:36:04 566

原创 RAG中的语义理解与语义检索:别再混为一谈

语义理解和语义检索在RAG中各司其职——前者是模型“读懂”问题的能力,后者是系统“找到”答案的手段。本文系统拆解二者原理、分工与协同逻辑,澄清常见误区。

2025-12-12 18:22:12 747

原创 大模型知道自己在瞎说,却停不下来背后的原理是什么?

大模型在长推理任务中常生成大量语义重复、逻辑空转的“词语沙拉”,虽能感知自身胡说却无法自主停止。最新研究通过监控隐藏状态识别冗余输出,并提出轻量干预策略,在不牺牲正确率的前提下显著提升效率。

2025-12-12 18:07:23 648

原创 智能体长期记忆的真正解法:不只是知识库,而是可演化的“第二大脑”

智能体长期记忆不能只靠RAG和向量库。MemMachine 提供了一套可自部署、支持记忆演化、兼容国产大模型的完整方案,通过 MCP 协议无缝接入 Claude 等主流 Agent,让 AI 真正“记得你、理解你、为你改变”。

2025-12-11 14:03:57 975

原创 多轮 Function Call 为什么是微调中最难的一环?

Function Call 的真正难点不在工具调用,而在多轮对话的状态管理。本文系统拆解多轮对话的三类结构、追问逻辑、数据构建方法和防“乱跳”机制,揭示其本质是一个状态机调度问题,并给出工程实践与面试应答策略。

2025-12-10 12:14:53 941

原创 Agent热潮下的冷思考:一盆凉水浇在Agent身上

当前AI Agent热潮席卷全球,但基础设施薄弱、推理成本高昂、软件生态不兼容等问题正成为其规模化落地的瓶颈。本文系统剖析Agent发展的真实困境与底层逻辑,并探讨未来突破方向。

2025-12-10 12:04:11 1355

原创 GLM-4.6V:多模态大模型首次打通“看图—理解—执行”闭环

GLM-4.6V开源,首次在视觉大模型中原生集成工具调用能力,实现从图像感知到可执行动作的端到端闭环,支持图文创作、识图购物、前端复刻与长文档视频理解四大典型场景,9B轻量版免费开放。

2025-12-09 13:07:42 1049

原创 Query重写:RAG系统被忽视的“第一公里”优化

传统RAG框架常忽略原始查询与真实检索需求之间的鸿沟。微软亚研院提出的Rewrite-Retrieve-Read框架,通过在检索前引入Query重写机制,从源头提升检索质量,在多跳问答、消歧任务及弱模型增强等场景中显著提效,为黑箱大模型下的RAG优化提供了低成本、高回报的新路径。

2025-12-08 16:53:11 879

原创 国产之光-Qwen3 Embedding为何能终结MTEB竞赛?

Qwen3 Embedding不只是又一个榜单刷分者——它用“架构适配+数据合成+模型融合”三重机制,首次系统性地将大语言模型的生成能力反哺到嵌入学习中。0.6B参数模型硬刚7B级别对手、8B模型登顶多语言MTEB榜首,背后是一套可复现、可扩展的新范式。本文解析其技术内核,并探讨这一路径对整个文本表征领域的深远影响。

2025-12-06 03:16:39 647

原创 Ingress-Nginx即将退役,我们该怎么办?这里有你想知道的一切

Ingress-NGINX将于2026年3月正式退役,现有部署可继续运行但将不再获得安全更新。本文系统分析退役原因、风险评估,详细比较迁移至Gateway API或其他Ingress控制器的方案,帮助企业做出稳妥的技术决策。

2025-12-05 15:21:13 1214

原创 Agent不是“更聪明的大模型”,而是“会思考的流程”——一线工程师拆解构建有效Agent的三大核心能力

大模型本身不会自动变成能办事的员工。真正让Agent在真实世界中可靠、高效、可扩展的关键,在于围绕模型设计一套结构化的认知流程。本文系统拆解了构建有效Agent必须具备的三种底层能力:结构化思考流程、高效记忆压缩机制、与现实交互的工具触手,并结合控制论与信息论解释其科学原理,同时探讨当前工程实践中提升性能的四大突破方向。

2025-12-03 11:17:29 797

原创 LLM推理引擎选型实战指南:用Transformers、llama.cpp 还是 vLLM 之争

本文深入解析Transformer、llama.cpp和vLLM三大主流LLM推理引擎的技术特点与适用场景,通过操作系统概念的类比帮助开发者根据硬件条件、使用场景和性能需求做出明智选择。无论您是个人开发者还是企业用户,都能找到最适合的推理解决方案。

2025-12-02 14:01:23 888

原创 Claude 4.5给AI注入灵魂,到底是个什么东东?一起来围观

一份神秘的"灵魂文档"引发AI界震动,Anthropic可能正在为AI注入哲学思辨能力。本文深入解析这份文档的技术内涵,探讨AI自我意识构建的伦理边界,思考人类与智能体关系的未来走向。

2025-12-01 22:12:59 1140

原创 Docker Model Runner 杀到!Ollama 的护城河还剩多少?

Docker Model Runner整合vLLM直插生产环境,Ollama的“易用性护城河”正被企业级需求瓦解。本文拆解DMR双轨架构如何用OCI标准重构LLM部署,对比精度控制、供应链管理等核心差异。技术选型关键转折点已到,大家一起来围观!

2025-12-01 19:00:00 846

原创 来围观AI的未来形态是什么?:一个能规划、执行、纠错的自主AI

本文深入探讨了智能体的核心技术架构和应用场景,揭示其从简单的文本生成到复杂任务执行的演进路径。文章详细拆解了智能体的五大核心组件——大脑(大模型)、记忆系统、工具调用、框架调度和云原生部署,并分析其在自动化流程、垂直领域专家、动态环境交互等领域的实际应用。同时,文章直面智能体落地中的可靠性、长程任务、复杂环境适应等挑战,并展望了从专用到通用、多模态融合、标准化等未来趋势。

2025-12-01 18:49:19 682

原创 智能客服做成烧钱无底洞?需要注意些什么避坑技巧呢?

别再把智能客服当成“AI玩具”!本文从客服与销售的本质差异出发,揭示企业盲目上马AI客服的常见误区,并系统拆解强需求与弱需求场景下的不同落地路径,帮助技术人和决策者看清:真正的智能客服,是业务逻辑的数字化延伸,不是大模型的简单堆砌。

2025-11-30 14:45:44 1052

原创 先分块再向量化已经过时?先embedding再chunking?一起来看看这是怎么回事

传统RAG流程中“先分块再向量化”已显疲态。本文系统解析“先embedding再chunking”新范式,详解Max–Min语义分块原理、优势与局限,并结合工程实践给出可落地的优化建议,助你显著提升RAG检索准确率。

2025-11-30 14:30:05 735

原创 单卡也能并行炼丹?来看TRL + RapidFire AI 如何让大模型调参效率飙升20倍

你还在用一张 GPU 串行跑微调实验?Hugging Face TRL 集成 RapidFire AI 后,单卡即可并发运行多个大模型微调任务,通过自适应分块调度与共享内存机制,在不增加硬件成本的前提下将调参效率提升16–24倍。本文详解其原理、工程实现与实战价值。

2025-11-25 13:45:38 1050

原创 来看实现零人类数据下的大模型自我演进,这讲得到底是什么呢?

斯坦福等团队提出 Agent0 框架,在完全零人类标注数据的前提下,通过双智能体协同对抗与工具集成,让大模型实现自我演进。本文系统拆解其机制、实验效果与工程细节,并结合笔者在企业大模型落地中的经验,探讨这一范式对实际应用的深远意义。

2025-11-24 19:02:43 1281

原创 RAG知识库评估框架应该有点什么呢?

本文系统介绍了一套可量化、可复现、可对比的RAG知识库评估框架,围绕Recall Score、Correctness与Groundedness三大核心指标,结合真实企业研发场景,详细阐述如何从“凭感觉”走向科学评估。笔者通过构建轻量级评测Pipeline,验证了该框架的有效性,并分享了后续优化路径与实践经验。

2025-11-24 18:52:08 735

原创 AI Agent开发第82课-手把手教你把paddleocr-vl做成mcp使其在DIFY里运行

本文详解如何将国产顶尖多模态 OCR 模型 PaddleOCR-VL 封装为标准 MCP(Model Calling Protocol)服务,并通过自研的 HTTP-based MCP Client 接入 Dify 1.10,实现 AI Agent 在对话中自动识别并调用 OCR 能力。该方案已在某头部保险公司真实业务流程中落地,使用了当前最先进的“Agentic AI 原生”设计思想。

2025-11-23 22:10:47 1363

原创 BERT 和 GPT,谁才是你该用的大模型?——从原理到落地场景的深度拆解

BERT 与 GPT 是当前 NLP 领域两大基石模型,一个擅长理解,一个长于生成。本文将从底层架构、训练机制、适用场景到企业落地实践,系统剖析二者差异,并结合笔者多年工程经验,告诉你何时该选 BERT,何时该用 GPT,以及如何在真实业务中做出最优技术选型。

2025-11-21 14:31:58 1111

原创 GPU 空转 96%?看TiDAR团队 如何榨出近 6 倍推理速度而不牺牲质量

你的 LLM 推理慢,不是因为 GPU 不行,而是因为 96% 的算力在发呆。英伟达华人团队提出 TiDAR 架构,利用“空闲 Token 槽”在一次前向中并行生成多个 token,吞吐提升近 6 倍且质量无损。本文深入剖析其原理、优势、限制及对推理系统架构的颠覆性影响,为大模型落地提供新思路。

2025-11-21 14:25:51 710

原创 AI 编程没有取代程序员,它在放大你的技术领导力

过去一年我深度使用 AI Coding 工具完成各类项目,逐渐意识到:AI 并非替代程序员,而是将工程师的技术领导力——架构设计、任务拆解、问题诊断与团队引导能力——前所未有地放大。这篇文章系统拆解这一认知的形成过程、实践方法与底层逻辑。

2025-11-20 16:00:08 975

原创 AI的下一场胜负手,不在规模而在“小而专”的智能体

当万亿参数的大模型逐渐陷入成本与实用性的泥潭,企业真正需要的,不再是能写诗的“通才”,而是能精准完成报销、对账、审批等具体任务的“专家助理”。本文系统剖析为何AI落地的关键正从“大”转向“小而美”,并结合多智能体协同架构、业务流程嵌入逻辑与真实ROI重构,为企业大模型实践者提供一条务实可行的路径。

2025-11-20 09:50:31 804

原创 AI Agent同质化危机:企业如何跨越“伪智能”陷阱?

企业AI Agent项目正经历严重疲劳症,40%项目面临取消。表面繁荣下隐藏着同质化陷阱——巨头产品底层均依赖相同模型,真正具备自主能力的供应商仅130家。本文剖析Agent Washing现象背后的技术断层与商业价值缺失,指出从Demo到生产级落地的核心挑战,为企业提供穿越炒作周期的实战路径。

2025-11-20 09:43:22 1045

原创 AI 的真正瓶颈不是算力,而是我们还没搞懂“怎么学”

Sam Altman 在最新访谈中直言,AI 领域最大的难题不是数据耗尽或算力不足,而是“学习效率”远逊于人类。本文系统拆解他提出的九大核心议题,结合工程实践与教育变革视角,深入探讨为何“AI 系统防护”被严重低估、开发者角色将如何重构、以及我们该如何为“AI 原住民”时代重新设计知识体系。这不是一篇技术综述,而是一份面向落地的思考地图。

2025-11-19 10:05:06 957

原创 小模型干大事:一起来看义团队提出“环境Scaling”新范式到底是什么原理

通义团队提出“环境Scaling”新范式,通过自动构建可验证的模拟环境,让30B参数模型在工具调用任务中媲美万亿级大模型。本文深入拆解其原理、方法与实践价值,告诉你为何“环境多样性”才是代理智能成长的关键。

2025-11-18 15:49:20 667

原创 Transformer 与 MoE 不是二选一,而是“谁在干活”和“怎么派活”的关系

你以为 MoE 是 Transformer 的替代者?错了。它们根本不在同一维度。本文讲清 Transformer 如何处理序列信息,MoE 又如何通过“动态派活”实现高效扩容。告诉你什么时候该用哪种结构,以及为什么顶级模型都在悄悄组合使用二者。看完你就明白,大模型的真正秘密不在参数量,而在调度机制。

2025-11-18 10:42:27 1010

mnist手写数字训练集

mnist手写数字训练集,用于训练神经网络识别手写阿拉伯数字用。

2025-11-01

ibatis 开发指南

IBATIS官方教程(中文)

2007-09-14

fox999_workflow_features_2004A

银狐写的著名的工作流功能列表

2007-09-14

高杰的JBPM从入门到精通

JBPM是一个扩展性很强的工作流系统,百分百用JAVA语言开发,持久层采用Hibernate实现,理论上说,只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上

2011-04-04

Experience J2EE! Using WebSphere Application Server V6.1

IBM公司的Websphere application server6.1 红皮开发技术书之一(图文并茂),极适合初学者

2011-04-04

原版精美通向架构师的道路第十四天至第十七天Word文档

此为本人原版word文档,用于在公司内部作技术强化用,原名为“通向八段的道路”,因为本系列计划想写365天,研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师,自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。 本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”,而此次上传的为原版精排版word文档,带有目录和完整正确格式的文档,希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合,但是由于其是从linux/unix下编译过来的,因此它的一些目录与配置文件尚保留着linux/unix下的格式,比如说你装在d:\openssl目录下,它的conf文件内对于内带ca的引用还是/home/democa这样的格式,因此这些目录与资源的引用需要改成windows下的目录和路径相关。 为方便大家使用,我已经进行了相关的修改,大家下载此openssl for win后解压后直接在windows环境变量设置相关的: OPENSSL_HOME与openssl_conf 即可使用,为此我收取资源分1点!

2012-08-10

通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程

该Sample工程为通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力一文中所用的例子。它是基于ibm compute grid的批处理开发框架v.6.1.1.1.1基础上来开发的。 包含有用于读的样本文本文件、源代码与相关配置。

2013-01-15

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子,内含maven的pom.xml文件与build.xml

2012-12-03

SSH_Alpha工程人附属lib包

通向架构师的道路(第十八天)万能框架Spring(一)教程所属相关工程,大家可以下载下来后导入eclipse用,相关的lib目录下的jar文件已经删了,大家可以自行去下载spring3, struts1.3, hibernate3与jasypt,这些网上都是公开和免费的。我也上传了一份,我本意是大家自己去把这些包整合起来因为我已经发了jar list,不过因为是我整合的,因此收资源分1分

2012-10-22

通向架构师的道路第十八到第二十三天的例子

通向架构师的道路第十八到第二十三天的例子

2012-12-02

maven-ant-tasks-2.1.3.jar

maven-ant-tasks-2.1.3.jar

2012-11-19

hypersonic

hypersonic官方文档

2007-09-07

IBM RAD7.5开发指南part1(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

mod_jk for apache 2.2.x

mod_jk for apache 2.2.x

2012-08-18

spring in action

spring in action官方教程

2007-09-04

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

IBM RAD7.5开发指南part3(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

jbossgettingstart

jboss4.x getting start官方中文教程

2007-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除