自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

打造全国最全的AI Agent开发知识领域的博客

实战级AI Agent以及相关架构博客,生产级设计与代码示例,以喂饭式教程带领读者从浅入深学习最前沿的技术。

  • 博客(954)
  • 资源 (19)
  • 收藏
  • 关注

原创 来看实现零人类数据下的大模型自我演进,这讲得到底是什么呢?

斯坦福等团队提出 Agent0 框架,在完全零人类标注数据的前提下,通过双智能体协同对抗与工具集成,让大模型实现自我演进。本文系统拆解其机制、实验效果与工程细节,并结合笔者在企业大模型落地中的经验,探讨这一范式对实际应用的深远意义。

2025-11-24 19:02:43 596

原创 RAG知识库评估框架应该有点什么呢?

本文系统介绍了一套可量化、可复现、可对比的RAG知识库评估框架,围绕Recall Score、Correctness与Groundedness三大核心指标,结合真实企业研发场景,详细阐述如何从“凭感觉”走向科学评估。笔者通过构建轻量级评测Pipeline,验证了该框架的有效性,并分享了后续优化路径与实践经验。

2025-11-24 18:52:08 400

原创 重磅:手把手教你把paddleocr-vl做成mcp使其在DIFY里运行

本文详解如何将国产顶尖多模态 OCR 模型 PaddleOCR-VL 封装为标准 MCP(Model Calling Protocol)服务,并通过自研的 HTTP-based MCP Client 接入 Dify 1.10,实现 AI Agent 在对话中自动识别并调用 OCR 能力。该方案已在某头部保险公司真实业务流程中落地,使用了当前最先进的“Agentic AI 原生”设计思想。

2025-11-23 22:10:47 933

原创 BERT 和 GPT,谁才是你该用的大模型?——从原理到落地场景的深度拆解

BERT 与 GPT 是当前 NLP 领域两大基石模型,一个擅长理解,一个长于生成。本文将从底层架构、训练机制、适用场景到企业落地实践,系统剖析二者差异,并结合笔者多年工程经验,告诉你何时该选 BERT,何时该用 GPT,以及如何在真实业务中做出最优技术选型。

2025-11-21 14:31:58 1038

原创 GPU 空转 96%?看TiDAR团队 如何榨出近 6 倍推理速度而不牺牲质量

你的 LLM 推理慢,不是因为 GPU 不行,而是因为 96% 的算力在发呆。英伟达华人团队提出 TiDAR 架构,利用“空闲 Token 槽”在一次前向中并行生成多个 token,吞吐提升近 6 倍且质量无损。本文深入剖析其原理、优势、限制及对推理系统架构的颠覆性影响,为大模型落地提供新思路。

2025-11-21 14:25:51 652

原创 AI 编程没有取代程序员,它在放大你的技术领导力

过去一年我深度使用 AI Coding 工具完成各类项目,逐渐意识到:AI 并非替代程序员,而是将工程师的技术领导力——架构设计、任务拆解、问题诊断与团队引导能力——前所未有地放大。这篇文章系统拆解这一认知的形成过程、实践方法与底层逻辑。

2025-11-20 16:00:08 916

原创 AI的下一场胜负手,不在规模而在“小而专”的智能体

当万亿参数的大模型逐渐陷入成本与实用性的泥潭,企业真正需要的,不再是能写诗的“通才”,而是能精准完成报销、对账、审批等具体任务的“专家助理”。本文系统剖析为何AI落地的关键正从“大”转向“小而美”,并结合多智能体协同架构、业务流程嵌入逻辑与真实ROI重构,为企业大模型实践者提供一条务实可行的路径。

2025-11-20 09:50:31 769

原创 AI Agent同质化危机:企业如何跨越“伪智能”陷阱?

企业AI Agent项目正经历严重疲劳症,40%项目面临取消。表面繁荣下隐藏着同质化陷阱——巨头产品底层均依赖相同模型,真正具备自主能力的供应商仅130家。本文剖析Agent Washing现象背后的技术断层与商业价值缺失,指出从Demo到生产级落地的核心挑战,为企业提供穿越炒作周期的实战路径。

2025-11-20 09:43:22 962

原创 AI 的真正瓶颈不是算力,而是我们还没搞懂“怎么学”

Sam Altman 在最新访谈中直言,AI 领域最大的难题不是数据耗尽或算力不足,而是“学习效率”远逊于人类。本文系统拆解他提出的九大核心议题,结合工程实践与教育变革视角,深入探讨为何“AI 系统防护”被严重低估、开发者角色将如何重构、以及我们该如何为“AI 原住民”时代重新设计知识体系。这不是一篇技术综述,而是一份面向落地的思考地图。

2025-11-19 10:05:06 879

原创 小模型干大事:一起来看义团队提出“环境Scaling”新范式到底是什么原理

通义团队提出“环境Scaling”新范式,通过自动构建可验证的模拟环境,让30B参数模型在工具调用任务中媲美万亿级大模型。本文深入拆解其原理、方法与实践价值,告诉你为何“环境多样性”才是代理智能成长的关键。

2025-11-18 15:49:20 614

原创 Transformer 与 MoE 不是二选一,而是“谁在干活”和“怎么派活”的关系

你以为 MoE 是 Transformer 的替代者?错了。它们根本不在同一维度。本文讲清 Transformer 如何处理序列信息,MoE 又如何通过“动态派活”实现高效扩容。告诉你什么时候该用哪种结构,以及为什么顶级模型都在悄悄组合使用二者。看完你就明白,大模型的真正秘密不在参数量,而在调度机制。

2025-11-18 10:42:27 960

原创 QSVD:用一次SVD手术,让视觉语言模型提速13倍、精度反升10%

纽约大学新提出的QSVD算法,通过对Q、K、V权重矩阵联合做奇异值分解,并结合跨层秩分配与低秩量化技术,首次在压缩视觉语言模型的同时实现精度提升。实测显示,在普通RTX 4070上推理速度提升13.1倍,KV缓存减少80%以上——这可能是VLM走向端侧部署的关键一步。

2025-11-18 10:30:04 854

原创 AI Agent淘汰的到底是什么?是这种工作模式!

AI编程早已超越自动补全。如今的AI Agent能理解需求、规划任务、执行开发甚至自我修复,正在重构软件工程的底层逻辑。本文系统剖析Agent如何从工具演变为执行主体,揭示“提示驱动开发”新范式,并拆解单Agent与多Agent战术选择、效能提升路径、七大落地场景及技术内核。这不是程序员的末日,而是“人机协作”新时代的开端——被淘汰的,是只写代码不思考的工作模式。

2025-11-16 18:17:21 621

原创 paddleocr-vl全网唯一最全本地化布署教程

本文详解 PaddleOCR-VL 本地化布署全过程,指出为何在真实生产环境中 PaddleOCR-VL 更稳定、更易部署、更贴近工程落地。同时还会详细比较与 DeepSeek-OCR 的核心差异,为全网独家介绍paddleocr-vl的本地部署实战指南。

2025-11-16 04:25:07 2378 10

原创 深度搜索 ≠ RAG:厘清两种“智能检索”技术的本质差异与协同可能

你是否以为“深度搜索”只是RAG的另一种叫法?其实两者目标、架构和适用场景截然不同。本文从原理出发,拆解Deep Search如何优化检索本身,而RAG如何用检索增强生成;并结合笔者在Agent与RAG项目中的实战体会,说明何时该用哪种技术——甚至为何它们常常要一起上。

2025-11-14 13:46:45 1149

原创 为什么说MCP是金融AI落地的“最后一公里”协议?

为什么说MCP正在成为金融大模型落地的关键基础设施?本文从协议原理、行业痛点、实施路径到真实价值,系统拆解Model Context Protocol如何打通AI与金融系统之间的语义鸿沟,并给出笔者在实践中对数据结构化、权限治理与工具设计的深度思考。如果你正在规划企业级AI应用,这篇文章值得你读完。

2025-11-14 10:33:44 953

原创 DeepSeek-OCR 安装全指南:从 Transformers 到 vLLM,手把手教你跑通企业级 OCR

本文系统讲解 DeepSeek-OCR 的两种部署方式——基于 Hugging Face Transformers 的标准推理与基于 vLLM 的高性能加速推理。详细说明 CUDA 与 PyTorch 版本匹配、环境验证、依赖安装等关键细节,并提供可直接运行的完整代码示例。无论你是单卡调试还是高并发服务部署,都能在这里找到清晰路径。

2025-11-12 11:16:36 1401

原创 AI教母李飞飞:下一站不是更大语言模型,而是能“看懂”世界的空间智能

为什么李飞飞坚持认为 AI 的极限不在语言?本文系统拆解“空间智能”的核心逻辑、技术挑战与落地路径,揭示大模型之后 AI 真正需要补上的关键一课——理解物理世界。从 ImageNet 到世界模型,这不仅是学术转向,更是企业级 AI 落地的下一战场。

2025-11-12 10:20:00 1250

原创 传统媒体不做“守墓人”:从《时代》杂志使用AI一事看内容行业的智能体转型之路

102岁的《时代》杂志上线AI智能体,支持语义问答、多语言音频输出与多轮交互。这不仅是技术升级,更是传统内容机构在AI时代主动求变的缩影。本文拆解其技术架构、产品逻辑与战略意图,并结合笔者观察,探讨传统行业如何借力AI+延续核心优势,避免沦为数字浪潮中的“活化石”。

2025-11-12 10:12:59 798

原创 User Prompt 与 System Prompt:大模型沟通的“双引擎”机制深度拆解

你给AI的指令,真的说清楚了吗?为什么同样的问题,别人能得到惊艳答案,你却只收到平庸回复?关键不在模型,而在提示词。本文系统剖析 User Prompt 与 System Prompt 的本质差异、作用边界与协同逻辑,结合工程实践与认知原理,揭示如何通过“双提示”设计让大模型真正为你所用。

2025-11-12 10:05:54 1177

原创 Agent规划模块揭秘:为何大模型不能真正“自主思考”?

别被“智能规划”骗了!当前主流 Agent 系统的 Planning 模块,绝大多数是人写死的逻辑+模型填空。本文从工程实践出发,拆解 Planning 的真实实现机制、为何不能全靠 LLM、何时该硬编码、何时可放手,并结合主流框架与落地案例,讲透“可控”与“灵活”的平衡之道。

2025-11-11 17:11:20 636

原创 AI大神认为:真正能干活的智能体还要十年?这是怎么一回事呢?

卡帕西直言当前大模型只是“认知小孩”,离替代实习生还有至少十年。本文系统拆解其核心判断——从“数字幽灵”的本质、强化学习的失效、模型坍缩的硬伤,到“小而精认知核心”的未来路径,并结合笔者在企业落地中的真实体会,揭示为何2025绝非智能体元年。

2025-11-11 16:56:32 953

原创 开源模型登顶?Kimi K2 Thinking 实测解析:它真能超越 GPT-5 吗?

Kimi K2 Thinking 以 1 万亿参数、INT4 量化推理和超长工具调用链,首次在多项基准测试中超越闭源模型。本文实测其编程、搜索、写作与智能体能力,拆解其技术原理,并探讨国产开源大模型是否真正迎来“登极”时刻。

2025-11-09 19:22:02 1328

原创 AI Agent落地的真相:90%的企业都在错把“工具”当“主角”

别再迷信模型参数了!真正阻碍AI Agent在企业落地的,从来不是技术瓶颈,而是人、流程和价值闭环。本文从真实调研出发,拆解三大核心障碍、三类Agent形态、三种落地策略,并分享笔者多年实践中踩过的坑与悟出的道——AI要融入工作流,而不是打断它。

2025-11-09 19:10:28 590

原创 多模态大模型能“看图识字”,但为何干不了OCR的活?

Qwen-VL、GPT-4o这类多模态模型确实能“读懂”图片里的文字,但它们真能取代OCR吗?本文从技术原理、精度表现、鲁棒性、部署成本到输出结构等维度系统拆解,揭示为何在企业级文档处理中,OCR仍是不可替代的基础设施。别被“全能AI”的光环迷惑——理解语义 ≠ 忠实转录。

2025-11-09 16:52:56 950

原创 RAG 不只是“查片段”——让大模型真正“看懂整个知识库”的新框架来了

现有 RAG 系统擅长回答“局部事实”,却在“全局洞察”类问题上频频翻车。复旦团队首次定义“全局 RAG”能力,并发布首个测评基准 GlobalQA,同时提出无训练的 GlobalRAG 框架,在 Qwen2.5-14B 上 F1 分数达 6.63,远超最强基线(1.51)。本文深入拆解其原理、设计与实战启示,助你突破企业级知识问答的瓶颈。

2025-11-09 16:38:56 689

原创 从云端跌落:为什么中国IT可以把外企IT甩出两条街以上

外企IT曾是技术圣地,如今却因僵化流程、决策滞后与技术脱节,在中国速度面前沦为“反向教科书”。本文揭示:当本土企业用钉钉三小时修复漏洞、靠云原生扛住双11洪峰时,外企仍在为开个防火墙端口等邮件审批。技术人的黄金时代不在咖啡杯里,而在能真实解决问题的代码中。选对战场,别让流程锈蚀你的锋芒。

2025-11-08 22:50:41 947

原创 第1课-通过DIFY实现一个完整的Text2Sql来讲AI原生及Agentic RAG长什么样

《2025最前沿AI Agent讲武堂》第一课来了!手把手用 Dify 实现一个具备自主推理、工具调用与错误修正能力的 Text2SQL 应用,带你亲眼看看真正的 AI 原生架构和 Agentic RAG 在落地时长什么样。

2025-11-08 22:34:58 1772

原创 金融RAG落地之痛:不在模型,而在数据结构

RAG在金融行业落地效果不佳,根源往往不是大模型能力不足,而是数据本身的复杂性被低估。本文深入剖析金融文档解析、语义切分、合规约束、评估体系等五大核心挑战,并结合实战经验给出可落地的工程解法——真正的难点,从来不是算法,而是如何把非结构化的金融信息变成模型“看得懂”的结构化知识。

2025-11-06 10:00:20 917 4

原创 LlamaIndex 到底是不是 RAG?别再搞混框架、范式和组件了

你以为 LlamaIndex 是个新技术?其实它只是帮你搭 RAG 系统的“乐高积木”。本文手把手带你厘清 LlamaIndex、RAG 和 Rerank 三者的本质区别,并附完整可运行代码,让你在企业落地大模型时少走弯路。

2025-11-03 10:17:49 643

原创 敲黑板!7类神经网络到底能干啥?一张表看懂谁适合你的业务场景

别再把神经网络当万能药!本文用10+个真实生活场景,告诉你CNN、Transformer、GNN等模型到底适合解决什么问题,哪些场景硬上神经网络反而低效、不稳定甚至失败。从手机相册分类到刷脸支付,从智能客服到异常检测,说透原理、优劣与边界,助你精准选型,少走弯路。

2025-11-02 14:45:07 626

原创 别被“智能体”忽悠了!企业落地AI Agent绕不开的三大生死关

AI Agent热潮之下,66%的企业卡在“结果不可靠”上。本文深入剖析企业应用Agent时面临的可靠性、安全性与成本效益三大核心挑战,结合真实架构设计与落地经验,给出可复用的解决方案——从大小模型协同、RAG知识注入到最小权限控制与小场景切入策略,帮你避开陷阱,真正让Agent成为生产力而非负担。

2025-11-02 14:32:14 611

原创 通过神经网络手搓一个带finetune功能的手写数字识别来学习“深度神经网络”

手搓一个带微调功能的手写数字识别模型,真能学会深度神经网络的核心逻辑?本文从零实现三层卷积神经网络,完整代码开源,支持自定义数据微调,揭秘为何全连接网络搞不定图像任务——带你亲手验证CNN的威力!

2025-11-01 21:42:34 3583 3

原创 CPU、GPU、NPU、TPU:为什么AI不能只靠一种芯片?

AI不是靠“快”就能跑起来的——它需要合适的“腿”。CPU、GPU、NPU、TPU各有其道,训练与推理、云端与边缘、性能与功耗之间存在根本矛盾。本文系统拆解四类AI芯片的设计逻辑、适用边界与真实场景,帮你避开选型陷阱,看懂硬件背后的取舍哲学。

2025-10-31 14:35:30 763

原创 三个被低估的RAG优化技巧,让准确率从60%跃升至92%:最后一个99%的开发者都忽略了

RAG系统准确率长期卡在60%?不是模型不行,而是架构有硬伤。本文揭秘三个实测有效的优化技巧:智能分块、混合检索与重排序机制。最后一个技巧99%的开发者从未认真对待,却正是突破准确率天花板的关键。

2025-10-31 14:28:00 1021

原创 MiniMax M2:开源大模型落地革命,一起来看企业AI成本暴降的秘密

MiniMax发布M2开源大模型,在Agent和代码任务刷新SOTA,全球排名第五却登顶开源榜。价格仅Claude Sonnet的8%,速度提升近两倍。本文详解其MoE架构原理、部署避坑指南与企业落地案例,手把手教你用低成本实现高性能AI应用。

2025-10-30 13:31:47 1280

原创 MetaAI发觉Transformer可以获潜意识以3%成本换55%性能到底是怎么回事呢?

Meta AI最新研究《The Free Transformer》为模型植入“潜意识”决策层,仅增加3%计算开销即可显著提升代码生成与数学推理能力。本文深入解析其核心原理、实现路径及落地潜力,为AI工程实践提供新思路

2025-10-29 15:17:39 965

原创 稳得住,才跑得远:企业级AI Agent落地的三大支柱体系是什么呢?

AI Agent在电信等复杂企业中落地,远不止模型强弱。本文基于真实项目经验,拆解专业性、协作性、责任性与安全性四大挑战,并提出“多Agent协同架构+成长飞轮机制+安全轨道体系”三位一体的解决方案,揭示企业AI从“能用”走向“敢用”“好用”的底层逻辑。

2025-10-28 18:07:49 1020

原创 99%的注意力都在白算? 现在Meta新框架REFRAG如何让RAG快30倍还不掉准确率

你的RAG系统慢得像拖拉机?Meta最新研究指出,问题不在模型大小,而在99%的跨段落注意力根本没用。REFRAG通过块级压缩与智能展开,将首token生成速度提升30倍,准确率几乎无损。本文深入拆解其原理、实现与落地挑战。

2025-10-28 18:02:37 805

原创 2025智能体发展已经进入第3阶段了?企业发展Agent需要注意哪些核心竞争力?

2025年,企业竞争的核心不再是数据、流量或人力,而是谁能率先构建具备行动力、创造力乃至组织能力的AI智能体。本文系统拆解AI Agent五阶段演进路径,揭示从“副驾驶”到“自动驾驶”的质变临界点,并指出:仍停留在对话交互阶段的企业,正面临被全自主智能体颠覆的风险。

2025-10-26 18:48:45 1206

mnist手写数字训练集

mnist手写数字训练集,用于训练神经网络识别手写阿拉伯数字用。

2025-11-01

ibatis 开发指南

IBATIS官方教程(中文)

2007-09-14

fox999_workflow_features_2004A

银狐写的著名的工作流功能列表

2007-09-14

高杰的JBPM从入门到精通

JBPM是一个扩展性很强的工作流系统,百分百用JAVA语言开发,持久层采用Hibernate实现,理论上说,只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上

2011-04-04

Experience J2EE! Using WebSphere Application Server V6.1

IBM公司的Websphere application server6.1 红皮开发技术书之一(图文并茂),极适合初学者

2011-04-04

原版精美通向架构师的道路第十四天至第十七天Word文档

此为本人原版word文档,用于在公司内部作技术强化用,原名为“通向八段的道路”,因为本系列计划想写365天,研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师,自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。 本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”,而此次上传的为原版精排版word文档,带有目录和完整正确格式的文档,希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合,但是由于其是从linux/unix下编译过来的,因此它的一些目录与配置文件尚保留着linux/unix下的格式,比如说你装在d:\openssl目录下,它的conf文件内对于内带ca的引用还是/home/democa这样的格式,因此这些目录与资源的引用需要改成windows下的目录和路径相关。 为方便大家使用,我已经进行了相关的修改,大家下载此openssl for win后解压后直接在windows环境变量设置相关的: OPENSSL_HOME与openssl_conf 即可使用,为此我收取资源分1点!

2012-08-10

通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程

该Sample工程为通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力一文中所用的例子。它是基于ibm compute grid的批处理开发框架v.6.1.1.1.1基础上来开发的。 包含有用于读的样本文本文件、源代码与相关配置。

2013-01-15

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子,内含maven的pom.xml文件与build.xml

2012-12-03

SSH_Alpha工程人附属lib包

通向架构师的道路(第十八天)万能框架Spring(一)教程所属相关工程,大家可以下载下来后导入eclipse用,相关的lib目录下的jar文件已经删了,大家可以自行去下载spring3, struts1.3, hibernate3与jasypt,这些网上都是公开和免费的。我也上传了一份,我本意是大家自己去把这些包整合起来因为我已经发了jar list,不过因为是我整合的,因此收资源分1分

2012-10-22

通向架构师的道路第十八到第二十三天的例子

通向架构师的道路第十八到第二十三天的例子

2012-12-02

maven-ant-tasks-2.1.3.jar

maven-ant-tasks-2.1.3.jar

2012-11-19

hypersonic

hypersonic官方文档

2007-09-07

IBM RAD7.5开发指南part1(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

mod_jk for apache 2.2.x

mod_jk for apache 2.2.x

2012-08-18

spring in action

spring in action官方教程

2007-09-04

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

IBM RAD7.5开发指南part3(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

jbossgettingstart

jboss4.x getting start官方中文教程

2007-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除