- 博客(954)
- 资源 (19)
- 收藏
- 关注
原创 来看实现零人类数据下的大模型自我演进,这讲得到底是什么呢?
斯坦福等团队提出 Agent0 框架,在完全零人类标注数据的前提下,通过双智能体协同对抗与工具集成,让大模型实现自我演进。本文系统拆解其机制、实验效果与工程细节,并结合笔者在企业大模型落地中的经验,探讨这一范式对实际应用的深远意义。
2025-11-24 19:02:43
596
原创 RAG知识库评估框架应该有点什么呢?
本文系统介绍了一套可量化、可复现、可对比的RAG知识库评估框架,围绕Recall Score、Correctness与Groundedness三大核心指标,结合真实企业研发场景,详细阐述如何从“凭感觉”走向科学评估。笔者通过构建轻量级评测Pipeline,验证了该框架的有效性,并分享了后续优化路径与实践经验。
2025-11-24 18:52:08
400
原创 重磅:手把手教你把paddleocr-vl做成mcp使其在DIFY里运行
本文详解如何将国产顶尖多模态 OCR 模型 PaddleOCR-VL 封装为标准 MCP(Model Calling Protocol)服务,并通过自研的 HTTP-based MCP Client 接入 Dify 1.10,实现 AI Agent 在对话中自动识别并调用 OCR 能力。该方案已在某头部保险公司真实业务流程中落地,使用了当前最先进的“Agentic AI 原生”设计思想。
2025-11-23 22:10:47
933
原创 BERT 和 GPT,谁才是你该用的大模型?——从原理到落地场景的深度拆解
BERT 与 GPT 是当前 NLP 领域两大基石模型,一个擅长理解,一个长于生成。本文将从底层架构、训练机制、适用场景到企业落地实践,系统剖析二者差异,并结合笔者多年工程经验,告诉你何时该选 BERT,何时该用 GPT,以及如何在真实业务中做出最优技术选型。
2025-11-21 14:31:58
1038
原创 GPU 空转 96%?看TiDAR团队 如何榨出近 6 倍推理速度而不牺牲质量
你的 LLM 推理慢,不是因为 GPU 不行,而是因为 96% 的算力在发呆。英伟达华人团队提出 TiDAR 架构,利用“空闲 Token 槽”在一次前向中并行生成多个 token,吞吐提升近 6 倍且质量无损。本文深入剖析其原理、优势、限制及对推理系统架构的颠覆性影响,为大模型落地提供新思路。
2025-11-21 14:25:51
652
原创 AI 编程没有取代程序员,它在放大你的技术领导力
过去一年我深度使用 AI Coding 工具完成各类项目,逐渐意识到:AI 并非替代程序员,而是将工程师的技术领导力——架构设计、任务拆解、问题诊断与团队引导能力——前所未有地放大。这篇文章系统拆解这一认知的形成过程、实践方法与底层逻辑。
2025-11-20 16:00:08
916
原创 AI的下一场胜负手,不在规模而在“小而专”的智能体
当万亿参数的大模型逐渐陷入成本与实用性的泥潭,企业真正需要的,不再是能写诗的“通才”,而是能精准完成报销、对账、审批等具体任务的“专家助理”。本文系统剖析为何AI落地的关键正从“大”转向“小而美”,并结合多智能体协同架构、业务流程嵌入逻辑与真实ROI重构,为企业大模型实践者提供一条务实可行的路径。
2025-11-20 09:50:31
769
原创 AI Agent同质化危机:企业如何跨越“伪智能”陷阱?
企业AI Agent项目正经历严重疲劳症,40%项目面临取消。表面繁荣下隐藏着同质化陷阱——巨头产品底层均依赖相同模型,真正具备自主能力的供应商仅130家。本文剖析Agent Washing现象背后的技术断层与商业价值缺失,指出从Demo到生产级落地的核心挑战,为企业提供穿越炒作周期的实战路径。
2025-11-20 09:43:22
962
原创 AI 的真正瓶颈不是算力,而是我们还没搞懂“怎么学”
Sam Altman 在最新访谈中直言,AI 领域最大的难题不是数据耗尽或算力不足,而是“学习效率”远逊于人类。本文系统拆解他提出的九大核心议题,结合工程实践与教育变革视角,深入探讨为何“AI 系统防护”被严重低估、开发者角色将如何重构、以及我们该如何为“AI 原住民”时代重新设计知识体系。这不是一篇技术综述,而是一份面向落地的思考地图。
2025-11-19 10:05:06
879
原创 小模型干大事:一起来看义团队提出“环境Scaling”新范式到底是什么原理
通义团队提出“环境Scaling”新范式,通过自动构建可验证的模拟环境,让30B参数模型在工具调用任务中媲美万亿级大模型。本文深入拆解其原理、方法与实践价值,告诉你为何“环境多样性”才是代理智能成长的关键。
2025-11-18 15:49:20
614
原创 Transformer 与 MoE 不是二选一,而是“谁在干活”和“怎么派活”的关系
你以为 MoE 是 Transformer 的替代者?错了。它们根本不在同一维度。本文讲清 Transformer 如何处理序列信息,MoE 又如何通过“动态派活”实现高效扩容。告诉你什么时候该用哪种结构,以及为什么顶级模型都在悄悄组合使用二者。看完你就明白,大模型的真正秘密不在参数量,而在调度机制。
2025-11-18 10:42:27
960
原创 QSVD:用一次SVD手术,让视觉语言模型提速13倍、精度反升10%
纽约大学新提出的QSVD算法,通过对Q、K、V权重矩阵联合做奇异值分解,并结合跨层秩分配与低秩量化技术,首次在压缩视觉语言模型的同时实现精度提升。实测显示,在普通RTX 4070上推理速度提升13.1倍,KV缓存减少80%以上——这可能是VLM走向端侧部署的关键一步。
2025-11-18 10:30:04
854
原创 AI Agent淘汰的到底是什么?是这种工作模式!
AI编程早已超越自动补全。如今的AI Agent能理解需求、规划任务、执行开发甚至自我修复,正在重构软件工程的底层逻辑。本文系统剖析Agent如何从工具演变为执行主体,揭示“提示驱动开发”新范式,并拆解单Agent与多Agent战术选择、效能提升路径、七大落地场景及技术内核。这不是程序员的末日,而是“人机协作”新时代的开端——被淘汰的,是只写代码不思考的工作模式。
2025-11-16 18:17:21
621
原创 paddleocr-vl全网唯一最全本地化布署教程
本文详解 PaddleOCR-VL 本地化布署全过程,指出为何在真实生产环境中 PaddleOCR-VL 更稳定、更易部署、更贴近工程落地。同时还会详细比较与 DeepSeek-OCR 的核心差异,为全网独家介绍paddleocr-vl的本地部署实战指南。
2025-11-16 04:25:07
2378
10
原创 深度搜索 ≠ RAG:厘清两种“智能检索”技术的本质差异与协同可能
你是否以为“深度搜索”只是RAG的另一种叫法?其实两者目标、架构和适用场景截然不同。本文从原理出发,拆解Deep Search如何优化检索本身,而RAG如何用检索增强生成;并结合笔者在Agent与RAG项目中的实战体会,说明何时该用哪种技术——甚至为何它们常常要一起上。
2025-11-14 13:46:45
1149
原创 为什么说MCP是金融AI落地的“最后一公里”协议?
为什么说MCP正在成为金融大模型落地的关键基础设施?本文从协议原理、行业痛点、实施路径到真实价值,系统拆解Model Context Protocol如何打通AI与金融系统之间的语义鸿沟,并给出笔者在实践中对数据结构化、权限治理与工具设计的深度思考。如果你正在规划企业级AI应用,这篇文章值得你读完。
2025-11-14 10:33:44
953
原创 DeepSeek-OCR 安装全指南:从 Transformers 到 vLLM,手把手教你跑通企业级 OCR
本文系统讲解 DeepSeek-OCR 的两种部署方式——基于 Hugging Face Transformers 的标准推理与基于 vLLM 的高性能加速推理。详细说明 CUDA 与 PyTorch 版本匹配、环境验证、依赖安装等关键细节,并提供可直接运行的完整代码示例。无论你是单卡调试还是高并发服务部署,都能在这里找到清晰路径。
2025-11-12 11:16:36
1401
原创 AI教母李飞飞:下一站不是更大语言模型,而是能“看懂”世界的空间智能
为什么李飞飞坚持认为 AI 的极限不在语言?本文系统拆解“空间智能”的核心逻辑、技术挑战与落地路径,揭示大模型之后 AI 真正需要补上的关键一课——理解物理世界。从 ImageNet 到世界模型,这不仅是学术转向,更是企业级 AI 落地的下一战场。
2025-11-12 10:20:00
1250
原创 传统媒体不做“守墓人”:从《时代》杂志使用AI一事看内容行业的智能体转型之路
102岁的《时代》杂志上线AI智能体,支持语义问答、多语言音频输出与多轮交互。这不仅是技术升级,更是传统内容机构在AI时代主动求变的缩影。本文拆解其技术架构、产品逻辑与战略意图,并结合笔者观察,探讨传统行业如何借力AI+延续核心优势,避免沦为数字浪潮中的“活化石”。
2025-11-12 10:12:59
798
原创 User Prompt 与 System Prompt:大模型沟通的“双引擎”机制深度拆解
你给AI的指令,真的说清楚了吗?为什么同样的问题,别人能得到惊艳答案,你却只收到平庸回复?关键不在模型,而在提示词。本文系统剖析 User Prompt 与 System Prompt 的本质差异、作用边界与协同逻辑,结合工程实践与认知原理,揭示如何通过“双提示”设计让大模型真正为你所用。
2025-11-12 10:05:54
1177
原创 Agent规划模块揭秘:为何大模型不能真正“自主思考”?
别被“智能规划”骗了!当前主流 Agent 系统的 Planning 模块,绝大多数是人写死的逻辑+模型填空。本文从工程实践出发,拆解 Planning 的真实实现机制、为何不能全靠 LLM、何时该硬编码、何时可放手,并结合主流框架与落地案例,讲透“可控”与“灵活”的平衡之道。
2025-11-11 17:11:20
636
原创 AI大神认为:真正能干活的智能体还要十年?这是怎么一回事呢?
卡帕西直言当前大模型只是“认知小孩”,离替代实习生还有至少十年。本文系统拆解其核心判断——从“数字幽灵”的本质、强化学习的失效、模型坍缩的硬伤,到“小而精认知核心”的未来路径,并结合笔者在企业落地中的真实体会,揭示为何2025绝非智能体元年。
2025-11-11 16:56:32
953
原创 开源模型登顶?Kimi K2 Thinking 实测解析:它真能超越 GPT-5 吗?
Kimi K2 Thinking 以 1 万亿参数、INT4 量化推理和超长工具调用链,首次在多项基准测试中超越闭源模型。本文实测其编程、搜索、写作与智能体能力,拆解其技术原理,并探讨国产开源大模型是否真正迎来“登极”时刻。
2025-11-09 19:22:02
1328
原创 AI Agent落地的真相:90%的企业都在错把“工具”当“主角”
别再迷信模型参数了!真正阻碍AI Agent在企业落地的,从来不是技术瓶颈,而是人、流程和价值闭环。本文从真实调研出发,拆解三大核心障碍、三类Agent形态、三种落地策略,并分享笔者多年实践中踩过的坑与悟出的道——AI要融入工作流,而不是打断它。
2025-11-09 19:10:28
590
原创 多模态大模型能“看图识字”,但为何干不了OCR的活?
Qwen-VL、GPT-4o这类多模态模型确实能“读懂”图片里的文字,但它们真能取代OCR吗?本文从技术原理、精度表现、鲁棒性、部署成本到输出结构等维度系统拆解,揭示为何在企业级文档处理中,OCR仍是不可替代的基础设施。别被“全能AI”的光环迷惑——理解语义 ≠ 忠实转录。
2025-11-09 16:52:56
950
原创 RAG 不只是“查片段”——让大模型真正“看懂整个知识库”的新框架来了
现有 RAG 系统擅长回答“局部事实”,却在“全局洞察”类问题上频频翻车。复旦团队首次定义“全局 RAG”能力,并发布首个测评基准 GlobalQA,同时提出无训练的 GlobalRAG 框架,在 Qwen2.5-14B 上 F1 分数达 6.63,远超最强基线(1.51)。本文深入拆解其原理、设计与实战启示,助你突破企业级知识问答的瓶颈。
2025-11-09 16:38:56
689
原创 从云端跌落:为什么中国IT可以把外企IT甩出两条街以上
外企IT曾是技术圣地,如今却因僵化流程、决策滞后与技术脱节,在中国速度面前沦为“反向教科书”。本文揭示:当本土企业用钉钉三小时修复漏洞、靠云原生扛住双11洪峰时,外企仍在为开个防火墙端口等邮件审批。技术人的黄金时代不在咖啡杯里,而在能真实解决问题的代码中。选对战场,别让流程锈蚀你的锋芒。
2025-11-08 22:50:41
947
原创 第1课-通过DIFY实现一个完整的Text2Sql来讲AI原生及Agentic RAG长什么样
《2025最前沿AI Agent讲武堂》第一课来了!手把手用 Dify 实现一个具备自主推理、工具调用与错误修正能力的 Text2SQL 应用,带你亲眼看看真正的 AI 原生架构和 Agentic RAG 在落地时长什么样。
2025-11-08 22:34:58
1772
原创 金融RAG落地之痛:不在模型,而在数据结构
RAG在金融行业落地效果不佳,根源往往不是大模型能力不足,而是数据本身的复杂性被低估。本文深入剖析金融文档解析、语义切分、合规约束、评估体系等五大核心挑战,并结合实战经验给出可落地的工程解法——真正的难点,从来不是算法,而是如何把非结构化的金融信息变成模型“看得懂”的结构化知识。
2025-11-06 10:00:20
917
4
原创 LlamaIndex 到底是不是 RAG?别再搞混框架、范式和组件了
你以为 LlamaIndex 是个新技术?其实它只是帮你搭 RAG 系统的“乐高积木”。本文手把手带你厘清 LlamaIndex、RAG 和 Rerank 三者的本质区别,并附完整可运行代码,让你在企业落地大模型时少走弯路。
2025-11-03 10:17:49
643
原创 敲黑板!7类神经网络到底能干啥?一张表看懂谁适合你的业务场景
别再把神经网络当万能药!本文用10+个真实生活场景,告诉你CNN、Transformer、GNN等模型到底适合解决什么问题,哪些场景硬上神经网络反而低效、不稳定甚至失败。从手机相册分类到刷脸支付,从智能客服到异常检测,说透原理、优劣与边界,助你精准选型,少走弯路。
2025-11-02 14:45:07
626
原创 别被“智能体”忽悠了!企业落地AI Agent绕不开的三大生死关
AI Agent热潮之下,66%的企业卡在“结果不可靠”上。本文深入剖析企业应用Agent时面临的可靠性、安全性与成本效益三大核心挑战,结合真实架构设计与落地经验,给出可复用的解决方案——从大小模型协同、RAG知识注入到最小权限控制与小场景切入策略,帮你避开陷阱,真正让Agent成为生产力而非负担。
2025-11-02 14:32:14
611
原创 通过神经网络手搓一个带finetune功能的手写数字识别来学习“深度神经网络”
手搓一个带微调功能的手写数字识别模型,真能学会深度神经网络的核心逻辑?本文从零实现三层卷积神经网络,完整代码开源,支持自定义数据微调,揭秘为何全连接网络搞不定图像任务——带你亲手验证CNN的威力!
2025-11-01 21:42:34
3583
3
原创 CPU、GPU、NPU、TPU:为什么AI不能只靠一种芯片?
AI不是靠“快”就能跑起来的——它需要合适的“腿”。CPU、GPU、NPU、TPU各有其道,训练与推理、云端与边缘、性能与功耗之间存在根本矛盾。本文系统拆解四类AI芯片的设计逻辑、适用边界与真实场景,帮你避开选型陷阱,看懂硬件背后的取舍哲学。
2025-10-31 14:35:30
763
原创 三个被低估的RAG优化技巧,让准确率从60%跃升至92%:最后一个99%的开发者都忽略了
RAG系统准确率长期卡在60%?不是模型不行,而是架构有硬伤。本文揭秘三个实测有效的优化技巧:智能分块、混合检索与重排序机制。最后一个技巧99%的开发者从未认真对待,却正是突破准确率天花板的关键。
2025-10-31 14:28:00
1021
原创 MiniMax M2:开源大模型落地革命,一起来看企业AI成本暴降的秘密
MiniMax发布M2开源大模型,在Agent和代码任务刷新SOTA,全球排名第五却登顶开源榜。价格仅Claude Sonnet的8%,速度提升近两倍。本文详解其MoE架构原理、部署避坑指南与企业落地案例,手把手教你用低成本实现高性能AI应用。
2025-10-30 13:31:47
1280
原创 MetaAI发觉Transformer可以获潜意识以3%成本换55%性能到底是怎么回事呢?
Meta AI最新研究《The Free Transformer》为模型植入“潜意识”决策层,仅增加3%计算开销即可显著提升代码生成与数学推理能力。本文深入解析其核心原理、实现路径及落地潜力,为AI工程实践提供新思路
2025-10-29 15:17:39
965
原创 稳得住,才跑得远:企业级AI Agent落地的三大支柱体系是什么呢?
AI Agent在电信等复杂企业中落地,远不止模型强弱。本文基于真实项目经验,拆解专业性、协作性、责任性与安全性四大挑战,并提出“多Agent协同架构+成长飞轮机制+安全轨道体系”三位一体的解决方案,揭示企业AI从“能用”走向“敢用”“好用”的底层逻辑。
2025-10-28 18:07:49
1020
原创 99%的注意力都在白算? 现在Meta新框架REFRAG如何让RAG快30倍还不掉准确率
你的RAG系统慢得像拖拉机?Meta最新研究指出,问题不在模型大小,而在99%的跨段落注意力根本没用。REFRAG通过块级压缩与智能展开,将首token生成速度提升30倍,准确率几乎无损。本文深入拆解其原理、实现与落地挑战。
2025-10-28 18:02:37
805
原创 2025智能体发展已经进入第3阶段了?企业发展Agent需要注意哪些核心竞争力?
2025年,企业竞争的核心不再是数据、流量或人力,而是谁能率先构建具备行动力、创造力乃至组织能力的AI智能体。本文系统拆解AI Agent五阶段演进路径,揭示从“副驾驶”到“自动驾驶”的质变临界点,并指出:仍停留在对话交互阶段的企业,正面临被全自主智能体颠覆的风险。
2025-10-26 18:48:45
1206
高杰的JBPM从入门到精通
2011-04-04
Experience J2EE! Using WebSphere Application Server V6.1
2011-04-04
原版精美通向架构师的道路第十四天至第十七天Word文档
2012-10-22
openssl for win
2012-08-10
通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程
2013-01-15
通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子
2012-12-03
SSH_Alpha工程人附属lib包
2012-10-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅