- 博客(2106)
- 收藏
- 关注
原创 保姆级教程!命名实体识别(NER)训练实战:从数据到模型全流程,建议收藏。
命名实体识别(Named Entity Recognition,简称NER)是自然语言处理中的一项基础任务,它的目标是从文本中识别出具有特定意义的实体,并将其分类到预定义的类别中。这里解释下什么是实体?通常实体类别通常包括:组织名(ORG)、人名(PER)、地名(LOC)、时间(TIME)、数字(NUM)等。当然了,你也可以根据具体任务定义自己的实体类别。
2026-01-09 21:38:56
419
原创 硬核实战!如何用多智能体搭建全自动研究系统?(附详细流程与源码)
我们的研究系统使用多智能体架构,采用编排者-工作者模式,其中一个主要智能体协调过程,同时委托给并行操作的专门子智能体。多智能体架构的实际应用:用户查询流经一个主要智能体,该智能体创建专门的子智能体以并行搜索不同方面。当用户提交查询时,主要智能体对其进行分析,制定策略,并生成子智能体以同时探索不同方面。如上图所示,子智能体充当智能过滤器,通过迭代使用搜索工具收集信息(在本例中是关于 2025 年的人工智能智能体公司),然后将公司列表返回给主要智能体,以便其编译最终答案。
2026-01-09 21:37:40
425
原创 保姆级深度教程!从HITL实践出发,带你彻底搞懂Agent与设计模式的“对跖点”。
本文将围绕如何在 ReactAgent 中引入并实践 HITL(Human In The Loop,人机回路)机制展开,重点介绍实现方案及代码设计。并结合在做Agent基础平台期间,经历的一些agent的能力升级,对于Agent与工程设计之间存在的一些关联关系,分享一些个人观点。为什么需要HITL如果没有通用的人机协同,我们是如何解决人类在Agent问答中的参与过程:多轮对话式的追问,在系统提示词中定义,“当用户任务意图不明确时,立即停止任务,请求用户补充任务意图”。
2026-01-09 21:37:09
174
原创 别把Claude当玩具用了!Claude Skills深度指南:手把手教你打造“专家级”AI智能体!
Claude Agent Skills(技能)是一种可复用的文件系统资源,为Claude提供特定领域的专业知识、工作流程和最佳实践。与传统的提示词不同,Skills可以按需加载,无需在每次对话中重复提供相同的指导。
2026-01-09 21:36:33
282
原创 AI大模型必修课:Embedding深度解析(一),带你构建让AI理解世界的「语义地图」。
引言: 从搜索困境到语义理解不知道大家有没有这样的经历:在百度搜索时,因为关键词没选对而错过大量有用信息?或者在预订酒店时,明明描述很符合需求,却因为用词不同而被搜索引擎忽略?这就是传统的布尔逻辑和关键词匹配搜索已显现出显著的局限性。传统的搜索引擎往往依赖于精确的字词匹配,就像只会认字不会理解的伪人同事,难以捕捉查询背后的真实意图。传统的数据库只能进行精确匹配,而人类的大脑却是通过语义和关联来存储信息的。当我们想到"海滩度假",脑中浮现的是阳光、沙滩、泳池、放松等一系列相关概念,而不是死板的关键词匹配。
2026-01-09 21:34:55
378
原创 转行AI大模型必读:RAG技术深度实战(入门篇),拿下高薪Offer的第一步!
检索增强生成(Retrieval-Augmented Generation, RAG)是当前大语言模型应用中最重要的技术范式之一。本报告基于学术论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》和实践,系统性地阐述了RAG技术的理论基础、技术架构和工程实现。通过三个完整的工程案例——基于FAISS的ChatPDF系统、以及多模态迪士尼智能客服助手,本文章展示了RAG技术在不同场景下的具体实现方法和优化策略。研究表明,
2026-01-09 21:33:45
431
原创 一文深度讲解|如何构建起你的多模态AI知识库
简单来说,它本身就是一个多模态的AI知识库。通过AI技术,将在线链接、本地文件、甚至网盘里的音视频,深度解构为结构化的图文笔记、思维导图和可趣味学习播客。目前主要解决音视频方面的信息,文档类即将上线。主要功能音视频解析后默认生成一份重点:音视频解析这里大家可能会疑惑:AI总结出来的东西会不会太笼统?Ai好记也想到了这点,所以它最新的版本还提供了一套模版库。你可以让它以面试复盘专家的视角帮你复盘,或者用第一性原理分析专家帮你拆解概念。
2026-01-08 13:56:37
662
原创 【硬核干货】大模型知识融合革命:KGA框架让0.5B小模型打败72B大模型!
本文介绍大模型知识增强两大突破:KGA框架通过重塑注意力机制实现零参数、无训练的知识融合,解决知识过时和灾难性遗忘问题;Pythia-RAG构建统一多模态知识图谱,实现图文并茂的认知能力。这两项技术共同构建了从机制轻量化到模态多样化的知识增强进阶路径,为低成本、高效率的大模型知识更新提供了全新解决方案。
2026-01-08 13:56:02
488
原创 DataFlow:LLM 驱动的统一数据准备框架
维度贡献架构创新AutoOP 运行时捕获、细粒度检查点、LLM 资源自动管理算子生态近 200 个可复用算子,覆盖 Text/Math/Code/SQL/RAG/Knowledge智能编排DataFlow-Agent 支持自然语言 → 可执行 Pipeline效果验证6 条 Pipeline 在多项基准达到或超越 SOTA适用场景LLM 预训练语料清洗领域 SFT 数据合成(医疗/金融/法律)强化学习 CoT 数据生成RAG 知识库清洗与向量化。
2026-01-08 13:55:25
670
原创 大模型记忆进化论:从RAG到智能体架构,程序员必备技能!
本文系统梳理了AI智能体记忆研究脉络,提出以Forms-Functions-Dynamics为核心的统一分析框架。记忆形式包括Token-level、Parametric和Latent三种;功能分为事实记忆、经验记忆和工作记忆;动态机制涵盖形成、演化和检索三个过程。文章指出未来记忆系统将从"检索中心"走向"生成中心",实现自动管理和强化学习驱动的端到端控制,以支持多模态、多智能体协作与可信安全等复杂场景。
2026-01-08 13:54:51
456
原创 大模型部署踩坑实录:从“这有啥难的“到“我裂开了“!小白程序员必看避坑指南
大模型部署远非安装几个包那么简单。文章揭示了四大痛点:推理引擎选择困难、模型架构兼容性问题、参数裁剪导致的差异、以及上下文和并发限制处理。建议在模型与应用间增加中间层进行封装和转发,而非直接暴露模型接口,以确保系统稳定性和可用性。
2026-01-08 13:54:02
490
原创 LangChain 定义新赛道:Agent Engineering,让 AI 智能体从“能跑“到“可靠“
Agent 工程是将非确定性 LLM 系统迭代优化为可靠生产体验的过程。这是一个循环过程:构建、测试、发布、观察、优化、重复。这里的关键是,发布不是最终目标。它只是你不断前进以获得新见解并改进 Agent 的方式。要做出有意义的改进,你需要了解生产环境中正在发生什么。你越快地完成这个循环,你的 Agent 就会变得越可靠。产品思维工程数据科学两个根本性的转变使 Agent 工程变得必要。首先,LLM 足够强大,可以处理复杂的多步骤工作流。我们一直看到 Agent 承担整个工作,而不仅仅是任务。
2026-01-08 13:51:47
697
原创 爆肝一周!手把手教你搭建本地RAG系统,从环境配置到完整实现,大模型开发入门必看!
文章详细介绍了一个本地运行的生产级RAG系统构建过程,包括文档处理、嵌入生成、向量搜索和答案生成四大核心组件。使用FAISS、sentence-transformers和llama.cpp等开源工具,在消费级硬件上实现了高性能的文档问答系统。文章提供了完整的环境配置、代码实现和部署指南,帮助开发者从零开始构建一个能够处理文档、检索信息并生成答案的实用AI系统,并涵盖了测试优化和生产部署的考量。
2026-01-08 13:50:43
295
原创 深度长文 | 什么是 AI 智能体的“上下文工程”?(从原理到 6 大支柱全解析)!
大多数大语言模型(LLM)的演示一开始都让人感觉很有意思。它们可以起草邮件、重写代码,甚至规划假期行程。在最初的几分钟里,模型似乎真的“理解”了你扔给它的所有东西。但是,当任务变得混乱且真实时,这种滤镜就会破碎。当成功的关键取决于昨天的事故报告、团队的内部文档或一段冗长的 Slack 故障排查记录时,模型突然就开始跌跌撞撞了。它记不住十条消息前说过的话,无法访问你的私有数据,然后便开始胡乱猜测而不是进行推理。
2026-01-08 13:49:15
609
原创 保姆级教程!手把手教你掌握LangGraph两大高阶模式,大模型开发从此不再愁
文章详解了LangGraph智能体开发的两种高阶模式:协调器-工作者模式通过动态任务分解与委派,处理复杂不确定子任务;评估器-优化器模式通过生成-反馈-优化的迭代循环,持续提升输出质量。文中提供了完整代码示例,展示了如何构建专题报告生成和笑话优化智能体,有效增强智能体处理复杂任务的能力。
2026-01-08 13:48:20
490
原创 大模型多Agent实战教程(非常详细):Agno与LangGraph全方位对比,从原理到生产部署全解析!
Milvus在这里的作用是提供高性能的语义检索能力。当知识库助手收到一个技术问题,它会通过工具把问题转换为向量,在Milvus中找到最相关的文档片段,然后基于这些片段生成回答。Milvus提供了三种部署模式,可以根据业务需求选择合适的方案,代码层面的接口保持一致。上面的demo展示了基本用法,但如果要用于生产环境,还有几个架构层面的问题需要理解。
2026-01-07 15:08:01
281
原创 Forrester Wave™ 报告重磅发布:Zilliz 荣膺领导者象限!一文读懂全球向量数据库格局,收藏这篇就够了!
各位开发者和 AI 爱好者:我们有一些好消息想要和你们分享!
2026-01-07 15:06:44
234
原创 单Agent搞不定复杂任务?那是你没用双Agent!LangGraph+Milvus硬核实战,这篇干货太香了!
做agent简单,但是做能落地的agent难,做能落地的长周期agent更是难上加难!这是不是你搞agent开发时的常态?长周期 Agent落地失效,通常来说,会分两类典型模式:第一种发生在任务初期:收到“搭建类 claude.ai 的 Web 应用”这类高阶指令后,采用贪心策略一次性推进全量开发,执行中逐步丢失上下文,最终在功能开发半途耗尽上下文窗口;后续新实例面对无进度文档的半成品代码库,需要耗费大量精力梳理复盘,才能恢复应用基础功能。
2026-01-07 15:05:42
205
原创 炸裂汇总!2025收官硬核干货:380+页深度拆解RAG/Agent/MCP等9大核心,建议熬夜研读!
《AI工程指南2025》是一份384页的硬核技术手册,全面覆盖大模型工程化应用。内容包含LLM构建原理、Prompt工程、微调优化、RAG系统等9大核心主题,从底层原理到生产部署全链路打通。作者提供4阶段学习路径:10天初阶应用、30天高阶开发、30天模型训练、20天商业闭环,帮助开发者从入门到精通。该资料强调实战价值,包含代码示例和工程决策经验,适合希望掌握前沿AI技术的开发者免费获取学习。
2026-01-07 15:05:08
314
原创 Token 烧钱如流水?Eino Skills 神器登场!让 Agent 学会「按需加载」,彻底告别上下文过载!
面对复杂的业务逻辑,AI 助手不该是把所有说明书都背下来的“书呆子”,而应该是懂得根据任务按需查阅手册的“专家”。
2026-01-07 15:04:36
279
原创 大模型多Agent实战:Agno与LangGraph全方位解析,带你掌握快速落地生产的核心技术!
本文介绍了生产级多智能体框架Agno的特点及其与LangGraph的区别,并展示了如何快速部署知识库助手。Agno专为生产环境设计,提供从框架层到运行时层的完整解决方案,强调快速交付能力。与LangGraph相比,Agno采用声明式Workflow编排和内置Memory系统,更适合需要快速迭代的场景。文章详细演示了结合Milvus向量数据库的知识库助手实现,包括部署步骤、核心代码和效果测试。Agno通过AgentOS运行时层简化生产部署,开发者无需自行处理API服务和并发控制,即可将本地开发的智能体快速转化
2026-01-07 15:03:58
362
原创 LangGraph年度压轴总结!以ReAct视角构建知识体系全景图,看完这篇你就彻底懂了!
•横向维度:State管理、Workflow控制、Graph配置三大功能维度•纵向维度:基础层、应用层、高级层三个学习层次•框架映射:三大维度在ReAct的思考、行动、观察三个阶段中各有侧重,相互配合理解这个知识体系,有助于我们在构建Agent时更有章法,也让我们明白每个知识点在Agent工作流程中的实际作用。希望这篇总结能帮助大家更好地掌握LangGraph,也期待与大家一起继续探索Agent开发的更多可能性~
2026-01-07 15:03:16
291
原创 大模型Agent实战教程(非常详细):深入理解ReAct架构,彻底搞懂稳定性难题!
摘要: ReAct Agent智能体以大模型为核心,通过任务拆解、工具调用和结果验证(thought-action-observer流程)处理复杂任务。然而,由于模型幻觉、工具不全等问题,其执行过程存在不稳定性。提升智能体性能需优化提示词设计,明确任务处理方法。文章还提供了大模型AI学习路径,涵盖应用开发、模型训练到商业落地的四个阶段,帮助开发者掌握前沿技术并实现业务价值。完整学习资料可通过优快云免费获取。 (150字)
2026-01-07 15:02:32
285
原创 别再给OpenAI送钱了!大模型自主化部署全方案,本地部署流程详解,省钱又安全!
模型本地部署是运维人员的基本技能,也是开发人员的基本技能。在大模型应用中,数据安全问题是很多企业关注的重点,特别是政务,金融,医疗等领域,对数据安全性有着更高的要求。因此,这时使用第三方模型服务就不再是一个好的选择,而本地部署模型就成了唯一的选择;但是,模型应该怎么部署呢?本地部署模型我们都知道大模型由于其庞大的参数和算法,需要进行大量的计算,而为了解决这个问题就需要大量的显卡来提升运算效率。显卡和CPU的区别就类似于小学生和大学生的区别;计算100以内的加法,不论是小学生还是大学生都可以解决;
2026-01-07 15:02:00
286
原创 【热评】“LLM是死路“!Meta前AI首席杨立昆创业新方向,AI程序员必看的技术革命
杨立昆(Meta前首席AI科学家)批评Meta内部AI研究管理问题,指责汪滔缺乏研究经验并干涉研究者工作;揭露Llama 4评测数据被美化导致祖克柏对团队失去信心;强调LLM不是通往超级智能的道路,他正转向基于世界模型(Advanced Machine Intelligence)的新研究路线,并计划年底离职创办AMI Labs。这反映了AI领域内大模型与传统研究方法的路线之争。
2026-01-06 16:13:55
616
原创 别再被“虚假快“迷惑!7个指标教你判断大模型服务真实性能,小白也能秒懂的AI开发干货!
文章详解评估大模型服务的7大核心指标:TTFT(首字时间)决定第一印象,TPOT(生成节奏)影响流畅度,TPS和吞吐量决定系统价值,QPS衡量并发能力,响应时间分布(p50/p95/p99)反映长尾问题,错误顺序锁定系统瓶颈,资源利用率提供因果线索。从用户感知、系统产能和稳定性三个层面,帮助开发者全面评估大模型服务体验。
2026-01-06 16:13:13
1444
原创 Dify二开系列:从LightRAG到多模态RAG,全能化进化之路
最近小T年底了,事情好多好忙。本来想着这篇文章年后再写,但还是抽时间把这个多模态RAG的方案整理出来。如果你也在做RAG系统,正好遇到表格和公式的问题,这篇应该能帮到你。
2026-01-06 16:11:48
917
原创 爆肝程序员必看!RAG 2.0实战全攻略:从零构建企业级AI原生投诉系统,小白也能秒变AI架构师!
RAG 2.0通过混合检索、重排序、多模态、图结构、Agentic编排与安全可信技术,构建可落地的检索增强系统。针对投诉处理场景,文章提出"理解—证据—约束—辅导"的AI原生架构,将RAG 2.0作为证据层和决策编排层,实现可追溯的证据与受约束的行动方案。系统分为索引层、检索层、排序层、编排层和治理层,并提供了从混合召回+重排开始的MVP实施路线,最终实现企业级AI原生投诉处理系统。
2026-01-06 16:10:43
987
原创 震惊!AI大模型不是越大越好!ICML 2025最新研究:中小模型+海量文档=性能开挂,小白也能懂的省钱攻略
这篇文章介绍了一篇ICML 2025论文,研究发现通过扩大检索语料库,中小型模型的表现可以赶上甚至超过只依赖少量资料的大型模型。性能提升的关键在于扩大文档库增加了检索到正确答案的概率,而非模型利用上下文效率的改变。研究还发现不同尺寸模型从语料库扩展中受益不同,中等规模模型获益最显著。这一发现为资源受限环境下部署RAG系统提供了极具价值的指导,指出与其投入巨资升级模型,不如优先考虑扩大和优化文档库,可能是性价比更高的选择。
2026-01-06 16:09:45
658
原创 爆肝拆解TradingAgents项目!LLM在AI投研中到底扮演什么角色?小白程序员也能懂的金融AI实战
本文深度剖析TradingAgents项目中LLM在AI投研的应用机制,聚焦基本面分析师角色。通过拆解项目实现,揭示LLM如何获取并处理公司财务数据,生成投资分析报告。文章指出,当前LLM投研模式可能缺乏横向对比能力,存在局限性,同时解析了get_fundamentals等关键工具的数据来源与处理方式,为开发者理解AI投研系统提供实用视角。
2026-01-06 16:09:07
588
原创 [特殊字符]【爆肝整理】RAG技术详解:让AI不再“一本正经胡说八道“,程序员必备的AI增强技能!从此小白也能秒懂大模型知识增强!
RAG(检索增强生成)是结合大语言模型内部知识与外部知识库的技术,通过检索获取相关资料,再在生成阶段融合两种知识提升输出准确性。相比微调,RAG成本低、时效性强、可追溯,适合需要专业知识或实时数据的场景。开发者可通过LangChain等工具快速构建系统,并通过评估指标持续优化。尽管面临"RAG已死"争议,但其核心思想将持续演进。
2026-01-06 16:08:35
944
原创 真香警告!上下文工程才是AI开发未来,RAG已死?大模型开发者必看!
文章探讨了AI应用开发从"炼金术"到"工程学"的转变,指出当前行业对RAG概念的过度简化,提出"上下文工程"才是关键。通过实验揭示了"上下文腐烂"现象:输入信息越多,模型表现反而越差。文章介绍了两阶段检索策略(先粗筛再精炼)和生成式基准测试方法,强调质量比数量重要,专注是构建可靠AI应用的护城河。
2026-01-06 16:03:30
857
原创 从人工智障到真香!LLM三重觉醒:Tool+Plan+Memory让大模型开窍,小白程序员也能秒变大神
文章揭示了LLM通过三大核心能力实现"觉醒":Tool能力让LLM连接外部世界,突破时间和能力边界;Plan/Reason能力赋予深度推理和规划能力,从直觉转向系统思考;Memory能力实现持续学习和成长,从无状态变为有状态。这三大能力相互交织,使LLM从封闭模型转变为开放智能体,未来还将通过多Agent网络实现集体智慧涌现。
2026-01-06 16:02:51
642
原创 懒人福音!2025年Agent工具大盘点,小白程序员也能秒变AI大神!
文章详解2025年"Agent元年"趋势,分类整理25款AI Agent工具,涵盖面向普通用户的零代码工具、面向开发者的开发平台及面向企业的解决方案。这些工具能高效完成数据分析、内容创作、网站开发等任务,零基础也能轻松驾驭,已从技术玩具转变为人人可用的效率助手,是小白程序员提升工作效率的必备神器。
2026-01-06 16:02:18
373
原创 【AI炸场】英伟达开源NitroGen大模型,AI玩转1000款游戏,程序员:这波我直接“封神“!附完整代码+教程!
英伟达开源了名为NitroGen的大模型,该模型能直接以游戏视频帧为输入,输出手柄操作信号,支持后训练,具备跨游戏泛化能力。模型融合了互联网规模视频-动作数据集、多游戏评测环境和统一视觉-动作策略模型三大要素。数据集来源于40,000小时游戏视频,覆盖1,000余款游戏。实验表明,NitroGen在多种游戏中表现出较强能力,并能有效迁移到新游戏,最高实现52%的相对提升,推动通用具身智能体研究发展。
2026-01-05 16:46:34
946
原创 “AGI“别再忽悠人了!2025大模型真相:成本降10倍,效率范式转变,这才是程序员该关注的!
2025年大模型领域迎来重大突破:DeepSeek证明大模型训练不再唯GPU论;推理能力成为Scaling Law第二曲线;多智能体系统Manus展现新范式;工作流与Agent融合成趋势。未来竞争将聚焦推理成本、多模态能力和数据质量。建议开发者关注应用而非模型,垂直领域存在机会,保持谦逊学习态度。AI发展比想象中既快又慢,技术迭代加速但商业价值兑现需要时间。
2026-01-05 16:45:48
862
原创 “结构没搭完“你的RAG就废了!7层架构图带你从入门到大神,小白程序员也能秒懂大模型检索增强生成!
《RAG实战课》作者咖哥详解RAG系统七层架构框架,强调从"能用"到"工程化"的系统演化。七层包括:数据导入与文本分块、Embedding混合表示、索引与向量库、查询侧处理、检索后处理、生成优化和系统评估。作者指出,没有完整结构的RAG系统在规模化时会失效,这张架构图回答的不是"用什么技术",而是"系统迟早会走到哪些结构层",是RAG系统从Demo走向真正工程化的关键指南。
2026-01-05 16:45:05
1017
原创 AI从“查字典“到“会思考“:Agentic RAG技术让大模型开发迎来认知革命!小白程序员速来围观!
本文介绍了RAG技术及其升级版Agentic RAG的演进历程。传统RAG存在单次检索、缺乏记忆、被动响应等局限,而Agentic RAG通过记忆系统、任务规划、工具调用和循环推理等核心技术,实现了多轮检索反思、任务分解调度、外部工具集成和闭环学习等突破,使AI从被动检索升级为主动思考,未来将向企业数字员工、科研助手等方向发展。
2026-01-05 16:44:30
801
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅