自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1697)
  • 收藏
  • 关注

原创 你的LangChain还在“走直线”?早过时了!LangGraph来了,让Agent学会“拐弯”和“记忆”!

前面九篇文章,我们用Chain构建了各种应用:RAG问答、Agent工具调用、数据分析。Chain确实很强大,但它有个根本性的限制:**执行路径是固定的有向无环图(DAG)**。

2025-11-26 14:38:49 399

原创 硬核长文!LangGraph高级实战:揭秘动态Prompt与反馈循环,如何让AI Agent摆脱“新手村”!

代理系统或者 RAG 方案,基本都需要一个双层记忆架构,这样 LLM 既能保持对当前上下文的专注,又能记住过往交互的内容。短期记忆负责单个会话内的即时信息管理,长期记忆则跨会话存储知识,让系统能够持续学习和进化。两者配合,代理才能表现出连贯性、上下文感知能力,看起来更加智能。这些记忆组件在现代 AI 架构中的位置如下图所示:

2025-11-26 14:37:25 409

原创 告别“无效提问”!我用这套方法,让AI从“瞎猜”进化到“深度思考”,我把方法整理成了万能公式!

近年来,大型语言模型(LLM)领域出现了新的分化趋势:**通用大模型**与**推理大模型**。通用模型(如GPT-4、DeepSeek-V3等)擅长广泛的语言任务,而推理模型(如OpenAI的O1/O3系列、DeepSeek-R1等)则在复杂逻辑推理上表现卓越。这种能力上的差异直接影响了我们与模型交互的方式——即**提示词(Prompt)**的设计策略。一个常见的疑问是:为什么在使用推理模型时,我们往往不需要像通用模型那样明确指定模型扮演的角色?本文将深入剖析这两种模型的核心区别,并据此探讨提示词设计的差

2025-11-26 14:35:24 207

原创 5分钟上手!手把手教你用LLM打造一个专属的SQL小助手,附完整代码!

如何高效的利用数据库里面的相关信息,十分重要,“Text-to-SQL”是从数据库中获取知识的重要手段。具体代码参考如下(建议大家在沙箱中运行):

2025-11-26 14:34:30 584

原创 MCP终极指南:AI产品经理必看!一文搞懂“上下文操作系统”的过去、现在和未来!

你有没有遇到过这些场景?* 开发Agent时,发现模型会忘了之前的操作步骤;* 多个工具调用状态丢失,导致任务中断;* 不同AI系统协作时,上下文无法传递,各自为战;* 想让AI记住用户偏好,却只能靠Prompt?

2025-11-26 14:32:58 505

原创 万字长文深度复盘:AI Agent的“前世今生”,揭秘驱动其爆发的三大核心技术!

人工智能(AI)作为现代科技的核心领域之一,其发展历程中,AI Agent(智能体)扮演了至关重要的角色。AI Agent是指能够在特定环境中感知、推理、学习和行动的软件或硬件系统,其目标是实现自主决策和任务执行。

2025-11-26 14:29:34 486

原创 我用Retrv-R1,把多模态检索速度提了3倍,成本降了一半!这套NeurIPS新方法,老板当场给我加薪!

搭建跨模态检索系统时,有两个难题:一是处理图文混合候选集时,token数量爆炸导致GPU直接内存溢出;二是用RL训练模型时,要么收敛不了,要么推理过程漏洞百出,检索准确率始终上不去。直到看到这篇 NeurIPS 2025 的 Retrv-R1 论文,才发现原来不用复杂架构,只要针对性解决“信息冗余”和“训练不稳定”两个核心痛点,就能让多模态检索的准确率和效率同时突破瓶颈——这篇研究给出了新的技术方案,更提供了“推理驱动检索”的全新思路。

2025-11-26 14:27:27 312

原创 AI就绪 vs AI Native:不是升级,是换物种!这才是企业转型的“底层逻辑”!

那么如何将这些方法应用于企业AI项目实践呢?那么今天我想和大家分享企业AI战略的演变之路:从"AI就绪"到"AI原生"。

2025-11-25 17:19:52 431

原创 智能Agent系统:AI驱动的任务自动化解决方案

在当今快速发展的AI时代,如何让AI真正帮助我们完成各种复杂任务?GoBot的智能Agent系统给出了一个革命性的答案。这个系统不仅仅是一个编程工具,而是一个基于多Agent协作的智能任务助手,能够理解用户需求、制定执行计划,并通过整合各种工具(包括MCP协议和自定义RPA工作流)来完成用户的任务。

2025-11-25 16:15:02 973

原创 你的Agent为什么又慢又贵?因为你还在用LLM“大炮打蚊子”!SLMs才是精准打击的“狙击手”!

过去几年,大模型(LLM)像“万能插件”一样被应用在各种 Agent 里:代码 Agent、检索 Agent、行动规划 Agent……但实际工程实践更接地气:

2025-11-25 16:04:47 427

原创 告别“调包侠”!理解RAGFlow切分原理,是你成为RAG架构师的“第一道坎”!

书籍文件往往篇幅巨大、结构复杂,不同章节、目录、致谢等混杂在同一文档中。RAGFlow 在处理 book 类文档时,整合了多种解析器(docx、pdf、txt、html、doc),通过自动识别版面结构、过滤非正文、并结合视觉模型生成图片摘要,实现对长文档的精准切分与高质量抽取。本篇将带你逐步拆解源码,了解 RAGFlow 如何优雅地解析一本“书”。

2025-11-25 16:02:48 333

原创 你的RAG为什么总在胡说八道?根源不在模型,在语料!这套“洗稿”方法论,效果立竿见影!

要构建一个高准确率的RAG系统,首先需要解决的是语料数据的质量问题。**"垃圾进,垃圾出"(Garbage In, Garbage Out)**,无论我们的算法多么先进,如果底层的语料数据质量不佳,系统的表现也会受到限制。

2025-11-25 14:34:48 713

原创 你的RAG还在“无脑”检索?一文详解基于意图的智能路由,让它“读懂人心”!

在企业级 RAG系统的演进过程中,我们通常会经历两个阶段。第一阶段是“**建设期**”。在这个阶段,开发者的核心任务是将非结构化文档切分、向量化,并存入向量数据库。当用户提出问题时,系统通过语义相似度检索出 Top-K 个片段,喂给大模型生成答案。这套流程在处理“事实性问答”时,表现优异且成本低廉。

2025-11-25 14:33:19 518

原创 年薪百万的AI研究员,都在关注“慢思考”!浙大这篇EMNLP论文,是AI写作的“哲学拐点”!

本工作提出 OmniThink,一种模仿人类“慢思考”过程的机器写作框架,通过信息树(Information Tree)与概念池(Conceptual Pool)的迭代扩展与反思机制,突破大模型在生成深度与知识边界上的瓶颈,显著提升长文生成的知识密度(Knowledge Density)与创新性。

2025-11-25 14:27:32 650

原创 附完整代码!别再死啃理论了,这篇带你用高质量Context Pruning,让RAG效果立竿见影!

现如今,LLM的上下文窗口长度正在经历爆发式增长。翻开LLM Leaderboard,可以发现顶级模型的上下文长度已经陆续突破了1M tokens,并且这个数字还在不断刷新。

2025-11-25 14:25:33 727

原创 你的Agent还在“内卷”和“互撕”?万字长文,从原理到实践,教你打造高效协作的Agent军团!

人工智能技术的发展正在经历一场深刻的变革。从大语言模型(LLM)的突破,到检索增强生成(RAG)技术的成熟,再到AI智能体(Agent)系统的兴起,我们正站在一个全新的技术时代的门槛上。

2025-11-25 14:18:59 354

原创 想让AI团队“1+1>2”?秘密就在A2A!Agentic模式15深度解析,解锁智能体协作的终极密码!

内容来自Antonio Gullí的Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems一书。单个Agent在处理复杂的多方面问题时往往面临局限,即便它们具备先进的功能。为了解决这一问题,Agent间通信技术使得那些可能基于不同框架构建的各种人工智能代理能够有效协作。这种协作包括无缝的协调、任务分配以及信息交换。

2025-11-24 16:46:30 697

原创 别再让错误答案毁掉你的AI应用!Dify实战:5个技巧,将知识库准确率从60%提升到90%!

在企业知识管理中,你是否遇到过这些痛点:上传100页PDF后AI答非所问?员工查询政策文档需翻遍多个系统?知识库检索准确率不足50%导致AI“一本正经地胡说八道”?

2025-11-24 16:45:13 771

原创 废掉一个AI产品经理最快的方式:让他只知道ChatGPT!这100个Dify场景,才是你的“武器库”!

以下是Dify应用案例的分类整理,内容涵盖多个行业和应用场景。每个案例包含应用场景描述、技术实现要点及用户反馈/效果,展示了Dify在不同领域的多样化应用价值,旨在为各行业提供参考与借鉴。

2025-11-24 16:43:25 757

原创 格局打开!Function Calling只是“点”,MCP是“线”,A2A才是“面”!一文讲透AI交互的升维思考!

在这场关于智能体(AI Agent)的进化革命中,背后隐藏着三个关键“武器”:MCP(Model Context Protocol)、Function Calling和A2A(Agent to Agent protocol)。简单来说,MCP、Function Calling和A2A分别代表三种AI Agent和外界不同的协作方式:

2025-11-24 16:41:20 648

原创 还在为后端发愁?Streamlit+LangChain+GLM,三步搭建你的专属聊天机器人,无需一行后端代码!

这是一篇入门级大模型应用开发教程,适合后端开发工程师,数据工程师以及大模型应用开发工程师的动手实践教程。需要你具备一丢丢Python语言开发基础,但也仅仅需要基础。

2025-11-24 16:39:28 368

原创 本地知识库王者之战:Mia、Cheer Studio、AnythingLLM,终极对决,谁才是真正的“卷王”?

事实上perplexity的空间功能,元宝的分组,GPT的项目功能都有类似的知识库功能,但无法实现文件库本地化。下面将介绍标题中三种方法,其中Mia还是需要将文件上传至云端,且无法添加API,优点是大厂开发,稳定性更好,免费,不用买API。

2025-11-23 13:45:00 986

原创 月薪3K和30K的差距:一个用RAG,一个在用北大EAG-RL“思考病历”!

本工作提出 EAG-RL(Expert-Attention Guided Reinforcement Learning) 框架,通过专家注意力引导的强化学习,显著提升大语言模型在电子病历(EHR)推理任务中的内在临床推理能力与泛化性能。

2025-11-22 11:12:40 686

原创 RAG技术全解析:检索增强生成方法与优化,程序员必学技能,建议收藏!

RAG(检索增强生成)是一种结合知识检索和生成技术的方法,用于解决大模型无法解决的私域问题。其基本流程包括知识收集、检索和生成三个阶段。相比微调,RAG通过检索知识库生成回答,无需改变模型参数,避免了原有能力消失的风险,实现效率更高。文章还介绍了RAG的优化技巧和评估方法,为实际应用提供了指导。

2025-11-22 11:11:38 576

原创 干货收藏:商汤日日新大模型:赋能教育创新,教师必备AI工具

商汤"日日新"AI大模型为教师提供全方位教学支持:备课阶段通过"商量"精准获取资源,用"秒画"快速生成教学配图;课堂上视频理解助手提取关键内容并生成提问;课后拍照讲题功能辅助学生纠错,减轻教师负担。该模型显著提升教学效率,是教育智能化的得力助手,值得每位教师收藏使用。

2025-11-22 11:11:32 1047

原创 收藏向:一文看懂企业级Agent!从0到1搭建你的“生产力军队”,赢下这场暗战!

长假期间,OpenAI在2025 DevDay宣布了一系列开发者生态的重大升级,除了我们熟知的模型能力外(如Sora2 API),最引人瞩目的是在 ChatGPT 中引入的“Apps in ChatGPT”及其SDK,及AgentKit工具集。OpenAI正试图把它的ChatGPT助手与背后的模型全面升级为一个功能完备的AI应用构建与分发平台。

2025-11-22 11:11:25 678

原创 万字长文深度复盘!我如何用Dify把一个TB级知识库的文档分类工作,从一周缩短到一小时?

在知识库的使用场景中有这样一类需求,就是希望在同一个知识库里面,不同的人可以查看不同的文档内容。最常见的就是不同级别的人能够查看的文档范围是不一样的。在这里,我们结合Dfy的元数据给出了一种解决思路,并进行了两种方案设计,最终业务方的选择放到了文章结尾的位置。

2025-11-22 11:10:37 798

原创 “你的AI项目为什么迟迟不能上线?”Dify、Coze、LangChain…选错工具,神仙也救不了!

用智能体做一人公司,致力于帮助100W人用智能体创富~现在的AI已经不满足于简单对话了。它们开始自己思考,能规划任务,还会主动调用工具。

2025-11-22 10:58:12 783

原创 保姆级教程!手把手带你吃透上下文工程,核心技巧+避坑指南+代码示例!

上下文工程(Context Engineering,简称 C.E.)是一个系统性的学科,旨在设计、优化和管理提供给大型语言模型(LLMs)的信息载体,从而提升模型性能。上下文工程的分类法主要可以从两个维度进行详细阐述:技术实现维度(基础组件与系统实现)和功能目的维度(上下文类别与操作策略)。

2025-11-22 10:56:27 571

原创 【万字长文】AI Agent“四件套”保姆级教程:从大模型到工具使用,一篇打通你的任督二脉!

AI Agent作为当前人工智能领域的前沿技术,其核心组成部分包括大模型、感知技术、记忆组件和工具的使用。这些技术不仅各自在AI领域具有重要地位,而且相互协同,共同推动AI Agent向更高层次的智能化发展。

2025-11-22 10:54:40 611

原创 (保姆级教程)顶会风向标!手把手教你用多模态融合发顶会,代码直接抄!

多模态医学图像融合,CV和医学图像分析领域的经典热点。最近陆续出现了不少关于它的研究成果,其中较为瞩目的当属AAAI25的BSAFusion网络(详见下文解析)。

2025-11-22 10:52:07 542

原创 你的AI项目还在“空中楼阁”?我降薪跳槽,来帮你解决“最后一公里”!

作为大厂的资深 AI 算法部署工程师,**Always 刚完成了第 N 个从算法到上线的项目**。他没有喜悦,反而盯着屏幕陷入了沉思。他发现,所有 AI 落地项目,本质上都在重复同一套繁杂的流程——无非是换了模型和业务逻辑。这个过程,正是业内最头痛的**AI 落地最后一公里**。

2025-11-21 13:58:47 979

原创 你的Agent还在“一个一个”调工具?太慢了!这套MCP重构方案,效率提升10倍!

本文核心思想是 `code as meta tool`,Cloudflare[1] 和 Anthropic[2] 最近也分别写了篇博客来介绍,而 Manus 最开始就用的这个思路,我最早是从这篇论文Executable Code Actions Elicit Better LLM Agents[3]了解到的(去年五月初),只是当时模型写代码的能力还没有现在这么强。

2025-11-21 13:57:48 591

原创 你的AI为什么总“学歪”?问题在标注!Dify标注功能深度解析,3大模块+5案例,让你少走99%的弯路!

"同一个问题问两次,AI给出两种答案"——这可能是每个AI应用开发者最头疼的场景。某电商平台客服数据显示,因退款流程说明不一致,用户重复咨询率高达37%,投诉率上升15%;某医院AI导诊系统因症状描述标注混乱,科室推荐准确率仅62%。**数据标注正是解决AI"失忆"与"胡说"的核心钥匙**。

2025-11-21 13:56:43 713

原创 (保姆级教程)LangChain实战:MultiVector多向量检索,让文档“无所遁形”!代码直接抄!

为每一个文档块生成一条向量用于记录该文本的特征信息,如果能从多个维度记录该文档块的信息,会大大增加该文档块被检索到的概率,多个维度记录信息 等同于为文档块生成 多个向量,支持的方法如下:

2025-11-21 13:55:07 666

原创 你的AI还在“张口就来”?RAG整体流程全揭秘,让每个回答都有根有据!

RAG 主要针对 “专业领域知识不足” 这个点。当询问 LLM 的时候,除了自己问题,**使用 RAG 检索相关的 “专业领域知识”**,再把相关的 “专业领域知识” 发送给 LLM,这样 LLM 就能根据 “专业领域” 知识回答得更准确。

2025-11-21 13:54:24 610

原创 别再怪LLM“笨”了!是你没给它“大脑”!ReAct与Reflexion,让AI学会“自我反省”!

在人工智能领域,特别是大语言模型(LLM)的应用中,尽管模型在许多任务上表现出色,但在处理复杂任务时仍存在明显局限性。大型语言模型在处理需要多步骤推理、实时信息获取和动态决策的任务时,常常面临以下挑战:

2025-11-21 13:53:42 755

原创 颠覆认知!3B小模型也能做多模态Agent?Skywork R1V4-Lite实测,效果炸裂!

昨天刷到了昆仑万维发布了一个Skywork R1V4-Lite模型,只有3B的激活参数,就可以主动操作图像、调用外部工具、图文交互深度检索,是一个多模态Agent模型。

2025-11-21 13:51:44 902

原创 你的Agent是个“黑盒”?Agno框架实战,教你如何“透视”它的内心!

Agno通过OpenTelemetry(开源观测性框架)提供可观测性支持。可观测性有助于我们理解、调试和改进智能体Agent。目前Agno已经实现与多个主流的追踪和监控平台实现无缝的对接。包括AgentOps、Arize、Atla、LangDB、Langfuse、LangSmith、Langtrace、Maxim、Weave。下面以LangSmith为例进行演示。

2025-11-21 13:50:46 623

原创 LangChain vs. AutoGPT vs. CrewAI…快选吐了?AI Agent框架超详细总结,帮你一次搞定!

从编写一次性的脚本到使用一个成熟的框架,是软件工程领域一次重要的思维跃迁。本文探讨如何利用业界主流的一些**智能体框架**,来高效、规范地构建可靠的智能体应用。我们将概览当前市面上主流的智能体框架,然后并对几个具有代表性的框架,分析它们之间的区别并给出选型建议。

2025-11-21 13:49:31 700

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除