自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1690)
  • 收藏
  • 关注

原创 AI就绪 vs AI Native:不是升级,是换物种!这才是企业转型的“底层逻辑”!

那么如何将这些方法应用于企业AI项目实践呢?那么今天我想和大家分享企业AI战略的演变之路:从"AI就绪"到"AI原生"。

2025-11-25 17:19:52 367

原创 智能Agent系统:AI驱动的任务自动化解决方案

在当今快速发展的AI时代,如何让AI真正帮助我们完成各种复杂任务?GoBot的智能Agent系统给出了一个革命性的答案。这个系统不仅仅是一个编程工具,而是一个基于多Agent协作的智能任务助手,能够理解用户需求、制定执行计划,并通过整合各种工具(包括MCP协议和自定义RPA工作流)来完成用户的任务。

2025-11-25 16:15:02 952

原创 你的Agent为什么又慢又贵?因为你还在用LLM“大炮打蚊子”!SLMs才是精准打击的“狙击手”!

过去几年,大模型(LLM)像“万能插件”一样被应用在各种 Agent 里:代码 Agent、检索 Agent、行动规划 Agent……但实际工程实践更接地气:

2025-11-25 16:04:47 424

原创 告别“调包侠”!理解RAGFlow切分原理,是你成为RAG架构师的“第一道坎”!

书籍文件往往篇幅巨大、结构复杂,不同章节、目录、致谢等混杂在同一文档中。RAGFlow 在处理 book 类文档时,整合了多种解析器(docx、pdf、txt、html、doc),通过自动识别版面结构、过滤非正文、并结合视觉模型生成图片摘要,实现对长文档的精准切分与高质量抽取。本篇将带你逐步拆解源码,了解 RAGFlow 如何优雅地解析一本“书”。

2025-11-25 16:02:48 331

原创 你的RAG为什么总在胡说八道?根源不在模型,在语料!这套“洗稿”方法论,效果立竿见影!

要构建一个高准确率的RAG系统,首先需要解决的是语料数据的质量问题。**"垃圾进,垃圾出"(Garbage In, Garbage Out)**,无论我们的算法多么先进,如果底层的语料数据质量不佳,系统的表现也会受到限制。

2025-11-25 14:34:48 708

原创 你的RAG还在“无脑”检索?一文详解基于意图的智能路由,让它“读懂人心”!

在企业级 RAG系统的演进过程中,我们通常会经历两个阶段。第一阶段是“**建设期**”。在这个阶段,开发者的核心任务是将非结构化文档切分、向量化,并存入向量数据库。当用户提出问题时,系统通过语义相似度检索出 Top-K 个片段,喂给大模型生成答案。这套流程在处理“事实性问答”时,表现优异且成本低廉。

2025-11-25 14:33:19 339

原创 年薪百万的AI研究员,都在关注“慢思考”!浙大这篇EMNLP论文,是AI写作的“哲学拐点”!

本工作提出 OmniThink,一种模仿人类“慢思考”过程的机器写作框架,通过信息树(Information Tree)与概念池(Conceptual Pool)的迭代扩展与反思机制,突破大模型在生成深度与知识边界上的瓶颈,显著提升长文生成的知识密度(Knowledge Density)与创新性。

2025-11-25 14:27:32 642

原创 附完整代码!别再死啃理论了,这篇带你用高质量Context Pruning,让RAG效果立竿见影!

现如今,LLM的上下文窗口长度正在经历爆发式增长。翻开LLM Leaderboard,可以发现顶级模型的上下文长度已经陆续突破了1M tokens,并且这个数字还在不断刷新。

2025-11-25 14:25:33 722

原创 你的Agent还在“内卷”和“互撕”?万字长文,从原理到实践,教你打造高效协作的Agent军团!

人工智能技术的发展正在经历一场深刻的变革。从大语言模型(LLM)的突破,到检索增强生成(RAG)技术的成熟,再到AI智能体(Agent)系统的兴起,我们正站在一个全新的技术时代的门槛上。

2025-11-25 14:18:59 347

原创 想让AI团队“1+1>2”?秘密就在A2A!Agentic模式15深度解析,解锁智能体协作的终极密码!

内容来自Antonio Gullí的Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems一书。单个Agent在处理复杂的多方面问题时往往面临局限,即便它们具备先进的功能。为了解决这一问题,Agent间通信技术使得那些可能基于不同框架构建的各种人工智能代理能够有效协作。这种协作包括无缝的协调、任务分配以及信息交换。

2025-11-24 16:46:30 532

原创 别再让错误答案毁掉你的AI应用!Dify实战:5个技巧,将知识库准确率从60%提升到90%!

在企业知识管理中,你是否遇到过这些痛点:上传100页PDF后AI答非所问?员工查询政策文档需翻遍多个系统?知识库检索准确率不足50%导致AI“一本正经地胡说八道”?

2025-11-24 16:45:13 767

原创 废掉一个AI产品经理最快的方式:让他只知道ChatGPT!这100个Dify场景,才是你的“武器库”!

以下是Dify应用案例的分类整理,内容涵盖多个行业和应用场景。每个案例包含应用场景描述、技术实现要点及用户反馈/效果,展示了Dify在不同领域的多样化应用价值,旨在为各行业提供参考与借鉴。

2025-11-24 16:43:25 679

原创 格局打开!Function Calling只是“点”,MCP是“线”,A2A才是“面”!一文讲透AI交互的升维思考!

在这场关于智能体(AI Agent)的进化革命中,背后隐藏着三个关键“武器”:MCP(Model Context Protocol)、Function Calling和A2A(Agent to Agent protocol)。简单来说,MCP、Function Calling和A2A分别代表三种AI Agent和外界不同的协作方式:

2025-11-24 16:41:20 644

原创 还在为后端发愁?Streamlit+LangChain+GLM,三步搭建你的专属聊天机器人,无需一行后端代码!

这是一篇入门级大模型应用开发教程,适合后端开发工程师,数据工程师以及大模型应用开发工程师的动手实践教程。需要你具备一丢丢Python语言开发基础,但也仅仅需要基础。

2025-11-24 16:39:28 303

原创 本地知识库王者之战:Mia、Cheer Studio、AnythingLLM,终极对决,谁才是真正的“卷王”?

事实上perplexity的空间功能,元宝的分组,GPT的项目功能都有类似的知识库功能,但无法实现文件库本地化。下面将介绍标题中三种方法,其中Mia还是需要将文件上传至云端,且无法添加API,优点是大厂开发,稳定性更好,免费,不用买API。

2025-11-23 13:45:00 985

原创 月薪3K和30K的差距:一个用RAG,一个在用北大EAG-RL“思考病历”!

本工作提出 EAG-RL(Expert-Attention Guided Reinforcement Learning) 框架,通过专家注意力引导的强化学习,显著提升大语言模型在电子病历(EHR)推理任务中的内在临床推理能力与泛化性能。

2025-11-22 11:12:40 685

原创 RAG技术全解析:检索增强生成方法与优化,程序员必学技能,建议收藏!

RAG(检索增强生成)是一种结合知识检索和生成技术的方法,用于解决大模型无法解决的私域问题。其基本流程包括知识收集、检索和生成三个阶段。相比微调,RAG通过检索知识库生成回答,无需改变模型参数,避免了原有能力消失的风险,实现效率更高。文章还介绍了RAG的优化技巧和评估方法,为实际应用提供了指导。

2025-11-22 11:11:38 574

原创 干货收藏:商汤日日新大模型:赋能教育创新,教师必备AI工具

商汤"日日新"AI大模型为教师提供全方位教学支持:备课阶段通过"商量"精准获取资源,用"秒画"快速生成教学配图;课堂上视频理解助手提取关键内容并生成提问;课后拍照讲题功能辅助学生纠错,减轻教师负担。该模型显著提升教学效率,是教育智能化的得力助手,值得每位教师收藏使用。

2025-11-22 11:11:32 1045

原创 收藏向:一文看懂企业级Agent!从0到1搭建你的“生产力军队”,赢下这场暗战!

长假期间,OpenAI在2025 DevDay宣布了一系列开发者生态的重大升级,除了我们熟知的模型能力外(如Sora2 API),最引人瞩目的是在 ChatGPT 中引入的“Apps in ChatGPT”及其SDK,及AgentKit工具集。OpenAI正试图把它的ChatGPT助手与背后的模型全面升级为一个功能完备的AI应用构建与分发平台。

2025-11-22 11:11:25 677

原创 万字长文深度复盘!我如何用Dify把一个TB级知识库的文档分类工作,从一周缩短到一小时?

在知识库的使用场景中有这样一类需求,就是希望在同一个知识库里面,不同的人可以查看不同的文档内容。最常见的就是不同级别的人能够查看的文档范围是不一样的。在这里,我们结合Dfy的元数据给出了一种解决思路,并进行了两种方案设计,最终业务方的选择放到了文章结尾的位置。

2025-11-22 11:10:37 796

原创 “你的AI项目为什么迟迟不能上线?”Dify、Coze、LangChain…选错工具,神仙也救不了!

用智能体做一人公司,致力于帮助100W人用智能体创富~现在的AI已经不满足于简单对话了。它们开始自己思考,能规划任务,还会主动调用工具。

2025-11-22 10:58:12 783

原创 保姆级教程!手把手带你吃透上下文工程,核心技巧+避坑指南+代码示例!

上下文工程(Context Engineering,简称 C.E.)是一个系统性的学科,旨在设计、优化和管理提供给大型语言模型(LLMs)的信息载体,从而提升模型性能。上下文工程的分类法主要可以从两个维度进行详细阐述:技术实现维度(基础组件与系统实现)和功能目的维度(上下文类别与操作策略)。

2025-11-22 10:56:27 570

原创 【万字长文】AI Agent“四件套”保姆级教程:从大模型到工具使用,一篇打通你的任督二脉!

AI Agent作为当前人工智能领域的前沿技术,其核心组成部分包括大模型、感知技术、记忆组件和工具的使用。这些技术不仅各自在AI领域具有重要地位,而且相互协同,共同推动AI Agent向更高层次的智能化发展。

2025-11-22 10:54:40 609

原创 (保姆级教程)顶会风向标!手把手教你用多模态融合发顶会,代码直接抄!

多模态医学图像融合,CV和医学图像分析领域的经典热点。最近陆续出现了不少关于它的研究成果,其中较为瞩目的当属AAAI25的BSAFusion网络(详见下文解析)。

2025-11-22 10:52:07 540

原创 你的AI项目还在“空中楼阁”?我降薪跳槽,来帮你解决“最后一公里”!

作为大厂的资深 AI 算法部署工程师,**Always 刚完成了第 N 个从算法到上线的项目**。他没有喜悦,反而盯着屏幕陷入了沉思。他发现,所有 AI 落地项目,本质上都在重复同一套繁杂的流程——无非是换了模型和业务逻辑。这个过程,正是业内最头痛的**AI 落地最后一公里**。

2025-11-21 13:58:47 976

原创 你的Agent还在“一个一个”调工具?太慢了!这套MCP重构方案,效率提升10倍!

本文核心思想是 `code as meta tool`,Cloudflare[1] 和 Anthropic[2] 最近也分别写了篇博客来介绍,而 Manus 最开始就用的这个思路,我最早是从这篇论文Executable Code Actions Elicit Better LLM Agents[3]了解到的(去年五月初),只是当时模型写代码的能力还没有现在这么强。

2025-11-21 13:57:48 590

原创 你的AI为什么总“学歪”?问题在标注!Dify标注功能深度解析,3大模块+5案例,让你少走99%的弯路!

"同一个问题问两次,AI给出两种答案"——这可能是每个AI应用开发者最头疼的场景。某电商平台客服数据显示,因退款流程说明不一致,用户重复咨询率高达37%,投诉率上升15%;某医院AI导诊系统因症状描述标注混乱,科室推荐准确率仅62%。**数据标注正是解决AI"失忆"与"胡说"的核心钥匙**。

2025-11-21 13:56:43 708

原创 (保姆级教程)LangChain实战:MultiVector多向量检索,让文档“无所遁形”!代码直接抄!

为每一个文档块生成一条向量用于记录该文本的特征信息,如果能从多个维度记录该文档块的信息,会大大增加该文档块被检索到的概率,多个维度记录信息 等同于为文档块生成 多个向量,支持的方法如下:

2025-11-21 13:55:07 662

原创 你的AI还在“张口就来”?RAG整体流程全揭秘,让每个回答都有根有据!

RAG 主要针对 “专业领域知识不足” 这个点。当询问 LLM 的时候,除了自己问题,**使用 RAG 检索相关的 “专业领域知识”**,再把相关的 “专业领域知识” 发送给 LLM,这样 LLM 就能根据 “专业领域” 知识回答得更准确。

2025-11-21 13:54:24 608

原创 别再怪LLM“笨”了!是你没给它“大脑”!ReAct与Reflexion,让AI学会“自我反省”!

在人工智能领域,特别是大语言模型(LLM)的应用中,尽管模型在许多任务上表现出色,但在处理复杂任务时仍存在明显局限性。大型语言模型在处理需要多步骤推理、实时信息获取和动态决策的任务时,常常面临以下挑战:

2025-11-21 13:53:42 753

原创 颠覆认知!3B小模型也能做多模态Agent?Skywork R1V4-Lite实测,效果炸裂!

昨天刷到了昆仑万维发布了一个Skywork R1V4-Lite模型,只有3B的激活参数,就可以主动操作图像、调用外部工具、图文交互深度检索,是一个多模态Agent模型。

2025-11-21 13:51:44 900

原创 你的Agent是个“黑盒”?Agno框架实战,教你如何“透视”它的内心!

Agno通过OpenTelemetry(开源观测性框架)提供可观测性支持。可观测性有助于我们理解、调试和改进智能体Agent。目前Agno已经实现与多个主流的追踪和监控平台实现无缝的对接。包括AgentOps、Arize、Atla、LangDB、Langfuse、LangSmith、Langtrace、Maxim、Weave。下面以LangSmith为例进行演示。

2025-11-21 13:50:46 622

原创 LangChain vs. AutoGPT vs. CrewAI…快选吐了?AI Agent框架超详细总结,帮你一次搞定!

从编写一次性的脚本到使用一个成熟的框架,是软件工程领域一次重要的思维跃迁。本文探讨如何利用业界主流的一些**智能体框架**,来高效、规范地构建可靠的智能体应用。我们将概览当前市面上主流的智能体框架,然后并对几个具有代表性的框架,分析它们之间的区别并给出选型建议。

2025-11-21 13:49:31 697

原创 警告!你的工业知识,还在“沉睡”的文档里?LangExtract+本地LLM,让它们“开口说话”!

在工业领域,大量专业知识散落在设备手册、维修报告、故障日志等非结构化文本中。传统方法难以高效地从这些海量文档中提取有用信息并组织成可计算的知识。随着大语言模型(LLM)的发展,利用LLM进行信息抽取成为新的趋势。谷歌开源的 **LangExtract**库正是为此而设计的框架,它结合LLM强大的语言理解能力,从非结构化文本中提取结构化信息,被广泛用于工业故障诊断、设备维护等场景。

2025-11-21 13:48:04 580

原创 深度好文!不止是调参!Hugging Face 4年经验沉淀,一文洞悉大模型训练的“第一性原理”!

Hugging Face发布了《The Smol Training Playbook:The Secrets to Building World-Class LLMs》模型训练秘诀。

2025-11-20 13:42:53 587

原创 Agent开发要变天了!Alita-G深度解析:不止是工具,更是对AI智能的重新定义!

近年来,大型语言模型(LLM)如 GPT-4 和 Claude 已在多种任务中展现出强大能力,但面对需要专业知识和多步推理的复杂任务时,单一模型仍显不足。为此,研究者将 LLM 嵌入Agent系统中,赋予其记忆、工具使用和反馈机制,形成“Agent”。更进一步,“自我进化Agent”应运而生——它们能通过迭代学习自主提升能力。然而,现有方法多局限于提示词改写或错误重试,缺乏系统性的能力积累与转化。

2025-11-20 13:41:35 895

原创 深度好文!揭秘TRAE:下一代多智能体系统的架构基石与设计哲学!

在多智能体系统设计中,**模式选择**直接决定了系统的协作效率和问题解决能力。基于Trae的实现特点,我们可以总结出四种核心设计模式,每种模式针对特定类型的开发场景具有独特优势。

2025-11-20 13:40:37 622

原创 保姆级教程!清华开源首个MCP RAG框架,手把手带你从安装到跑通,体验什么叫“秀”!

逛 GitHub 挖到宝了,这个叫 UltraRAG 的开源项目是首个基于 MCP 的检索增强生成(RAG)框架,不写代码也能玩转。 用 YAML 文件轻松构建复杂 RAG 系统。RAG 系统:简单来说,就是让 AI 模型能先检索相关信息,再生成答案,从而提高准确性。

2025-11-20 13:39:21 862

原创 (保姆级教程)3小时通关AI Agent开发!LangChain/AutoGen/CrewAI,附赠3万字实战代码,学不会你来打我!

如果说传统编程是"告诉计算机如何做",那么AI Agent开发就是"告诉AI要做什么,让它自己想办法"。这种范式转变正是前文提到的"Vibe Coding"理念在AI Agent领域的具体体现。

2025-11-20 12:01:38 709

原创 王炸!LangChain 1.0重磅更新!5分钟搞定一个流式聊天机器人,新手也能起飞!

为了让初学者更容易上手,在文章末尾,给出一个综合应用样例:**搭建流式响应的多轮问答机器人**,它结合了消息格式和流式响应,模拟真实聊天场景。

2025-11-20 11:54:15 603

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除