自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(695)
  • 收藏
  • 关注

原创 【AI大模型】AI 智能体的8种记忆系统架构设计与落地,看到就是赚到!!!

没有记忆的 AI 智能体像金鱼,三秒就忘了。记忆太满的 AI 智能体像大象,步子慢还喘。如何既记且省?下面 8 种记忆系统架构设计和落地一次讲透,每种记忆系统都配完整思路、优缺点、代码、踩坑、调参建议,方便你直接落地。

2025-08-05 11:02:21 313

原创 【AI大模型】Manus、LangChain一手经验,先别给Multi Agent判死刑,是你不会管理上下文,赶紧收藏!!

一个多月前,全球两大技术顶流,围绕Multi-Agent吵的天翻地覆。一方是开发 Claude 的 Anthropic,他们认为Multi-Agent更有效。在他们的实验中,多 Agent 协作成功率比单一 Agent 高出 90.2%。另一方则是推出「Devin」的 Cognition,他们看来:单一 Agent 配合长上下文压缩与精细调度,其实更加稳健、好用、成本低。表面上看,这是 Multi-Agent 的路线之争,但本质上,这场讨论的核心,其实是:如何管理Agent的上下文?打个比方

2025-08-05 10:36:41 542

原创 【AI大模型】96.3%准确率!Routine框架:让企业级Agent告别“不靠谱”,建议收藏!!

想象一下,你给一个超级聪明的AI助手布置一项公司里的复杂任务,比如“查一下新员工小王的部门预算还剩多少,并和去年对比生成报告”。通用AI模型(如GPT-4)可能想法天马行空,但实际操作起来却容易“掉链子”:步骤混乱、用错内部工具、参数填不对,甚至直接“摆烂”不干活。这就是当前大模型智能体(LLM Agent)落地企业面临的核心难题——缺乏领域知识导致规划不稳、执行飘忽。

2025-08-04 11:19:02 453

原创 【AI大模型】笑死,同样的示例,放在prompt的不同位置,AI直接给我整不会了!

大型语言模型(LLM)如ChatGPT、Llama、Qwen等,拥有一种神奇的能力——上下文学习(In-Context Learning, ICL)。只需在输入提示(Prompt)中放入几个任务示例(Demos),模型就能“举一反三”,无需额外训练直接完成新任务(如分类、问答、摘要)。这被视为LLM的核心突破。

2025-08-04 10:42:13 234

原创 dify案例分享-Dify+RSS 聚合 8 大平台实时热点,新闻获取效率飙升 300%

今天给大家介绍使用RSS多平台新闻聚合结合dify实现一个多平台实时获取最新新闻资讯的工作流

2025-08-03 08:00:00 1905

原创 【AI大模型】使用 LangChain + Higress + Elasticsearch 构建 RAG 应用,收藏这篇就够了!!

RAG(Retrieval Augmented Generation,检索增强生成) 是一种结合了信息检索与生成式大语言模型(LLM)的技术。它的核心思想是:在生成模型输出内容之前,先从外部知识库或数据源中检索相关信息,然后将这些信息作为上下文输入给生成模型,从而提升生成内容的准确性、时效性和相关性。

2025-08-02 08:00:00 676

原创 图解AI大模型,生动形象的给大家解释什么是上下文工程?建议收藏!!

今天聊一个被低估、却把无数人卡住的概念——Context Engineering,中文通常译作“上下文工程”或“语境工程”。它不是什么新出的框架,而是一套为AI系统搭好“前置信息环境”的方法论。它解决的根本问题是:为什么花了大价钱买最好的GPT-4、Claude-3,效果却依旧差强人意。

2025-08-01 10:49:08 706

原创 AI大模型Agentic问答系统:自适应RAG + LangGraph = 智能问答系统最强组合!实战拆解!看到就是赚到!!

检索增强生成(RAG)彻底革新了我们构建能够访问外部知识并进行推理的 AI 系统的方式。然而,随着应用程序的复杂性不断增加,传统 RAG 方法的局限性日益凸显。如今,我们正在经历一种从线性、固定管道到智能、自适应系统的转变,这些系统可以根据查询复杂度和上下文动态调整其检索与生成策略。

2025-08-01 10:26:38 661

原创 【AI大模型】8种LLM架构设计大比拼:从 DeepSeek-V3 到 Kimi K2,究竟有啥不同?看完这一篇你就懂了!!

自从GPT-2(2019)开启Decoder-only模型以来,到今天DeepSeek-V3和Llama 4(2024-2025),大家会觉得这些模型在结构上仍然相似。 当然,位置嵌入已经从绝对到旋转(RoPE)发展,多头注意力在很大程度上让位于Grouped-Query Attention,更高效的SwiGLU已经取代了像GELU这样的激活函数。

2025-07-31 21:42:13 512

原创 AI大模型RAG 分块术完全指南:15种“切片神技”,让你的检索结果提升10倍!看到就是赚到!!

为什么你精心构建的 RAG 系统,返回的答案却总是“不着调”?不是模型不够强,而是你没“切”对!RAG(检索增强生成)系统的精髓,不在于你用了哪个 embedding 模型,也不在于你接入了哪个 LLM,而在于——你如何「切」文本。切得好,信息上下文完整、检索精准;切不好,模型不是“胡说八道”,就是“词不达意”。今天就来带你一次性掌握 15种最实用的 RAG 分块技巧,每种方法都配有真实场景和分块示例,甚至直接可用的代码结构。建议收藏 + 实战验证!

2025-07-31 20:58:58 576

原创 【AI大模型教程】彻底说清 Human-in-the-Loop:企业级 Agent 系统的关键挑战与LangGraph解法【上】

在LLM Agent的自动化流程中,Human-in-the-Loop(HITL,人类参与闭环)是常见的设计模式之一。特别在要求较高的企业级场景中,HITL可以让人类在流程中对Agent运行进行适时的监督与接入,从而提高系统的准确性、可信度和用户体验。

2025-07-30 19:46:21 597

原创 【AI大模型入门】 一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的概念和联系,零基础小白收藏这一篇就够了!!

技术的意义不在于堆砌概念,而在于解决真实世界的问题。你是否曾在阅读科技文章时,被“大模型”、“RAG”、“Agent”、“知识图谱”这些术语轮番轰炸,感觉它们既相互关联又界限模糊?仿佛面对一个庞大乐高城市,分不清哪块积木支撑着核心结构,哪块又是实现特定功能的精巧组件?今天,我们就拨开迷雾,深入探究这些构建智能未来的核心要素,厘清它们各自的角色与协同之道

2025-07-30 17:26:33 907

原创 GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5发布节点又要提前了!在LMArena上,已悄然上线了「超大杯」GPT-5-pro,内部代号zenith。一些抽卡成功的网友,开启了惊艳实测。传闻称,GPT-5的发布时间提前了,预计在本月底面世。

2025-07-29 12:00:21 766

原创 当LangChain成为技术债:你的AI架构还撑得过明年吗?

在过去的18个月里,LangChain无疑成为AI工程领域的耀眼明星——GitHub星标爆炸性增长、开发者峰会座无虚席、各种基于LangChain的创业公司如雨后春笋涌现。作为深度参与AI工程化的实践者,我亲眼见证它如何改变我们构建LLM应用的方式,但也深刻感受到整个行业正在经历一场痛苦的拐点:LangChain正从解决方案本身演变为新问题的来源。

2025-07-29 10:53:00 942

原创 【AI大模型落地】企业级AI超级应用,下一个关键筹码?看完你就知道了!!

围绕企业级AI市场,超级应用生态正在形成。不论是ChatGPT带动的第一波浪潮,还是DeepSeek之后更多中国大模型AI应用的涌现,从AI智能助手到AI陪伴应用,再到AI在各个领域的产品,应用层在全面爆发。但实际上,还有另一个易于忽略却刚需明确、广受看好的赛道,爆发得更迅猛——企业级AI应用市场。随着全球AI市场爆发,企业级应用正成为新风口。近日,企业级AI应用代表飞书一口气端出AI全家桶,涵盖办公、业务提效、项目开发、组织管理等方方面面,无疑抢占了AI在企业端落地的先机。

2025-07-28 12:00:36 760

原创 【喂饭教程】大模型推理框架vLLM,是如何工作的?看完这一篇你就知道了!!

这里,分两个主要模块介绍 AI 模型推理引擎整体架构与主要功能。回顾 AI 落地的发展过程,我们可以简单地将 AI 模型的发展分为小模型领域与大模型领域。在小模型领域以 CNN 模型为主,模型结构变化多样分为分割,检测,识别,NLP 等各个类型。在大模型领域,模型结构比较统一以 LLaMa 系列,Deespeek 系列,Qwen 系列等模型均起源于 Transformer 结构,新增比如 MLA,MoE 的一些局部改造。

2025-07-28 10:45:19 839

原创 AI大模型面试灵魂拷问:大模型推理为什么要PD分离?看完这篇你就知道了!!

随着DeepSeek爆火,面试中也越来越高频出现,因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练,Dual-Pipe等关键技术,力求做到全网最硬核的解析~在 LLM 推理计算中 Prefill 和 Decode 两个阶段的计算/显存/带宽需求不一样,通常 Prefill 是算力密集,Decode 是访存密集。

2025-07-27 08:00:00 600

原创 不懂监督/无监督/半监督/强化学习?难怪你只是AI调包侠!

在人工智能快速渗透各行各业的今天,我们经常会听到一个词:机器学习(Machine Learning)。它就像AI世界的“基本功”,决定了一个智能系统能不能看懂数据、学会判断、做出决策。但很多人对机器学习的理解,仍停留在“黑盒”印象——它到底是怎么学的?有没有分类方法?不同学习方式有什么区别?今天,我们就从最通俗的角度,一次性搞清楚监督学习、无监督学习、半监督学习和强化学习这四大核心范式。无论你是AI从业者,还是好奇心满满的读者,都能在这篇文章里找到价值,不做AI的调包侠。

2025-07-26 14:20:08 393

原创 【AI大模型】企业图谱解决方案:知识图谱、元数据图谱与分析图谱的区别与应用,看到就是赚到!!

随着企业数据量的爆炸式增长,超过80%的企业数据仍然是非结构化的,传统关系型数据库在处理复杂互联数据方面显得力不从心。本文深入探讨了企业中三种主要的图谱类型:知识图谱、元数据图谱和分析图谱,详细分析了它们的特点、应用场景和最佳实践,并澄清了关于图谱解决方案的常见误解。

2025-07-25 11:04:09 603

原创 【AI大模型实战】手把手教你基于 RAG 和 Claude 的智能文档聊天系统实战,全程干货,建议收藏!!

最近我和一个律师亲戚聊AI时,问了我应该怎么对现在律师事务所庞大的文档做AI检索,从技术上讲用现在的LLM+RAG可以满足需求,但细想不太对劲,因为这里面涉及到很多专业知识,还有律师的专有思维路径,一个不懂律师业务的程序员肯定是做不好的,于是有幸跟他们合伙人进行了深入沟通,合伙人说了一堆但我总结下来就这么一句话

2025-07-25 10:10:43 907

原创 AI大模型工作面试必备!!10道大模型微调必问面试题+答案解析!

大模型微调是大模型学习的必经之路,而且在你找大模型相关工作时,微调相关问题也是避不开的!所以,今天我给大家整理了10个微调领域的面试题,请务必要收藏起来,对你一定有帮助!

2025-07-24 14:24:19 469

原创 RAG 检索四件套全解析:模型、向量库、检索方式、排序器,一文选型不踩坑,收藏这一篇就够了!!

想做智能客服、企业知识库、RAG 应用?你绕不开的问题是:该用什么向量模型?用什么库?用什么排序器?本篇一次讲清

2025-07-24 11:13:02 581

原创 爆改RAG检索体验:向量+关键词,双剑合璧的“融合检索”实战指南,看到就是赚到!!

你以为RAG(Retrieval-Augmented Generation)检索只能靠向量?那你可就out了!今天,咱们就来聊聊如何用“向量+关键词”双剑合璧,打造检索界的“六边形战士”——融合检索(Fusion Retrieval)。

2025-07-23 13:56:10 769

原创 【AI大模型】BETR横空出世:预训练数据匹配目标任务,LLM训练范式转移,看到就是赚到!!

在训练大型语言模型(LLM)时,人人都知道数据质量至关重要。目前业界筛选海量网络数据的方法,很大程度上依赖于研究者的“直觉”或者一些间接的指标。比如,研究者会凭经验挑选一些他们认为“高质量”的网站或文本作为正面样本,来训练一个分类器去筛选整个数据集。然而,这个过程中“质量好”的定义非常模糊和主观。

2025-07-23 11:29:50 446

原创 AI Agent做PPT卷疯了,最强选手被挖掘出来了,看到就是赚到!!

2025年号称AI Agent元年,目前最见成果的领域,可能就是做PPT。毕竟,PPT是打工人的大痛点。鲸哥此前写过如何用AI生成原生的PPT(通过提示词生成SVG格式)作品别再冲会员套模板了,用AI免费做原生PPT但现在更流行用Agent做PPT(把此前的提示词到代码过程Agent),Agent能自主海量数据整理,内容逻辑补全,调用工具生成图文视频素材,简直就像个高智商的机器人,前期准备、中期排版设计,后期内容整合都可以自动化了。

2025-07-22 13:53:29 564

原创 爆改RAG!用“自动提问”让你的AI检索像开挂一样精准,看到就是赚到!!

你还在用传统RAG?那你就OUT了!今天,咱们聊聊如何用“自动生成问题”给RAG加点猛料,让你的AI检索和问答能力直接起飞!

2025-07-22 11:23:28 881

原创 【AI大模型】Dify超实用技巧:让回答“图文并茂”,建议收藏!!

作为一个长期在 AI 领域摸爬滚打的博主,我最近可是在 Dify 的使用上有了新发现!你们都知道,在和 AI 交互的时候,文字回答虽然简洁明了,但要是能配上图片和表格,那效果简直翻倍。就拿我上次整理旅游攻略来说,单纯的文字介绍让景点和路线显得很抽象,可一旦加上景点的图片和行程安排的表格,整个攻略瞬间就生动形象起来了,不仅看起来更直观,理解和记忆也变得轻松多了。 相信大家在使用 Dify 的过程中,也一定渴望能让它的回答图文并茂,今天我就来给大家分享几个超实用的技巧,让你们的 Dify 回答从此告别单调!

2025-07-21 13:47:40 613

原创 【AI大模型】从零训练已死,微调亦亡?专家汤SoE引发AI范式巨变

我们现在已经拥有像GPT-o3这样的大型语言模型。它们就像一个知识渊博、无所不能的“通才”博士,什么都懂一点,能在各种任务上都表现得不错。但问题是,雇佣这位“通才博士”的成本非常高(训练和推理成本巨大)。在很多实际场景中,我们并不需要一个“通才博士”,而可能只需要一个“专才硕士”,比如一个专门写代码的模型,或者一个专门处理医疗报告的模型。这些“专才”模型可以更小、更快、更便宜。

2025-07-21 11:30:38 619

原创 Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

本地客户端具有部分国际化测试文件需要执行翻译,格式示例如下,多层嵌套的 json 格式,value 为string类型。需要利用大模型对整个 json 文件进行翻译,将中文翻译为英文后按原格式返回

2025-07-20 08:00:00 813

原创 万字长文剖析基于 MCP 构建 AI 大模型新架构体系的落地实践!看到就是赚到!!

目前 AI Agent 与各种 Tools(业务服务接口)、Memory(存储服务接口)以及 LLMs(大语言模型)的交互主要通过 HTTP 协议实现。除了 LLMs 基本遵循 OpenAI 范式外,与其他 Tools 和 Memory 的交互需要逐一了解它们的返回格式进行解析和适配,这增加了开发的复杂性。

2025-07-19 08:00:00 464

原创 Transformer危!谷歌MoR架构发布:内存减半推理速度还翻倍,看完你就懂了!!

超越**Transformer**,谷歌推出全新底层架构——**Mixture-of-Recursions**(MoR),注意不是MoE,它能推理速度提高2倍,而KV内存直接减半!而且All in One,**首次**在单一框架中实现,用同一组参数处理不同任务的同时,进行动态分配计算资源。就像给LLM开了个双层增强buff,模型性能和效率全都要。

2025-07-18 14:16:22 484

原创 【AI大模型】Dify超实用工作流模版大揭秘,效率神器来袭!

Dify 是一款开源的大语言模型(LLM)应用开发平台,融合了后端即服务(BaaS)与 LLMOps 理念 ,旨在助力开发者快速搭建生产级的生成式 AI 应用。其操作界面集成了 AI 工作流程、RAG 管道、代理、模型管理等功能,通过直观的可视化界面,用户可以轻松构建和测试功能增强的 AI 工作流程。

2025-07-18 13:42:05 648

原创 【AI大模型】再强调一遍,智能体是由大模型(LLM)+工具集(Tools)组合而成的!!

“ 再强调一遍,智能体是由大模型+Tools工具集组合而成的;工具才是智能体强大的核心。”最近在做数据分析的智能体时遇到了一个问题,就是刚开始想做一个完全基于数据库表结构的数据分析智能体;但发现业务上的很多数据是通过程序代码动态计算出来的,完全通过数据库无法实现。这个通过数据库进行数据分析的智能体使用的是vanna框架作为一个工具节点,来分析用户问题,然后由模型生成SQL语句,并调用数据库引擎执行并获取结果。无独有偶,之前做了一个基于大模型的RAG系统,有个需求是把这个系统改造成MCP服务;但这

2025-07-17 14:32:16 571

原创 【AI大模型】使用DeepSeek的四个层级,你在哪一层?看完这篇你就知道了!!

作为国内最火最强大的AI,DeepSeek为我们带来的意想不到的惊喜:知识问答、文本分析、外文翻译、摘要生成、报告写作、创作文案、深度推理、等等。然而,正确使用AI有四个层次,看看你在哪一层?

2025-07-17 11:43:55 473

原创 【小白教程】一文搞懂 AI、LLM、Prompt、MCP、AIGC 是什么,有什么区别?收藏就对了

在 ChatGPT、文心一言、通义千问等这些 AI 工具爆火的时代,你可能经常听到这些词如:AI、LLM、Prompt、MCP、AIGC。那么,它们到底是什么呢?有什么区别呢?接下来,我们一起来了解一下,不然和别人说起 AI 人工智能时,这些概念不懂就很拉了。

2025-07-16 18:41:28 904

原创 【AI大模型】一文读懂AI系统架构设计:原则、性能、扩展性与容灾全面解析,建议收藏!!

在AI应用爆发式增长的今天,从ChatGPT类的大模型推理平台,到日活千万的智能客服,再到亿级数据规模的推荐系统,一个高可用、高性能、可扩展的系统架构是AI落地的基石。本文将系统性地拆解AI系统架构设计的核心原则、关键能力和实际场景,通过逐步构建,让你理解:一个真正支撑业务的AI系统架构该如何设计,如何优化,如何进化。

2025-07-16 11:50:45 873

原创 【AI大模型入门教程】一文搞懂什么是RAG,零基础小白收藏这一篇就够了!!

想象一下,你面前坐着一位超级“学霸”。他博览群书,记忆力惊人,口才极佳,无论你问什么,他都能侃侃而谈,出口成章。但这位学霸有两个致命缺点:第一,他读的书都停留在2024年(或者更早),世界之后发生的新鲜事他一概不知;第二,有时候为了显得自己很懂,他会“脑补”一些听起来很合理,但完全是瞎编的内容。这就是当前很多大语言模型(如ChatGPT、文心一言等)的尴尬现状——知识可能过时,还爱“一本正经地胡说八道”(专业术语叫“幻觉”)。

2025-07-15 14:20:17 817

原创 一文讲清LLM 驱动的 AI Agent通信:协议、安全风险与防御对策,收藏这篇就够了!!

随着大型语言模型(LLM)技术的飞速发展,以其为核心驱动的 AI 智能体正展现出前所未有的智能水平与适应能力,深刻改变着人类的生产与生活方式。如今,智能体不再是孤立存在的个体,而是逐渐形成了一个相互协作的生态系统,通过与其他智能体、工具及外部环境进行通信,共同完成复杂任务。在此背景下,智能体通信已成为未来 AI 生态系统的基石,众多组织纷纷投身于相关通信协议的研发,如 Anthropic 提出的 MCP(Model Context Protocol)和 Google 推出的 A2A(Agent-to-Age

2025-07-15 11:07:42 801

原创 开源嵌入新王落地!Qwen3-Embedding 本地部署指南 + Dify 召回测试实录

之前,通义千问推出的 Qwen3-Embedding 系列模型(包括8B、4B和0.6B三个版本)在权威评测中表现惊艳,尤其在多语言任务和长上下文处理能力上全面超越主流竞品,成为开源嵌入模型的新王者。

2025-07-13 08:00:00 895

原创 Google研究发现:Multi-Agent的核心竟然是Prompt设计!

在多智能体系统(MAS:multi-agent systems)中,设计有效的提示和拓扑结构面临挑战,因为单个智能体可能对提示敏感,且手动设计拓扑结构需要大量实验。

2025-07-12 11:23:25 674

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除