自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(977)
  • 收藏
  • 关注

原创 DeepSeek V3.1:虽然价格涨了但Agent能力提升了

8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代。在X上,DeepSeek将V3.1称为“我们迈向智能体时代的第一步”(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强的 Agent能力、混合思考模式和更高的思考效率。官方表示,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在编程智能体、搜索智能

2025-08-22 11:54:52 442

原创 【AI大模型实战】手把手教你使用Spring AI + Milvus 实现 RAG 智能问答,全程干货,收藏这一篇就够了!!

公司的文档太多,查找信息太慢!”、“客服回答总是千篇一律,不能精准解答用户问题!” —— 这些痛点背后,是传统关键词搜索和规则引擎的局限。如今,语义搜索(Semantic Search) 和 检索增强生成(Retrieval-Augmented Generation, RAG) 正成为解决这些问题的利器。它们能让应用“理解”用户问题的真正意图,并从海量资料中精准找出相关信息,甚至生成自然流畅的答案。

2025-08-22 11:37:41 492

原创 AI智能体到底怎么造?从核心模块到落地实战,一文全讲透,建议收藏!!

AI智能体到底怎么造?从核心模块到落地实战,一文全讲透,建议收藏!!

2025-08-22 11:06:29 434

原创 【喂饭教程】5分钟搞定!n8n 本地部署 + 汉化教程,一次到位,全程干货,简单易懂!!

n8n 是现在很热门的一款自动化工具,支持各种平台对接,还开源,挺香的。不光有官方的线上版本,也支持自己本地部署。那为什么不直接用线上版本呢?我自己试了一下,最主要的原因就是:太贵了。官方提供的云服务,一个月要 20 多美金,对于个人或者刚起步的小团队来说,这个成本完全没必要,自己部署一下就能省下来。还有一个问题,就是全

2025-08-21 14:30:29 374

原创 企业级AI知识库构建指南:避开这18个坑,少走3个月弯路,建议收藏!!

本文详细记录了我在给某企业实施AI运维知识库项目过程中遇到的多个关键坑点,希望这些经验能帮助大量想要构建知识库的企业少走弯路,实现知识高效管理和服务快速响应。

2025-08-21 13:45:29 263

原创 一文深度剖析7种 RAG AI 智能体架构设计,零基础小白收藏这一篇就够了!!

在检索增强生成(RAG)不断发展的世界中,并非所有 AI 智能体都生而平等。有些充当智能路由器,有些是总规划师,还有一些同时处理记忆、工具和逻辑。以下是一个关于智能 RAG AI 智能体类型的架构设计剖析,每种类型都配有实际用例,展示它们在实践中如何表现。

2025-08-21 11:36:28 423

原创 【大模型实战】手把手教你基于LLM与RAG的AI智能体意图识别深度实践,全程干货,简单易懂!!

在构建AI智能体的征途中,精准的意图识别(Intent Detection)是决定成败的第一道关卡。它负责将用户自由形式的输入(Query)映射到系统预定义的具体任务上,例如“查询天气”、“预订机票”或“播放音乐”。随后的槽位抽取(Slot Filling)则从输入中提取执行任务所需的关键参数,如“北京”、“明天”或“周杰伦”。

2025-08-20 14:44:02 579

原创 LLM × Prometheus 强强联合:打造智能可观测性中枢,驱动平台工程智能化升级

随着云原生架构日益复杂,微服务、容器、Serverless、大量 API 接口等技术堆叠造成系统运行环境高度动态。平台团队已普遍采用 Prometheus、Grafana、Loki、Tempo 等主流可观测工具构建监控体系。然而,即便拥有完善的指标采集与可视化能力,企业仍面临三大难题:

2025-08-20 11:50:39 475

原创 重磅炸弹!DeepSeek-V3.1正式开源!

就在刚刚,DeepSeek AI 团队在 Hugging Face 上投下了一颗重磅炸弹!他们正式开源了 DeepSeek-V3.1 的基座模型!是的,你没听错,是 V3.1!不是 V4,不是 R2,是那个传说中拥有万亿参数、采用 MoE 架构 的 DeepSeek-V3.1!这简直是开源社区的一场狂欢!🎉目前官方还未上传模型卡片,暂时没分数,预计明天就会上传

2025-08-20 10:55:10 670

原创 Dify 之外的新尝试:Coze Studio 知识库实战指南:部署、解析、接入全流程,建议收藏!!

coze studio 的向量还在不断地完善过程中,预估这周ollama会上,自定义http需要按规范实现知识库目前不支持外挂,这个在企业中是一个很大的问题,后续开源社区肯定会支持,迟早的问题整体检索效果相对来说比较差,这个可能是我使用的问题

2025-08-19 11:41:20 669

原创 n8n部署RAG太麻烦?MCP+自然语言搞定n8n workflow 的时代来了!

配置一个从Salesforce到MySQL的数据同步工作流,3天都还没搞定。这是不是你刚接触n8n的样子?的确,n8n很好,开源又低代码,高效且可视化,尤其适合做workflow。但对小白来说,上手真的太难了。那么,不妨试试n8n-mcp,相比纯手工配置,不仅效率大大提升,还能让你节省至少80%的时间成本。那么,能借助mcp用自然语言搭建n8n工作流吗?怎么用n8n结合Milvus快速落地一个RAG?接下来,我们将展示n8n-mcp如何在5分钟内构建一个原本需要2天才能完成的企业级RAG(检

2025-08-19 11:14:48 712

原创 AI Agent,产品经理的“新战场”!一文带你搞懂AI智能体,收藏这一篇就够了!!

2025年,AI智能体(AI Agent)正以颠覆性的姿态席卷各行各业。医疗领域中,AI医生能通过患者症状自动生成诊断报告,并推荐个性化治疗方案;金融领域里,智能投顾实时分析市场数据,动态调整投资组合;教育领域中,AI导师根据学生的学习轨迹生成定制化课程,甚至模拟真实教师的互动风格。

2025-08-18 22:20:26 756

原创 AI 智能体在企业真正落地的六大技术栈,你知道几个?一篇文章让你搞懂!建议收藏!!

会查资料的 Agent(Agentic RAG)不只是“问答”,而是像侦探一样边推理边实时翻资料。医院、法律、金融都在用,Perplexity、Harvey AI、Glean AI 都是例子

2025-08-18 21:55:29 516

原创 一文读懂这8个关键概念,AI大模型入门到精通,零基础小白收藏这一篇就够了!!

AGI全称是Artificial general intelligence,中文含义是通用人工智能,是指人工智能达到的一种智能形态:像人类一样去思考问题、解决问题,表现出智能的行为,并且不局限于特定领域。 简单来说,AGI具备比较广泛的认知能力,像人类一样能够适应环境并且自主学习,做人类能够执行的任务。所以AGI具备以下特点:

2025-08-18 21:09:28 584

原创 【小白教程】手把手教你6种DeepSeek大模型的部署模式,快收藏起来慢慢看!!

云端部署模式指的是将 DeepSeek 大模型托管在公有云或私有云平台上,通过云服务提供商提供的高性能计算资源(例如 GPU/TPU 集群、分布式存储、负载均衡等)实现模型的在线推理和训练任务。具体实现方式通常包括:

2025-08-17 08:00:00 766

原创 Transformer位置编码:为何采用正弦和余弦函数?看完这一篇你就知道了!!

Transformer模型由于自注意力机制的并行处理特性,天然缺乏对序列顺序的敏感性。如果不给模型提供位置信息,模型将无法区分序列中不同位置的元素,导致顺序信息丢失。例如,“我爱你”和“你爱我”虽然包含相同的词,但词序不同含义也完全不同。如果没有特殊处理,Transformer对这两句的编码结果可能是一样的。位置编码(Positional Encoding)因此被引入,用于为每个词注入其在序列中的位置信息,从而打破Transformer的置换不变性 ,让模型“知道”哪个词在前、哪个词在后。

2025-08-16 11:42:19 511

原创 再见扣子 , 用上DeepSeek , 工作效率加倍 ! 绝了,Github斩获59.4K星 !!!

你有没有想过,有一天可以轻松从海量复杂文档中找到藏针的信息 ?如果你正为企业化私有信息提取困难而头痛不已 ?

2025-08-16 11:26:24 637

原创 【保姆级教程】手把手教你用 FastAPI + LangGraph搭建 AI 工作流,全程干货,小白也能轻松学会!!

Large Language Models (LLMs) 擅长推理,但现实世界的应用往往需要有状态、多步骤的工作流。这就是 LangGraph 的用武之地——它让你可以通过由 LLM 驱动的节点图来构建智能工作流。

2025-08-16 10:53:59 830

原创 【AI大模型】手把手带你了解AI工作流与智能体的人机协作及应用,收藏这一篇就够了!!

AI正改变着各行各业,从内容创作到客户服务、知识问答等AI的应用日益广泛。为了更有效的利用AI,通常需要构建智能体或其初级形式的workflow。但在目前阶段无论是智能体亦或许Workflow都无法保证其自动运行能达到100%的可靠性,根源在于大模型存在着下面的一些问题:幻觉问题、工具调用的可靠性、训练数据未覆盖等。在引入RAG知识库后也未能够完全杜绝上面所说的问题。

2025-08-15 12:05:08 840

原创 企业RAG之构建 FastMCP 服务,基于模型上下文协议的智能服务体系搭建实践

在企业级的RAG系统落地过程中,如何构建一个高效、可扩展、智能化的服务调度体系成为了关键挑战。在本次实践中,我基于 FastMCP 工具,尝试构建一个完整的 多服务协作框架,并将其引入企业RAG架构中,探索其在复杂工具链调度、上下文保持、智能决策等方面的能力。

2025-08-15 11:40:47 659

原创 为什么你的AI Agent落不了地?答案不在模型,而在工程架构!看完这篇文章你就知道了!

过去两年,AI智能体(AI Agent)成为AI落地的热门方向,从 ChatGPT 的对话助手,到自动化办公、代码助手,再到多智能体协作平台,智能体被视为未来人机交互的核心形态。随着越来越多企业已经落地+AI+智能体应用,我们会发现,AI智能体应用在企业落地90%的工作都是工程架构设计(软件工程),只有10%是真正的AI大模型。

2025-08-15 10:41:02 726

原创 大模型+知识图谱=王炸组合?这3个应用场景正在改变AI落地方式!

目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域,它在技术领域的热度也在逐年上升。 从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。

2025-08-14 19:26:39 884

原创 【AI大模型】一文讲透如何用“上下文设计”降低大模型幻觉?看完这一篇你就懂了!!

比起“提示工程”(prompt engineering),我确实更喜欢“上下文工程”(context engineering)这个术语。它更好地描述了核心技能:提供完成任务所需全部上下文信息,使大语言模型(LLM)能够合理解决问题的艺术。

2025-08-14 19:08:34 552

原创 转行AI必学:Transformer架构+大模型微调,到底怎么工作的?(人话版)建议收藏!!

目前主流的微调方式就是LoRA低秩矩阵微调,训练速度非常快,节省资源,但训练结果很多时候是不稳定的,有一定玄学在里面,因为微调过程也是依赖模型的反向更新,有时候没有更新到相关知识点,就会导致出现模型幻觉,需要多次尝试,这个过程被趣称为:炼丹~

2025-08-14 13:49:20 571

原创 【AI大模型】手把手教你评估智能体:涵盖多轮对话、RAG及其他关键测试,看到就是赚到!!

这些指标如今仍在使用,但主要用于模型输出单一、易比较的“正确”答案的场景。以分类为例,其任务是为每个文本分配单一标签。为测试这一点,我们可通过比较模型分配的标签与评估数据集中的参考标签(判断是否正确)来计算准确率。规则很明确:若分配错误标签,得0分;若分配正确标签,得1分。这意味着,若我们为包含1000封邮件的垃圾邮件数据集构建分类器,且模型正确标记了其中910封,那么准确率即为0.91。

2025-08-13 14:12:11 624

原创 【AI大模型】多轮强化学习(multi-turn RL)让LLM智能体自我演化出推理与适应能力,建议收藏!!

将大型语言模型(LLM)训练成交互式智能体面临多项挑战,包括对长远决策的需求以及应对环境反馈的随机性。尽管强化学习(RL)已在静态任务中取得显著成果,多轮智能体 RL 的训练仍缺乏深入研究。本文提出 StarPO(State-Thinking-Actions-Reward Policy Optimization),一个面向轨迹级别智能体 RL 的通用框架,并设计了 RAGEN——一个模块化的 LLM 智能体训练与评估系统。我们在四种风格化环境上的实验揭示了三大核心发现:

2025-08-13 11:34:59 749

原创 【AI大模型落地】企业AI落地不顺,问题可能出在你没搞懂知识库!

今年的AI应用里,让我最惊艳的应该是Gemini的Deep Research(pro版本)和Manus了,似乎AI真的走到了自己思考和执行事项的时代,相信已经用上这些产品的朋友会有同样的感叹。但别急,我也发现了它们的一些局限。也许用显微镜看的时候,它们的局限会很多,比如相对来说还比较高的执行失败率,或者明明规划路径是对的,最终结果却未达预期。但对我来说,最大的差距是Deep Research在规划时不能理解企业特有的业务流程,造成很多它们给的结果明明很好,但和我的业务无关,特别是企业自身的知识无法用

2025-08-13 10:54:37 1005

原创 别再碎片化学习了!64张图带你系统吃透AI智能体底,零基础小白收藏这一篇就够了!!

在这篇文章中,我们将通过64张图,探索 AI 智能体的架构设计、关键技术、主要组成部分、以及多智能体框架。具体包括14项关键技术:什么是LLM智能体、记忆、短期记忆、长期记忆、工具、Toolformer、模型上下文协议(MCP)、规划、推理、推理与行动、反思、多智能体协作、人类行为的交互式仿真、模块化框架等。

2025-08-12 13:52:21 622

原创 你的 RAG 还在“机械检索”?LangGraph 让它拥有类脑思维!

想象一下你是一位公司老板,交代 AI 小助手一个任务:“帮我写一份报告,主题是:中国AI创业公司发展趋势,要有数据、行业案例、专家观点,还要配图。”普通的 AI(就算是很聪明的)可能这样操作:植入一堆“AI行业”的文章、胡乱拼接成一段话、语气文雅但逻辑混乱、而你更想要的,是这样一位助手:🧩 会先拆解任务🔍 然后一步步查找资料🛠 动态调用工具🧠 最后整合并判断输出质量这时候,LangGraph就像给AI“加上大脑皮层”一样,把原本“线性答题”的流程,变成了“可思考、可控制”的

2025-08-12 11:36:07 706

原创 一文讲清Transformer 架构融合了哪些重要的数学理论,零基础小白收藏这一篇就够了!!

Transformer 是线性代数为骨架、概率论为推理机制、优化理论驱动学习、信息论衡量表现,并融合了微积分、组合数学与数值分析的复合体。

2025-08-12 10:37:57 789

原创 企业新基建MCP + LLM + Agent架构,将打通AI Agent的“神经中枢”,看到就是赚到!!

近年来,AI大模型席卷各行各业,我们感受到它强大的语言理解和生成能力。但在实际应用中,光“能说会道”还不够,更重要的是“能说还得能做”。大模型如何跨出文本世界,触达数据库、调用接口、执行代码?答案就是:MCP(Model Context Protocol)模型上下文协议。今天这篇文章,我们将详细解读 MCP 能做什么、它的工作原理以及它是如何打破大模型“只能说不能做”的边界。后面的文章中会分享Cursor等IDE中配置MCP服务器、Cherry Studio等支持MCP的聊天应用、MCP开发等系列文章。

2025-08-10 08:00:00 870

原创 【大模型实战】这个 GitHub 项目让你 5 分钟搭建 AI 知识库,真的牛!!

这个基于 AI 大模型的开源知识库搭建系统,可以帮你轻松搞出来一个智能化的产品文档、技术文档、FAQ甚至博客系统。无论是企业内部的技术文档,还是面向用户的产品说明,PandaWiki 都能轻松胜任。

2025-08-09 08:00:00 688

原创 AI Agent Prompt是什么?智能体Prompt如何设计?看完这一篇你就知道了!!

“AI Agent的能力,大多藏在Prompt里,可以说Prompt决定了智能体的行为准则。它是智能体的 “行为指南”,定义了角色、任务与决策逻辑。没有好的Prompt,再强的模型也是“无头苍蝇”,反之精准的Prompt,能让Agent从机械的执行流程中解放出来,升级为可以灵活应变的智能工具,是低成本释放AI潜力的核心钥匙,更是中小企业的福音!”

2025-08-08 11:47:13 657

原创 AI大模型与知识图谱结合的这几种方式,你知道几种?

大模型自从去年底爆火出圈以后,很多人把大模型和知识图谱进行比较,甚至大量业内人士认为在大模型的发展下,知识图谱已经没有存在的必要了。那么真实情况,或者未来更有可能的一种情况是什么样的呢?

2025-08-08 11:20:50 970

原创 【产品经理必看】从产品视角,读懂 AI Agent 究竟是什么?看到就是赚到,建议收藏!!

在计算机、人工智能技术领域,agent 常被译为 “智能体”,是具备自治性、反应性、社会性等智能特征的实体。而在产品语境中,OpenAI 对 AI Agent 的定义更具指引性 —— 以大语言模型为 “大脑”,能自主理解、规划、记忆、使用工具,自动化完成复杂任务。简单说,AI Agent 不是单一功能模块,而是像有自主意识的 “数字员工”:能理解用户需求(比如你说 “整理一周旅行攻略并预订行程” ,它能拆解需求),会规划步骤(先查目的地景点、再算交通路线、最后预订住宿),还能调用工具(对接地图、预订平台

2025-08-08 10:19:56 814

原创 【AI大模型】如何提升大模型的记忆效率?LangChain 的「记忆压缩术」给你答案

智能体执行任务离不开 上下文。上下文工程(Context Engineering)既是一门艺术,也是一门科学,其核心在于,在智能体运行轨迹的每个步骤中,精准地将恰好适量的信息注入其上下文窗口。本文将通过回顾多个热门智能体实例及相关研究论文,解构上下文工程的四大核心策略——“保存、筛选、压缩、隔离”,并深入探讨 LangGraph 如何为这些策略提供强大支持!

2025-08-07 14:16:57 910

原创 【AI大模型教程】一文详解AI 智能体架构中的协议设计三部曲:MCP → A2A → AG-UI,零基础小白收藏这一篇就够了!!

AI 智能体应用在企业实际落地越来越多,一个完整的 AI 智能体应用系统通常包含三个主要角色:用户、AI 智能体和外部工具。AI 智能体架构设计的核心任务之一,就是解决这三个角色之间的沟通问题。这三个角色的沟通,涉及到:MCP 协议、A2A 协议和 AG-UI 协议。其中,MCP 协议解决 AI 智能体和外部工具的标准化交互问题;A2A 协议解决 AI 智能体间的标准通信问题;AG-UI 解决前端应用(比如:APP)和 AI 智能体间的标准交互的问题。

2025-08-07 11:54:21 946

原创 【AI大模型教程】一文带你了解dify如何支持多agent架构,看到就是赚到,建议收藏!!

我们经常会用dify 来实现明确场景的agent或者工作流,但是一些复杂场景的时候我们就需要使用多agent架构,本文介绍了agent和workflow的区别以及在dify中如何实现多agent架构。

2025-08-07 11:03:42 553

原创 【AI 基础知识】Transformer 架构为何能统治AI领域?看完这一篇你就懂了!!

沿着 AI 的发展脉络,本系列文章从Seq2Seq到RNN,再到Transformer,直至今日强大的GPT模型,我们将带你一步步深入了解这些关键技术背后的原理与实现细节。无论你是初学者还是有经验的开发者,相信读完这个系列文章后,不仅能掌握Transformer的核心概念,还能对其在整个NLP领域中的位置有一个全面而深刻的认识。那就让我们一起开始这段学习之旅吧!

2025-08-06 19:18:49 566

原创 【AI大模型入门教程】向量数据库从踩坑到精通的完整攻略,零基础小白收藏这一篇就够了!!

说起向量数据库,我得先聊聊最开始在做RAG项目时遇到的一个头疼问题。当时我有几万份技术文档需要检索,用传统的关键词搜索总是找不到我想要的内容。比如我搜"机器学习",但文档里写的是"AI算法",结果就错过了。

2025-08-06 14:01:20 550

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除