自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(491)
  • 收藏
  • 关注

原创 构建智能体系统,你需要掌握这8个核心要点

许多人以为,只要接入一个大模型,系统就能自动变得“智能”。这些问题的根本,不在模型本身,而在系统设计架构上。真正可落地的智能体系统,远不只是一个“会对话”的接口,而是一个具备目标感、执行力和自我调优能力的智能执行系统。许多人以为,只要接入一个大模型,系统就能自动变得“智能”。这些问题的根本,不在模型本身,而在系统设计架构上。真正可落地的智能体系统,远不只是一个“会对话”的接口,而是一个具备目标感、执行力和自我调优能力的智能执行系统。

2025-11-24 13:16:26 606

原创 一文讲清:多模态学习:多模态融合 + 跨模态对齐

多模态学习(Multimodal Learning)作为一项关键技术,通过综合处理文本、图像、音频、视频等多种数据模态,显著增强了模型对复杂信息的解析能力。其本质在于发挥各模态间的互补优势与冗余特性,克服单一模态的信息边界,复现人类通过多感官协同实现认知的机制。:通过异构数据的有机整合,系统性提升模型的感知维度与理解深度;:建立不同模态数据间的精确映射关系,为后续融合奠定结构化基础。

2025-11-24 11:25:57 561

原创 AI智能体(Agent)保姆级入门指南,零基础小白也能轻松上手

举个例子,你对聊天机器人说“帮我订一张明天去上海的机票”,它可能会告诉你去哪个App或者网站操作。但如果你对一个机票预订智能体下达同样的指令,它会直接帮你完成查询、筛选、下单、支付等一系列动作,你只需要确认即可。这就是“聊天”和“干活”的根本区别。

2025-11-24 11:22:18 520

原创 全面掌握 AI Agent 30 个高频面试的问题与解答相关的核心知识点!

AI 智能体是能够自主决策并执行任务的系统,运行过程中几乎无需人为干预。它们能够理解环境、做出推理,并根据实时数据与上下文动态调整其行为。这些智能体通常结合了机器学习(ML)、自然语言处理(NLP)、强化学习(RL)等相关的技术,以实现不断优化与演进。RAG(Retrieval-Augmented Generation)是一种结合外部知识检索与生成式 AI 的方法,显著提高答案的准确性与上下文相关性。它特别适用于对最新资讯或专业知识要求较高的场景。示例:医疗类智能体可实时检索最新研究成果,给出权威建议。

2025-11-24 11:18:05 358

原创 用 llm + SQLite 实现自然语言到 SQL 的智能转换:一个实战案例

通过本次实践,我们展示了如何利用llm,结合SQLite数据库,构建一个简单却强大的“自然语言转 SQL”系统。整个流程清晰、易于复现,适合初学者上手,也具备实际应用价值。

2025-11-24 11:03:00 625

原创 一文读懂 MCP、RAG、Agent

最近,AI 圈被三个词刷屏了 ——MCP、RAG、Agent!几乎每天都有新的相关工具冒出来,各大技术论坛、行业群聊得热火朝天。但不少朋友一看到这些术语就犯迷糊:它们到底是啥?能干啥?和我们普通人又有啥关系?别慌!今天就用最接地气的方式,带你彻底搞懂这些概念,看完秒变 AI 达人!MCP 其实是个 “多面手”,不过我们重点关注模型上下文协议(Model Context Protocol),它就像 AI 世界的 “万能转换器”。想象一下,你家里有各种不同插头的电器,想插到插座上得配不同转接头,麻烦又混乱。

2025-11-21 13:52:46 461

原创 AI的下半场!Agent智能体--全景解析

AI Agent(智能体)是一种具备环境感知、自主决策与行动执行能力的人工智能系统。Agent是一个系统,其核心能力架构包含四个关键维度:① 感知能力(Perception)--解析、 理解环境信息与用户输入、进行知识推理、生成文本;② 规划能力(Planning)--制定目标导向的任务策路;③行动能力(Action/ToolUse)--调用工具或API执行操作;④ 记忆能力(Memory)--存储并关联历史交互与知识。一言以蔽之。

2025-11-21 13:46:15 570

原创 中国大模型发展现状与未来趋势

近年来,国家对"人工智能+"战略持续推进,AI大模型发展进入快车道,成为推动新一轮人工智能产业变革的重要引擎。阿里巴巴近期一次性更新了三个大模型,开源全模态大模型Qwen2-Omni、开源图像编辑大模型Qwen2-Image-Edit,以及不开源的语音识别大模型Qwen2-TTS。这三大模型的发布标志着大模型正加速跨越从单一任务到复杂场景的转型。

2025-11-21 13:38:15 776

原创 一文看懂大模型热门核心概念:LLM、Prompt、AI Agent、RAG...

大模型(

2025-11-21 13:36:11 733

原创 5步构建企业级RAG应用:Dify与LangChain v1.0集成实战

Dify与LangChain v1.0的集成,代表了AI应用开发的新范式——无需在易用性和灵活性之间妥协。通过本文介绍的五个步骤,您已经掌握了构建企业级RAG应用的核心技术:从Dify的可视化工作流设计,到LangChain的高级检索实现;从性能优化的关键策略,到常见问题的解决方案。现在,是时候将这些知识应用到实际项目中了。无论您是希望提升客服效率、优化内部知识库,还是构建全新的AI产品,Dify与LangChain的组合都能为您提供强大的技术支撑。

2025-11-21 13:25:08 603

原创 与大模型共舞:从 DeepSeek 到模块化智能应用开发

从 ModelScope 获取模型,到 Jupyter 中实验验证,再到模块化封装与工具集成,我们正在构建一个开放、灵活且强大的大模型应用开发生态。DeepSeek 这样的开源模型不仅是技术成果,更是创新的起点。未来,随着工具调用、记忆机制与多模态能力的融合,大模型将真正从“知识库”进化为“智能体”,在现实世界中发挥更大价值。

2025-11-20 15:20:42 909

原创 大模型时代的向量数据库

在科技浪潮的奔涌中,人工智能正以颠覆性的力量重塑未来图景。当GPT系列模型突破千亿参数门槛,当向量数据库在万亿级数据检索中展现惊人效率,一场由“大模型+向量数据库”驱动的AI革命,正在重构产业经济的底层逻辑。这场变革不仅关乎技术迭代,更预示着人类与数字世界的交互方式将发生根本性转变。

2025-11-20 15:10:39 723

原创 Happy-LLM:从零开始的大语言模型原理与实践教程

Happy-LLM》项目是一个系统性的 LLM 学习教程的开源项目,旨在帮助学习者深入理解大语言模型的核心原理和训练过程,并能够亲手搭建和训练一个 LLM。适合大学生、研究人员和 LLM 爱好者阅读,建议具备一定的编程经验(尤其是 Python)和深度学习基础。

2025-11-20 15:07:48 712

原创 什么是注意力机制?什么是自注意力机制?二者有何区别?

自注意力(Self-Attention)是让输入序列中的每个元素(如单词)通过。

2025-11-20 15:04:50 987

原创 前端开发 AI Agent 智能体,需要掌握哪些知识?

有了 Agent 就可以把 AI 应用到各个真实的业务场景中,这是一个逐步进化和落地的过程。例如你的输入是“猴子喜欢吃”,LLM 会在自己海量的训练数据中计算,找到一个列表,其中“香蕉”的概率最大,它就返回“香蕉”。我个人也会继续在 AI Agent 领域继续深耕,把我擅长的面试、刷题、简历、教程等领域全部 AI 赋能,使用 AI 增加效率,以更快捷的服务于更多用户。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

2025-11-20 14:57:24 948

原创 豆瓣评分 9.4,为什么很多人都在推荐这本大模型书?

作为一个对 LLM 工作原理很感兴趣,但又常常被各种零散教程绕晕的人,我读完 Sebastian Raschka 的《从零构建大模型》之后,其实挺松一口气的。我原本以为这本书要么会过度简化、要么会高度抽象,甚至可能出现那种你先接受这个公式就好的玄乎讲法,但它其实很踏实,从最基础的模块开始讲起,一步步带你把模型搭出来。

2025-11-19 13:55:52 706

原创 RAG技术详解:让大语言模型减少幻觉

通过 RAG,语言模型可以使用从矢量数据库中检索到的信息(预计是可靠的)来确保其响应基于现实世界的知识和背景,从而降低出现幻觉的可能性。正如本文前面所讨论的,向量数据库帮助我们以向量的形式存储信息,其中每个向量捕获有关被编码文本的语义信息。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。例如,由于 LLM 是使用静态语料库训练的,也就是说,它训练完成并实现部署,它将不知道部署后的时间发生的事情。

2025-11-19 13:51:33 754

原创 一文讲清:AI大模型中AI Agent的定义、分类及发展趋势

AI大模型(Large AI Models / Large-scale AI Models) 是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系。从应用领域角度分类,AI大模型分为通用大模型、垂直大模型;按输入数据类型,AI大模型分为单模态大模型、多模态大模型;按开放性分类,AI大模型分为开源大模型、闭源大模型。

2025-11-19 13:47:58 914

原创 打破信息壁垒:手把手教你实现DeepSeek大模型的天气查询功能

大模型需要明确的指导才能正确使用工具。我们通过工具描述来告诉DeepSeek如何与我们的天气查询函数交互。# 来自openai接口定义tools = [# 一个工具就是一个函数"description": "获取指定城市的当前天气",# 北京天气怎么样,提取北京"description": "城市名称,如'北京'" # 告诉llm需要提取参数},"required": ["location"] # 指定必需参数。

2025-11-19 13:41:40 708

原创 让 LLM 与外界对话:使用 Function Calling 实现天气查询工具

tools = ["description": "获取指定城市的当前天气","description": "城市名称,如‘北京’"},有一个叫的函数可用它需要一个location字符串参数它的作用是查天气步骤说明工具定义使用 JSON Schema 描述函数签名第一次调用设置tools和,让模型决定是否调用解析 tool_calls从中提取函数名和参数执行真实函数在本地运行 Python 函数(如网络请求)返回结果以的消息格式追加到对话历史第二次调用让模型基于工具结果生成最终回答。

2025-11-19 13:35:13 960

原创 让AI替你打工(一): 简介

AI Agent是通过传感器感知环境、处理信息,并通过执行器作用于环境以实现特定目标的系统。可以将其视为能够观察、思考和行动的数字化实体(类似人类与环境的互动方式,但以编程和有目的的方式实现)。AI Agent 的概念建立在理性行为的基本理念上: Agent 应采取能最大化实现既定目标可能性的行动。这种理性将 AI Agent 与简单响应程序区分开来。

2025-11-17 13:32:54 907

原创 从零开始学习大模型(LLM): 学习路线与知识体系详解

对于普通程序员而言,系统学习大模型技术是一次重要的职业升级。为了帮助你清晰地规划学习路径,我结合多个权威的学习路线,为你梳理出一套从基础到实战的。下面这张流程图汇总了核心的学习阶段与关键技能,你可以用它作为整体路线图。

2025-11-14 17:14:40 778

原创 Java程序员系统学习大模型(LLM): 学习路线与知识体系详解

对于Java程序员而言,系统学习大模型(LLM)技术是一次极具价值的职业升级。你已有的,正是大模型从研究走向落地所亟需的优势。下面这份为你量身定制的学习路线,将帮助你平滑地完成这次跨界。下面这张图谱为你勾勒了整个学习路径的全貌,你可以先建立整体认知,我们再一步步深入。

2025-11-14 17:08:52 736

原创 一文讲清:深度学习——自注意力机制是什么?

传统模型通常聚焦于X与Y的关联分析,而自注意力机制的创新之处在于揭示了X内部元素间潜在的重要关联。以文本预测任务为例,模型不仅需要理解前文句子的表层含义,还需捕捉句子内部词汇组合对后续内容产生的深层影响。为解决这一挑战,自注意力机制通过动态计算序列中每个元素(如a1与a2、a3的交互关系)的关联强度,结合反向传播算法,智能识别对当前任务最具关键性的特征部分。

2025-11-14 17:06:17 452

原创 大型语言模型中的“因果错觉”:一项基于权变判断任务的深度解析

在认知科学中,“权变”(Contingency)是指两个事件之间客观存在的统计关联强度。它是人类和动物进行因果学习时所依赖的一个至关重要的线索。简单来说,如果我们想判断事件A(潜在原因)是否导致了事件B(潜在结果),一个理性的方法是比较“当A发生时B发生的概率”与“当A不发生时B发生的概率”。二者之间的差异,即ΔP = P(结果|原因) - P(结果|无原因),就量化了这种权变关系。

2025-11-13 16:03:46 690

原创 构建LLM:每个AI项目都需要的知识图谱基础

知识图谱不仅仅是一个数据库。知识图谱是一种不断演进的图数据结构,它由一组类型化的实体、它们的属性以及有意义的命名关系组成。知识图谱针对特定领域构建,整合结构化和非结构化数据,为人类和机器创造知识。因此,知识体系建立在四大支柱之上:1.演进:不断更新的信息,无需结构性调整即可无缝整合新数据。2.语义:通过类型化的实体和显式关系来表示有意义的数据,从而捕捉领域知识。3.集成:能够灵活地协调来自多个来源的结构化和非结构化数据源4.学习:支持人类和机器进行查询、可视化和推理。

2025-11-13 16:00:22 584

原创 一文看懂 Agentic AI:搭建单体 vs 多智能体系统,结果出乎意料!

最近,我开始尝试构建不同类型的 Agentic AI 系统,最让我着迷的,是“单智能体(Single-Agent)”和“多智能体(Multi-Agent)”的差异。说实话,在没真正动手之前,我也只是听过这些概念,觉得听起来很玄。直到我用和亲自搭建了两个版本,一个“单兵作战”,一个“多智能体协作”,结果真的让我彻底改观。我想造一个能帮我追踪科技趋势的“研究助手 Agent”。它的任务很简单:每天帮我找出过去一天或一周内科技圈的热门话题,再挑出哪些是真正“值得报道”的。

2025-11-13 15:55:43 887

原创 小白也能训大模型!Hugging Face用「200页手册」亲自教学,连踩的坑都告诉你了...

对于技术小白而言,能否快速从零开始训练一个世界级的大语言模型(LLM)呢?答案或许是:可以的。日前,Hugging Face 在技术博客《The Smol Training Playbook: The Secrets to Building World-Class LLMs》中,以训练 3B 参数大小的 SmoILM3 为主线,系统剖析了构建 SOTA 语言模型的全过程,包括预训练、后训练和 infra,足足 200 多页内容,详细记录了哪些方法有效、哪些无效,以及如何确保其可靠运行。

2025-11-13 15:27:24 754

原创 一文讲清:MoE混合专家模型是什么?

MoE技术不仅是一项成熟且强大的技术,更是一个充满活力的研究领域。展望未来,它将驱动着更大、更强、更高效的AI模型的诞生。

2025-11-13 15:22:44 1013

原创 AI大模型API算力平台:2025年技术从业者的效率革命

对于技术从业者而言,选择可靠的算力合作伙伴,建立长期稳定的技术基础设施,是在AI时代保持竞争力的重要策略。同时,平台级的资源调度和负载均衡,确保了计算资源的高效利用,符合绿色计算的可持续发展理念。值得注意的是,算力市场的竞争正在推动服务质量的持续提升。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

2025-11-12 14:11:11 554

原创 Spring AI 实现MCP简单案例

MCP(Model Context Protocol)是一种专为人工智能模型设计的通信协议,旨在解决复杂AI系统中多个模型或组件之间的协同工作问题。你可以把MCP想象成AI领域的"USB接口",它提供了一种统一的方式将AI模型连接到各种工具和数据源。

2025-11-12 14:07:59 1009

原创 LangChain智能体核心组件概述

是将与工具相结合,创建能够的系统。LLM智能体循环运行各种工具以实现目标。智能体持续运行,直到满足停止条件为止——即模型发出最终输出或达到迭代次数限制。

2025-11-12 14:02:35 507

原创 面向 LLM 的 GPU 系统工程方法论

这是大多数机器学习工程师起步并投入最多时间的地方:定义 Transformer 层、将其接入 PyTorch、依赖自动微分系统,并将一系列张量运算串联起来。

2025-11-12 13:58:36 916

原创 LangChain1.0智能体开发:人机协作

对于更具特殊性的工作流,你可以直接借助 “中断原语”(interrupt primitive)和 “中间件抽象层”(middleware abstraction)构建自定义HITL逻辑。请先参考上文所述的 “执行生命周期”,理解如何将中断功能集成到智能体的运行流程中。

2025-11-12 13:54:33 741

原创 LLM 训练基础概念与流程简介

明确模型的输入与输出定义模型的损失函数LLM,即大语言模型,本质上是一个“token 接龙”高手,它不断预测下一个词符。这种推理生成方式被称为自回归模型,因为模型的输出会作为下一轮的输入,形成一个循环。刚开始,一个随机大模型,面对输入,它预测的下一个字符完全是随机的那么,它是如何学习的呢?在自注意力机制中,通过为 qk 增加掩码,softmax 后将负无穷对应到 0,隐藏掉 n 字符以后的内容。这样,输出的第 n+1 个字符只能关注到前 n 个字符,如同戴上了一副“只看过去”的眼镜。

2025-11-11 15:56:06 532

原创 彻底搞懂Token!

恭喜!现在你已经不再是Token小白了。

2025-11-11 15:52:59 811

原创 一文教你搞懂RAG的原理

文档解析技术的本质在于将格式各异、版式多样、元素多种的文档数据,包括段落、表格、标题、公式、多列、图片等文档区块,转化为阅读顺序正确的字符串信息。,可以首先利用关键词检索精确定位到“订单 12345”的信息,然后通过语义匹配扩展与该订单相关的其他上下文或客户操作的信息,例如“12 开头的订单、包装破损严重”等。一个完整的RAG索引架构如下。下图中仅仅混合检索,由于缺乏有效的排序,我们期望的结果位于第一和第四位,尽管依然可以被检索到,但理想情况下,如果检索方式更为精确,该结果应该被优先排序在前两位。

2025-11-11 15:45:42 890

原创 教你如何设计一个高价值的 Prompt:从思维到架构实现

结构化思维:用数据库建模法定义 Prompt。模块化设计:用视图、函数实现可复用逻辑。事件驱动优化:通过反馈和触发器不断改进。最终,你会拥有一套能持续进化、自动优化的 Prompt 系统,而不仅仅是一个提示词。

2025-11-11 15:41:32 833

原创 AI 智能体 RAG 入门教程

您是否正在寻找⼀种可靠的⽅法来构建智能知识客服或强⼤的知识库?检索增强生成 (RAG)技术正是您实现这些⽬标的理想选择。RAG,全称为 Retrieval-Augmented Generation,中⽂译为检索增强⽣成。检索:根据⽤户的提问,从现有的知识库中精准地找出最相关的⽂档或信息。⽣成:依据检索到的⽂档内容,智能地⽣成准确、连贯的答案。RAG 是当前最主流的 AI 问答解决⽅案之⼀,已被⼴泛应⽤于企业级知识助⼿和智能客服系统的搭建,帮助众多企业提升客户服务效率和知识管理⽔平。

2025-11-07 14:37:56 1019

原创 大模型“进修深造”(Fine-tuning):用微调打造“懂行”的智能客服

想象一下,你请来一位博学多才的通用助理,他上知天文下知地理,但对你的行业术语和业务流程一无所知。“微调”就像是送这位助理去参加你行业的“岗前培训”,让他快速掌握专业知识和表达方式。比如说,如果你在医疗行业,通用AI可能知道“CT”是什么,不一定清楚“增强扫描与平扫的适应区别”。但通过微调,我们可以让AI学习大量医疗文献、诊断指南和病历数据,让它不仅能听懂专业术语,还能按医生的思维模式回答问题。

2025-11-07 14:20:01 679

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除