- 博客(1115)
- 收藏
- 关注
原创 大模型 RAG关键知识总结:信息检索 + 文本向量化 + BGE-M3 实践全解析!
本文整理一些文本向量化(embedding)和信息检索的知识,它们是如今大模型生成文本时常用的技术 —— “增强检索生成”(RAG)—— 的基础。
2025-06-15 11:00:00
801
原创 基于LangChain 的Function Calling 实战指南:零基础实现文本标注与信息抽取
无论你是初学者,还是有一定开发经验的技术爱好者,这篇教程都将用清晰的逻辑、丰富的实例帮助你快速掌握这项关键能力。
2025-06-15 09:45:00
660
原创 太强了!李飞飞团队新论文扩散 Transformer 设计与嫁接颠覆想象
模型架构设计需要做出诸如选择算子(如注意力、卷积) 和配置(如深度、宽度) 等决策。然而,评估这些决策对模型质量的影响需进行成本高昂的预训练,这极大限制了架构研究的广度与深度。受新软件基于现有代码构建这一思路的启发,研究团队提出核心问题:能否利用预训练模型研究新的架构设计?
2025-06-14 08:45:00
659
原创 初学者入门大模型之prompt工程,什么是prompt?什么是prompt工程?
Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。
2025-06-14 08:00:00
685
原创 AI智能体五大核心范式:反思→工具→推理→规划→多智能体
本篇文章将系统梳理五大主流Agentic Pattern——反思模式(reflection pattern)、工具调用模式(tool use pattern)、推理-行动闭环(react pattern)、规划分解模式(plan pattern)以及多智能体协作模式(multi-agent pattern)。 让我们一起走进AI智能体的世界,见证智能范式的变革与跃迁。
2025-06-13 11:24:59
709
原创 深度分析AI大模型的核心能力和典型应用领域,企业如何选择最合适的落地场景和服务?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
2025-06-13 10:36:07
969
原创 2025年想转行大模型?一般人我劝你还是别瞎折腾了!
科技的进步,生产力就很容易提升,进而就是不需要过多的人。最近在尝试借助一些工具,提升做事的效率,初步试验感觉很不错。网络上所有的东西,确实都可以利用新平台重做一遍。
2025-06-12 11:28:35
482
原创 AI大模型技术进阶学习——提示词(Prompt)、知识库、思维链(CoT)和Agent(代理)
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
2025-06-12 11:17:47
995
原创 2025大模型落地技术路线图,学会把大模型应用到自己的业务里,看完这篇就够了!
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-06-12 11:16:54
934
原创 2025 GraphRAG技术全景评测:12种创新方案深度解析
GraphRAG 是一种扩展的 RAG 范式,通过构建图结构来组织背景知识,其中节点代表实体、事件或主题,边代表它们之间的逻辑、因果或关联关系。它不仅检索直接相关的节点,还会遍历图以捕获相互连接的子图,从而发现隐藏的模式。
2025-06-12 11:11:30
826
原创 提示工程 vs 微调 vs RAG,大模型三种优化方式有什么区别?
提示工程、微调和检索增强生成(RAG)是三种主要优化大型语言模型输出的方法。提示工程简单易用,适合一般性话题,但定制性有限。微调则提供高度定制和精确响应,但成本和复杂性较高。RAG 通过结合外部数据源,提供最新、相关的信息,是一种在提示工程与微调之间的折中方案,特别适合需要动态信息和上下文相关性的场景。选择哪种方法取决于项目需求、资源和预期结果。
2025-06-11 14:25:26
939
原创 从零开始学大模型 AI Agent,看完这篇文章你就是LLM大师!
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
2025-06-11 13:57:34
938
原创 初学者入门大模型之提示词工程原理——提示学习(prompt learning)
了解和使用过大模型的人应该都知道提示词工程,即使不了解提示词工程,至少也应该听说过,提示词工程说白了就是一种和大模型交流的方法,它的作用就是让大模型更好的理解人类的需求。
2025-06-11 13:54:36
1277
原创 初学者必须要搞懂的大模型开发平台——Dify
Dify 是一个用于构建 AI 应用程序的开源平台。Dify融合了后端即服务(Backend as Service)和LLMOps理念。它支持多种大型语言模型,如Claude3、OpenAI等,并与多个模型供应商合作,确保开发者能根据需求选择最适合的模型。 Dify通过提供强大的数据集管理功能、可视化的Prompt编排以及应用运营工具,大大降低了AI应用开发的复杂度。
2025-06-11 12:00:30
690
原创 其实你才刚入门大模型Agent而已!不信你来试试这五个AI Agent难度关卡!
在 AI Agent 的世界里,绝大多数人卡在入门阶段,一听说 “工具调用+大模型=智能体” 就觉得自己已经掌握了 Agent 的精髓。但事实是,你可能只停留在Level 1。
2025-06-10 11:33:54
959
原创 初学者入门AI大模型微调,从入门到进阶指南!看完这篇你就懂了!
很多AI新手在接触大模型时都会被"微调"二字劝退。想实战没有环境?自己根本玩不转?本文带你用一杯咖啡的时间,了解大模型的微调技术,无需高端显卡,用魔塔社区免费资源即可实战体验,在实战中理解微调技术,感受薅羊毛的快乐!
2025-06-09 14:44:53
1101
原创 零基础小白入门AI大模型应用开发,你需要一个系统的学习路径!
随着大模型技术的飞速发展,我们正站在一个全新的技术前沿,探索着如何将这些强大的工具应用于实际问题的解决。如果你对AI大模型应用开发充满热情,那么你可以读一下这篇文章——一个系统全面的入门指南,专为渴望深入AI世界的你设计。
2025-06-09 14:41:22
928
原创 2025年那些想自学AI大模型的,骂醒一个算一个!
为啥说胡乱自学大模型的,能骂醒一个算一个。因为很多人学会个AI工具就觉得自己会玩大模型了,其实你才刚入门!
2025-06-09 14:38:00
591
原创 产品经理如何让AI更「聪明」?从Prompt Engineering到RAG详解
人工智能的竞争已经从「谁的模型更强」转向「谁能用得更好」。在大模型 API 逐步开放的今天,Prompt Engineering(提示词工程)和RAG(检索增强生成)成为AI产品经理的核心技能,它们决定了你的AI体验是“聪明绝顶“,还是”胡言乱语“。
2025-06-09 14:36:14
660
原创 2025未来就业报告:十大预测新兴行业 ——人工智能全领域赋能产业
未来十年,AI从业者将不再局限于算法工程师,而是形成"技术+场景"的复合型人才矩阵。
2025-06-09 14:35:12
690
原创 2025年新风口!程序员转行推荐这四个方向!
对于程序员转行方向的推荐,可以基于当前的技术趋势、市场需求以及程序员的个人技能和兴趣来综合考虑。以下是一些推荐的转行方向:
2025-06-09 14:17:43
1065
原创 2025转行指南:Java开发工程师转AI工程师,附大模型学习路线
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-06-08 09:30:00
2030
原创 大模型时代开发者进阶秘籍:从新手到高手的成长路径全解析
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
2025-06-08 08:45:00
926
原创 LLaMA-Factory 具体实践大模型训练的三个阶段:预训练、监督微调和偏好纠正
本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段,包括:预训练、监督微调和偏好纠正。
2025-06-07 18:01:45
777
原创 一篇带你玩转本地大模型:Ollama安装+deepseek部署+Dify接入+独立调用全攻略
本期具体内容包括1.Ollama下载安装、2.大模型部署(以deepseek为例)、3.Dify接入本地大模型、4.通过chatbox使用本地大模型(额外内容)。如果只想本地部署大模型可以只看1、2,如果想要通过Dify接入本地大模型可以看1、2、3,如果想脱离Dify直接方便的使用本地大模型可以看1、2、4。
2025-06-07 17:59:25
1115
原创 LangChain+RAG+Agent本地部署DeepSeek-R1商用级知识库,完美实现低代码可视化流程编排
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
2025-06-07 12:02:33
878
原创 全网最强最详细讲解大型语言模型的11种微调方法!看完你也能成为大模型大师!
大型预训练模型是一种在大规模语料库上预先训练的深度学习模型,它们可以通过在大量无标注数据上进行训练来学习通用语言表示,并在各种下游任务中进行微调和迁移。随着模型参数规模的扩大,微调和推理阶段的资源消耗也在增加。针对这一挑战,可以通过优化模型结构和训练策略来降低资源消耗。
2025-06-06 17:42:44
514
原创 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。
2025-06-06 17:39:24
994
原创 2025年AI Agent干货资料、论文综述都在这了
如果说LLM是大脑,AI Agent则为其赋予了感知环境、规划任务、调用工具(如搜索、API、代码执行)的“手脚”,使其能独立完成订票、数据分析、跨系统协作等实际需求。这种能力突破,让开发者无需从头训练模型,即可通过“智能体架构”激活LLM的无限潜力,成为未来AI应用创新的核心方向。
2025-06-06 17:37:32
1064
原创 为什么大模型会产生幻觉?如何减轻幻觉?
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
2025-06-05 17:13:33
892
原创 关于LLM微调&数据集的15问,真的很赞!
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
2025-06-05 17:07:29
692
原创 大模型RAG系统5种优化方案
RAG系统提升问答的准确率靠“强检索+基于文档生成”,但要提升拟人化和灵活性,需引入语言生成控制与对话设计的多项技术。推荐采用以下组合策略:
2025-06-04 13:48:51
1041
原创 AI大模型硬核项目《Happy-LLM》,从理论到实践的系统性教程,带你快乐学习大模型!
本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。希望大家能从这个项目开始走入 LLM 的浩瀚世界,探索 LLM 的无尽可能。
2025-06-04 13:38:51
1187
原创 一文彻底学懂Embedding(从传统嵌入方法到大模型Embedding)
Embedding是 LLM 的语义支柱,它可以将原始文本转换为向量形式来方便模型理解。 当你在使用 LLM 帮助您调试代码时,你的输入文本、代码会被转换为高维向量,从而将其中的语义转化成数学关系。
2025-06-04 13:36:38
1192
原创 AI大模型RAG文本分块指南:9种优化策略及其具体实现方法
检索增强生成(Retrieval-Augmented Generation, RAG)技术通过将外部知识检索与大语言模型生成能力相结合,实现了基于检索文本块(chunk)上下文的高质量内容生成。RAG系统的性能很大程度上依赖于文本分块策略的选择和实施。
2025-06-04 11:57:15
759
原创 【单Agent+MCP】VS【多Agent】架构:深度分析实践案例、部署策略与未来展望
接上篇《单Agent与多Agent架构对比分析(上)》,本文将带您走进智能体架构的实战领域,通过真实案例解析、实施策略和具体代码示例,帮助您将理论知识落地为可行方案。
2025-06-03 11:50:58
916
原创 【单Agent+MCP】VS【多Agent】架构:深度分析概念、优劣势与架构选择
随着AI智能体(Agent)技术的蓬勃发展,开发者面临着一个关键抉择:是使用功能齐全的单一智能体,还是构建由多个专业化智能体组成的系统?本文将揭开这两种架构的本质区别、各自优势以及如何做出明智选择。
2025-06-03 11:48:55
933
原创 终于有人说清楚了AI大模型核心术语:向量库、训练集、多模态
这篇文章,我会尽量用通俗易懂的语言,讲清楚这三个术语的含义,它的作用和背后的技术原理,帮助大家更好地理解AI。
2025-06-03 11:35:18
976
原创 深度解析Transformer模型的基本原理与Pytorch代码实现
解释一下这个结构图。首先,Transformer模型也是使用经典的encoer-decoder架构,由encoder和decoder两部分组成。
2025-06-03 11:16:49
1076
原创 一文搞懂大语言模型的发展历程和未来应用场景
在当今科技驱动的社会中,大语言模型(Large Language Model,LLM)已经深入到我们生活的诸多方面。作为一种生成式 Al(Generative Artifcial Intelligence,GAI),大语言模型使用机器学习技术,具备了深度理解语言并能够自主生成语言内容的能力。本文将介绍大语言模型的基本原理和发展历程,还会探讨大语言模型的现状和未来。
2025-06-02 09:00:00
756
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人