AI大模型_学习君-优快云博客

原创【干货收藏】大模型时代的RAG技术：从核心逻辑到优化评估，全面提升AI问答质量

• 检索更准：召回覆盖率高、排序准确• 上下文更稳：文档干净、冗余少• 生成更真：幻觉率低、语义连贯通过多维指标量化“召回—生成—事实一致性”的全链路质量，结合自动评估 + 人类评估，实现持续闭环优化。随着大模型的持续爆火，各行各业都在开发搭建属于自己企业的私有化大模型，那么势必会需要大量大模型人才，同时也会带来大批量的岗位？雷军曾说过：站在风口，猪都能飞起来”可以说现在大模型就是当下风口，是一个可以改变自身的机会，就看我们能不能抓住了。那么，我们该如何学习大模型？

2025-10-15 14:44:34 859

原创【干货收藏】AI Agent三大痛点深度解析：知识库+工作流+Prompt工程，小白也能轻松上手

本文深入解析AI Agent开发的三大核心痛点，通过知识库、工作流与Prompt工程的全面讲解，帮助开发者构建高效可靠的智能系统。本文分为三部分，介绍Agent三大痛点：知识库+工作流+Prompt工程。第一部分是知识库，第二部分是工作流，第三部分是Prompt工程。正文:，需要深度结合业务场景进行设计。设计精准的提示词、编排可靠的工作流，以及构建和维护高质量的知识库，是设计AI Agent的三大痛点。

2025-10-15 14:43:21 1022

原创【必收藏】12-Factor Agents：让大模型Agent从能跑起来到能用起来的企业级设计指南

工具只是结构化输出，不仅仅是一个技术实现细节，更是一种高层次的架构哲学。大脑和四肢各司其职，通过定义良好的接口通信。对工具链的修改被隔离在单一模块中，变更成本最小化。添加新工具变得快速而安全。所有对外部系统的访问都通过一个集中化的关卡进行管理。遵循这一原则，是构建能够适应快速变化、易于团队协作的生产级Agent系统的核心保障。它确保了你的Agent基础设施是坚固而灵活的，能够支撑业务的长期发展。原则3是关于“协作”的原则。它不再将人类视为系统外的监督者，而是将其作为整个自动化流程中一个。

2025-10-05 10:01:01 872

原创多模态RAG实战指南：比想象更复杂的AI应用，程序员必学收藏

本文分享了作者将多模态模型与RAG系统结合的实践经验，揭示了多模态应用远比理论复杂的真相。文章详细剖析了多模态模型在实际业务中的应用挑战，特别是不同模态数据间的关联关系处理和数据召回方式等关键问题。对于想要探索多模态RAG系统的开发者来说，本文提供了宝贵的实战经验和思考方向，帮助你少走弯路，更高效地实现多模态与RAG的融合应用。多模态与RAG的结合是一个应用的实践过程，其实际操作远比理论要复杂得多。这段时间一直在搞RAG和Agent，然后使用的基本上都是基于文本处理的推理模型，基本上没用过多模态模型；

2025-10-05 09:58:47 810

原创【必藏干货】AI产品经理不是一种岗位，而是5种完全不同的职业，小白/程序员少走3年弯路

无论你选择哪一类，

2025-10-04 19:57:54 1192

原创【必收藏】构建高效AI Agent：提示词工程、工作流设计与知识库构建实战指南

本文系统介绍了在Agentic AI技术快速发展的背景下，如何构建可靠、高效的AI Agent应用。文章重点阐述了提示词工程、工作流设计和知识库构建三大核心竞争力的实践方法。在提示词方面，详细讲解了系统提示词的构成要素和优化技巧；在工作流设计上，推荐使用DSL描述替代自然语言；在知识库构建环节，介绍了RAG技术和向量数据库的应用。通过实战案例和优化建议，本文为开发者提供了从零构建AI Agent的完整指南，包括提示词优化工具、Mermaid流程图应用等实用技巧，帮助开发者快速掌握AI Agent开发的关键技

2025-10-04 19:52:29 946

原创大模型RAG实战宝典：从原理到应用的收藏级教程

简单查询 → Naive RAG（成本优先）全局分析 → Graph RAG（效果优先）复杂任务 → Agentic RAG（动态规划）完备性 ✓策略有效性 ✓设计价值：多模型验证 → 降低单点决策风险模块5：通用工具库工具典型场景计算器预算分配（例：5000×35%÷3人）Python解释器字数统计/数据清洗多模态处理器图文混合分析。

2025-08-29 15:28:29 1103

原创收藏！10分钟掌握5个技巧，彻底解决Dify知识库AI胡说八道问题

别再抱怨Dify不好用，可能只是你没用对方法。

2025-08-29 15:24:41 1295

原创 985硕士搞Java还是大模型?

《大模型时代Java程序员转型指南》摘要当前Java开发岗位面临严重内卷，低代码平台冲击基础岗位，35岁危机显著。相比之下，大模型AI领域存在新机遇，但算法岗门槛极高（需PhD+顶会论文）。建议转向模型应用层：1）利用开源模型快速搭建企业级解决方案；2）专注业务流程与提示词设计；3）发挥硕士学历在业务理解与技术落地的复合优势。学习路径可分为：应用开发→知识库构建→模型微调→商业部署，重点掌握RAG、向量数据库等核心技术。该方向既能规避算法岗的学历壁垒，又能抓住企业数字化转型红利期。

2025-08-25 21:11:36 802

原创涨薪50%，我是如何成功转行大模型算法的

涨薪50%，我是如何成功转行大模型算法的

2025-06-20 19:15:59 691

原创一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI 的区别和联系

我们要把 AI 大模型当做人的大脑，因此调用 AI 大模型，相当于调用一个人，把 AI 大模型当人看，TA 懂人话、TA 说人话、TA 会直接给出结果，但结果不一定正确。因此在 AI 大模型的推理基础上，通过 RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI（通用人工智能）。这些技术到底有哪些区别和联系，下图作了横向对比，接下来我们详细剖析下。

2025-06-20 19:12:18 1024

原创只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

2025-06-20 19:07:52 610

原创 Dify 实战教程 | 10分钟搭建你的 Chatflow（数据可视化助手）

本篇我们来聊聊如何使用 Dify 的 Chatflow（对话流程编排器），构建一个Excel 数据可视化助手。在此前的教程中，我们介绍了「聊天助手」和「Agent」构建助手的使用方式，本篇将介绍一种更可控、逻辑更清晰的构建方式——Chatflow 应用。

2025-06-04 16:22:34 1362

原创 Dify 实战教程 | 10分钟搭建你的聊天助手(旅游顾问)

步骤内容第一步新建应用，选择聊天助手第二步填写应用基础信息第三步设计提示词第四步配置用户输入字段（可选）第五步测试并发布零代码搭建专属聊天助手，就是这么简单！大模型作为新时代的风口，确实为那些希望转行或寻求职业突破的人提供了广阔的舞台。然而，是否选择进入这一领域还需综合考虑自身的兴趣、特长以及长远规划。通过构建基础知识体系、参与实际项目、拓展软技能、关注跨学科融合以及建立广泛的社交网络，你可以在这个充满机遇的新领域中迅速站稳脚跟。

2025-06-04 16:20:53 980

原创大模型好书推荐 - 《多模态大模型：技术原理和实战》（附送PDF电子版）

《多模态大模型：技术原理与实战》是一本深度解析大语言模型与多模态大模型的权威著作。该书系统回顾了大语言模型和多模态大模型的发展历史，详尽阐述了它们的技术原理、核心亮点以及主要特性。书中不仅介绍了众多关键的开源框架和配套工具，还详细讲解了模型的部署细则，同时特别精选了三个使用大模型为商业赋能的应用案例，为读者提供了从理论到实践的全面指导。

2025-06-03 17:12:38 1568

原创一文搞懂大模型的预训练（Pre-training）

今天来聊一聊BERT和GPT的预训练，从而了解大模型的第四步：Pre-training。预训练（Pre-training）是大语言模型（如BERT、GPT）训练的第一阶段，其核心目标是通过自监督学习从海量无标注文本中学习通用的语言表示（Language Representation）。这一阶段的目标是让模型掌握语言的语法、语义、常识等基础能力，为后续的微调（Fine-tuning）打下基础。

2025-06-03 17:11:00 1177

原创本地部署大模型实现扫描版PDF文件OCR 识别，笔记本可跑

在使用大模型处理书籍 PDF 时，有时你会遇到扫描版 PDF，也就是说每一页其实是图像形式。这时，大模型需要先从图片中提取文本，而这就需要借助 OCR（光学字符识别）技术。``像 Gemini 2.5 这样的强大模型，具备非常强的从图片中提取文本的能力。实际上，我们完全可以利用它来执行 OCR 任务。

2025-06-03 16:45:07 869

原创用LLM做文本分类，微调选base还是chat

使用Qwen2ForSequenceClassification实现文本分类任务。

2025-06-01 08:00:00 922

原创大模型入门，从入门到精通，收藏这一篇就够了，2025年最新版：最全合集，不容错过！

大模型（Large Models）的训练是近年来人工智能领域的核心技术之一，尤其是在自然语言处理、计算机视觉等任务中，如 GPT、BERT 等模型的成功背后，离不开复杂的训练过程。本文将为你介绍大模型是如何训练的，包括数据准备、模型架构、训练方法和硬件支持等方面。

2025-05-30 22:22:21 1034

原创大模型书籍 | 从入门到精通大模型就看一这一本《掌握Transformer：从零开始构建SOTA模型》（附PDF）

基于Transformer的语言模型已经在自然语言处理（NLP）研究中占据主导地位，现已成为一种新的范式。通过本书，您将学习如何使用Python Transformers库构建各种基于Transformer的NLP应用程序。

2025-05-30 22:18:47 900

原创五种RAG分块策略详解 + LlamaIndex代码演示

这篇试图说清楚：业界常用的五种 RAG 分块策略核心思想、LlamaIndex 代码演示以及 RAGFlow/Dify 等框架实践思路。

2025-05-29 16:25:03 996

原创基于Bad Cases的Dify合同审查案例演示（工作流拆解）

在 RAG 流程中，如何实现基于 Bad Cases（负面案例）的合同审查和合同生成（基于合同模板）的提问，算是一个很有代表性的进阶 RAG 应用方向，这篇针对其中的合同审查场景来做些介绍和演示。

2025-05-29 16:21:26 1432

原创大模型书籍安利：AI大模型训练数据白皮书|附PDF免费下载

本白皮书首先分析了大模型训练所需的数据类型，并从产业实践出发破解了对训练数据的常见迷思和误解。在上述基础上，本书进而对训练数据的质量和规模进行讨论，发现高质量数据应在实践中检验效果，而难以用前置的客观标准衡量。同时，本书探讨了合成数据作为解决高质量训练数据供给不足的新方案，及其在大模型训练中的潜力。

2025-05-29 16:17:02 1183

原创用 Vue3 + Node.js + RAG 构建 Al 讲义问答系统(接入豆包大模型)

随着大语言模型（LLM）的迅猛发展，将其应用于教育领域的讲义问答成为可能。然而，传统大模型在处理超出训练数据范围的专业问题时，往往会出现 “幻觉”（即捏造不正确的内容），降低回答的可信度。为了解决这一问题，业界提出了检索增强生成（RAG，Retrieval-Augmented Generation）技术。简单来说，RAG 就像让模型在开卷考试 —— 在回答问题前，先从外部知识库（如讲义文档）中检索相关资料提供给模型参考，从而提高答案的准确性并减少不可靠的臆测）。

2025-05-27 12:02:00 1503

原创「从零实现 RAG：基于 LangChain 的企业级问答系统实战」

在大模型逐渐普及的今天，Retrieval-Augmented Generation（RAG）作为提升模型可靠性和知识覆盖的重要技术方案，越来越多地被用于企业问答、文档助手、客户支持等场景。本文将带你从 0 开始，基于 LangChain 框架，逐步实现一个可落地的 RAG 系统。

2025-05-27 11:59:33 1487

原创 2025 AI大模型报告 | 《中国数字人发展报告(2024)》（附PDF免费下载）

数字人是通过多种数字智能技术创建，具备人类外观形象、声音语言、肢体动作与思维功能等特征的数字智能体。在技术层面，数字人通过数字建模手段实现，涵盖计算机图形学、动作捕捉、图形渲染、语音合成、深度学习等多项技术。当前，数字人正成为人工智能活跃的应用落地入口，对大数据、智能终端、具身智能等产业链接度、嵌入度、融合度较强，或将成为下一代互联网活跃的交互界面之一。

2025-05-23 16:25:37 551

原创【大语言模型基础】Transformer模型Torch代码详解和训练实战

Transformer是由谷歌在17年提出并应用于神经机器翻译的seq2seq模型，其结构完全通过**自注意力机制**完成对源语言序列和目标语言序列的**全局依赖建模**。Transformer由**编码器**和**解码器**构成。下图展示了它的结构，其左侧和右侧分别对应着编码器（Encoder）和解码器（Decoder）结构，它们均由若干个基本的 **Transformer Encoder/Decoder Block**（N×表示N次堆叠）。

2025-05-23 16:24:19 485

原创大模型实战：LangChain+WebBaseLoader实现大模型基于网页内容的问答系统

本文将详细介绍一个基于LangChain和Ollama、WebBaseLoader读取指定网页实现的RAG对话系统，从技术原理到实际代码，全面解析如何构建一个具有上下文感知能力的智能问答系统。

2025-05-21 16:23:53 1139

原创 AI大模型书籍：AI大模型训练数据白皮书|附PDF免费下载

本白皮书首先分析了大模型训练所需的数据类型，并从产业实践出发破解了对训练数据的常见迷思和误解。在上述基础上，本书进而对训练数据的质量和规模进行讨论，发现高质量数据应在实践中检验效果，而难以用前置的客观标准衡量。

2025-05-21 16:19:50 705

原创借助MarsCode AI助手分析LlamaIndex的工作流可视化

我们总结了LlamaIndex工作流的可视化部分的实现和细节，重点分析了如何利用Python中的pyvis库和Java中的图形库，分别在两种语言中构建和展示网络图。通过代码示例，我们详细探讨了如何构建节点、添加边并通过布局生成交互式图形，同时也提到了在Java中使用Jung库和GraphStream库时可能遇到的挑战与解决方案。

2025-05-13 15:26:08 759

原创 LlamaIndex+Ollama构建《劳动法》问答机器人

本文将一步一步引导大家如何使用LlamaIndex和Ollama构建一个针对《劳动法》的问答机器人。这个机器人能够理解并回答关于这本劳动法的各种问题。

2025-05-13 15:17:36 768

原创 99%的人都应该看看这本书，精简小册子让你快速跨入大模型的世界

书中首先介绍了大模型（LLM）的基础知识，包括语言模型、自然语言处理（NLP）以及Transformer架构，帮助读者快速理解GPT-4等模型的工作原理。通过这本书，读者能够快速掌握大模型的基础知识与开发技巧，特别适合初学者与想要在短时间内完成AI应用开发的开发者。在deepseek爆火的现在，大模型已经不再是开发者专享的东西，未来一定是大模型的世界，不管你是做什么工作，都应该来了解大模型，甚至是开始使用大模型。这一部分不仅帮助我理解了大模型的技术本质，也让我对NLP领域的前沿发展有了更系统的认识。

2025-05-07 16:16:09 682

原创 10分钟搭建AI聊天机器人：Python与LangChain实战教程

那天凌晨三点，我还在修复生产环境的bug。无意间打开了同事的代码，发现他用了近500行Python脚本来对接OpenAI API。天呐！这代码看起来像是用血泪写成的…我笑了。这不就是两年前的我吗？当初为了实现一个简单的AI问答功能，写了一堆繁琐的token处理、上下文管理和错误重试逻辑。如今有了，这些痛苦完全可以避免。LangChain到底是什么？它是构建LLM应用的"乐高积木"。Harrison Chase在2022年10月创建它时，可能没想到它会成为AI应用开发的事实标准。让我直接上手吧！

2025-04-28 17:53:57 1136

原创图解 LangChain 知识库导入导出，连续奋战只为你简化数据迁移

LangChain 就像是一个智能搬运工，可以帮你轻松搬运和转换各种知识库数据。2. 转换处理2. 知识库迁移3. 远程存储同步2. 知识库导出备份LangChain库是知识数据管理的得力助手，可以帮你：掌握这些技巧，你就能灵活管理AI知识库了，再也不怕迁移麻烦！反正我都连续肝了三天才把这套方案搞定，现在专门写出来，就是想让你少走弯路！大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “”“”等问题热议不断。不如成为，毕竟AI时代，谁先尝试，谁就能占得先机！想正式转

2025-04-28 17:49:43 1230

原创 AI大模型从概念到实践：RAG：从零开始，100行代码实现一套RAG系统（附代码）

把文档解析，切片，存入向量化库（向量库里存：文档切片，和对应向量）。

2025-04-21 17:06:37 807

原创葵花宝典之「知识库」调优秘籍！RAG优化指南！

RAG全称是。

2025-04-21 17:05:15 1071

原创 2024大模型新书《大模型基础》初学者的必入神器，看完头脑清晰！

为增加本书的易读性，每章分别以一种动物为背景，对具体技术进行举例说明，故此本书以六种动物作为封面。当前版本所含内容均来源于作者团队对相关方向的探索与理解，如有谬误，恳请大家多提issue，多多赐教。后续，作者团队还将继续探索大模型推理加速、大模型智能体等方向。相关内容也将陆续补充到本书的后续版本中，期待封面上的动物越来越多:) 本书当前内容目录如下，本教材为开源教材，旨在为对大语言模型感兴趣的读者。并且，本书还将针对每章内容配备相关的Paper List，以跟踪相关技术的。第 2 章大语言模型架构。

2025-04-16 16:27:41 190

原创 AI界唯一一本全面解析Transformer的书《Transformer、BERT、GPT 大语言模型原理深度解析》从入门到精通，真是太太太全面了！

此外，随着改进版Transformer架构（如Reformer、Longformer和Switch Transformer等）的出现，其在资源利用效率和处理超长序列的能力上得到了进一步优化和增强。Transformer组件详解：描述了Transformer的几个关键方面，如编码器包含六个包含自我注意力和前馈神经网络两层子层的块，而解码器同样包含六个块，但比编码器多一个用于处理编码器输出的多头注意力层。介绍了生成式人工智能的基本概念，特别是注意力机制这一Transformer架构的关键组件。

2025-04-16 16:25:28 772

原创 8个视觉大模型生成式预训练方法

大语言模型的进展催生出了ChatGPT这样的应用，让大家对“第四次工业革命”和“AGI”的来临有了一些期待，LLM和视觉的结合也越来越多：比如把LLM作为一种通用的接口，把视觉特征序列作为文本序列的PrefixToken，一起作为LLM的输入，得到图片或者视频的caption；也有把LLM和图片生成模型、视频生成模型结合的工作，以更好控制生成的内容。当然2023年比较热门的一个领域便是多模态大模型，比如BLIP系列、LLaVA系列、LLaMA-Adapter系列和MiniGPT系列的工作。

2025-04-14 17:37:01 1146

原创 LangChain 实战案例：使用 RAG 技术搭建商品快速查询系统

为了能够实现向量数据库的构建与应用，我们首先需要知道几个小的背景和流程：以上就是对RAG的一些简介，假如希望对创建一个完整的 RAG 系统有更多了解，可以参考我之前基于吴恩达DeepLearning.AI里“LangChain：Chat with your data”写的课程来了解更多信息！根据上面的信息我们其实已经对RAG系统有一个简单的了解了，那么下面我们就可以来更深入的看看如何利用一份简单的商品文档来利用进行构建属于我们自己的数据库问答系统。大家可以创建一个名为“商品详情.csv”的文件，并将下面的内

2025-03-28 16:10:44 705

空空如也

空空如也