开发 RAG 应用的两种方式,大模型入门到精通,收藏这篇就足够了!

RAG应用开发的两种方式详解

开发 RAG 应用的两种方式

当前有两种主要的开发 RAG 应用的方式:一种是使用低代码开发平台,另一种是使用主流的大模型应用开发框架。

一、使用低代码开发平台

这类开发平台的代表是一些主流的商业大模型公司的开发平台,比如百度的 AppBuilder 、阿里云的百炼大模型服务平台、字节跳动的 Coze 开发平台等,还有一些独立的大模型应用开发平台,比如开源的 FastGPT 、 Dify 等。这些平台的主要特点如下。

(1)使用简单、便捷。借助可视化的应用定义与配置,可以快速开发属于自己的 RAG 应用。

(2)通常包含完整的开发工具栈。比如,数据集与知识库的管理工具、应用测试工具、 WebUI 应用或 API 发布工具。

(3)部分平台会支持 RAG 应用工作流设计。通过可视化拖曳与少量编码的方式,可以提供一定程度的应用流程编排,实现低代码开发。

(4)部分平台支持灵活地选择模型,包括嵌入模型与大模型。可以根据模型的特点与需求灵活搭配多种模型,从而实现更优的输出效果。

当然,软件开发的便捷性与灵活性往往是一对矛盾体。使用低代码开发平台快速开发 RAG 应用会存在以下问题。

(1)低代码开发平台一般需要在线开发与部署。由于 RAG 应用通常为知识密集型的应用,因此一些比较敏感的领域与企业可能会面临安全合规方面的挑战。

(2)低代码开发平台通常面向更通用的需求与场景而设计,比如简单的私有知识对话与搜索,但在面临一些企业级应用中更个性化的需求时会捉襟见肘,无能为力。

(3)在企业级应用领域,有更高的工程要求与更多样的个性化业务需求,在一些关键场景中有更灵活的 RAG 范式与流程设计。这时,通用的低代码开发平台可能会无能为力。

(4)使用低代码开发平台开发的 RAG 应用的主要形式是知识查询与对话类应用,但这并不是 RAG 应用的全部形式。比如, RAG 还可以与其他 AI 智能体结合在一起,优化智体的输出,如开源的 Vanna 框架使用 RAG 思想向 Prompt中注入检索出的数据结构描述信息,以便优化 Text-to-SQL (将文本转换为关系数据库的 SQL 语句)输出的准确性。在这些场景中可能无法直接使用低代码开发平台开发 RAG 应用。

(5)对于开发人员来说,使用低代码开发平台有助于降低工作量,但它屏蔽了很多技术细节,让开发人员无法了解更多的底层原理,这给后期的应用优化与提高开发人员的技术能力增加了难度。

总的来说,使用低代码开发平台开发 RAG 应用快速、简单且部署方便,基本不存在后期维护问题,但缺乏足够的灵活性与个性化,同时在安全性上会面临挑战,可能更适合开发面向个人与小微企业的知识型应用或 AI 智能体,而开发面向 B 端的主流 RAG 应用或许需要更灵活的技术。

二、使用大模型应用开发框架

除了使用低代码开发平台开发常规的 RAG 应用,另一种开发 RAG 应用的方式是使用当下主流的开源框架。当前主流的大模型应用开发框架有LangChain公司的 LangChain 系列框架、Llamalndex公司的 Llamalndex 框架及微软公司的 AutoGen 框架,基本上都采用了开源结合少量商业服务的提供方式。这些框架的特点如下。

(1)具有易用的组件化与模块化设计、强大的功能、完善的开发文档。这些成熟的大模型应用开发框架经过了较长时间的发展与版本迭代,以及大量开发人员的使用与反馈,具备了较高的市场成熟度,在功能、性能、扩展性、第三方支持、使用文档、开发社区等方面都非常完善。

(2)屏蔽了底层的技术细节,帮助开发人员更专注于上层应用的逻辑与优化。成熟的大模型应用开发框架通常对基础设施的访问细节进行了屏蔽,提供了更易用的上层接口。比如,大模型的通信、各种格式文档的处理,以及一些复杂的底层算法等。

(3)大模型应用开发框架预置了大量的、可重用的封装组件,极大地提高了软件开发效率。应用开发无须重新"造轮子",而是进化成使用搭积木式的组装模式。此外,常见的开发框架通常会内置对一些先进的范式与算法的支持,具体到 RAG 应用,开发框架通常会内置大量的模块化 RAG 应用中常用的运算符与算法,甚至支持 RAG 工作流的灵活编排与开发。比如, LangChain 框架的 LangGraph 、 LlamaIndex 框架的 Query Pipeline 就采用图( Graph )的思想来帮助构造更灵活与更复杂的工作流程。

(4)大模型应用开发框架通常具备极好的灵活性与扩展性设计。一方面,在使用时可以根据自身的需要来派生大量的开发组件并定制其在特定场景中的行为;另一方面,独立的大模型应用开发框架内置了对第三方的支持,包括不同的大模型、数据源、嵌入模型、向量库、第三方 API 工具等,极大地提升应用扩展能力。(5)目前的大模型应用开发框架不仅提供了开发阶段的各种开箱即用的组件,还提供了帮助把应用更快地投入生产使用的、覆盖软件全生命周期的工程化平台或工具。比如, Llamalndex 框架内置了评估组件。在企业级应用场景中,这些组件、工程化平台和工具有助于原型应用快速地过渡到生产应用。

2.1、了解 LangChain

框架 LangChain 是一个著名的大模型应用开发框架。 LangChain 框架提供了一系列非常强大的组件与工具库,涵盖了应用的开发、测试、评估与部署的全生命周期。其中基础的 LangChain 开发库是完全开源免费的,可以用于从调用简单的大模型到开发复杂的 RAG 应用或 Agent 等各类应用。 LangChain 框架的结构如图所示。

LangChain 框架由以下开发库组成。

(1) LangChain-Core:基础抽象和 LangChain 表达语言( LCEL )。

(2) LangChain-Community:组件及内置的大量第三方技术集成模块,一般被封装为合作伙伴模块(例如 LangChain-openai )。

(3) LangChain:构成应用架构的上层核心组件,包括 Chains 、 Agents 等。

(4) Templates:官方提供的一些常见的应用模板。

(5) LangServe:   将 LangChain 链部署为 REST API 的平台。

(6) LangSmith:帮助开发者跟踪调试、测试、评估和监控大模型应用的在线平台。

此外,还有后期推出的用于构造更灵活、更复杂的 RAG / Agent 工作流的 LangGraph 组件等。总的来说, LangChain 开发库功能强大,几乎能够涵盖所有与大模型可能相关的应用类型,能够对接几乎所有第三方的大模型技术或服务,提供了强大的表达语言( LCEL )及 Chain 等各种简单而强大的组件。同时, LangChain 框架的技术学习门槛相对较高,组件结构庞大而复杂,而且由于版本快速迭代升级,某些部分存在过度封装或冗余设计之嫌。

2.2、了解 Llamalndex 框架

Llamalndex 是 Llamalndex 公司出品的用于连接客户数据与大模型,开发大模型应用的开源免费框架,具有简单、灵活与强大的特点。其整体的结构如图所示。

(1) Core Framework: 这是 Llamalndex 的核心框架,实现了 Llamalndex 框架中大量可扩展的基础组件与工具组件。

(2) Integrations:这是在 Core Framework 基础上由官方或者第三方提供的大量扩展组件。这些组件大大扩充了 Llamalndex 框架的兼容能力与应用场景,包括各种类型的数据加载器、大语言模型与嵌入模型、向量库、 Agent 工具等。

(3) Templates:这是官方或者第三方提供的更上层的应用模板。开发者可以基于这些模板来修改和开发自己的应用。

(4) Eval Datasets:评估数据集。这是一些用于测试评估的现成数据集。一个数据集通常包含两个部分:一部分是用于开发 RAG 应用的原始知识数据集;另一部分是用于评估 RAG 应用的测试数据集。

在 Llamalndex 框架中,核心框架以外的各类扩展组件、应用模板与数据集通常会放在LlamaHub 网络平台上。这是 Llamalndex 官方维护的一个存储库,用于发布、共享与使用开发大模型应用的各种组件与工具包。

Llamalndex 是一个开发生产级应用的大模型应用开发框架,具备以下特点。 

(1)面向生产级与企业级的应用。其基于成熟的 RAG 范式提供了大量易用、可靠与鲁棒的集成组件,用于数据加载、向量库访问、索引构造、模型访问等。

(2)灵活、可扩展、可定制化。尽管 LlamaIndex 框架提供了大量开箱即用的组件,但是开发者仍可以在其基础上派生与扩展,实现定制化组件。

(3)最适合开发 RAG 应用。相对于 LangChain 框架来说, Llamalndex 框架最初主要面向 RAG 应用环境,因此内置了大量模块化 RAG 范式中的优化组件与算法,且在使用上比 LangChain 框架更简单。

(4)内置了强大的 Data Agent 开发功能。与 RAG 应用以数据查询为主相比, LlamaIndex 框架允许在此基础上开发更强大的数据智能体,能够智能规划与使用外部工具进行一定的数据操控。此外,最新版本的 LlamaIndex 框架推出了查询管道( Query Pipeline )这样基于图结构编排 RAG 工作流的开发组件。

与 LangChain 框架相比, LlamaIndex 框架的学习与使用门槛更低,更侧重于 RAG 应用开发。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值