【大模型】大模型项目选择 RAGvs微调？

最新推荐文章于 2025-05-09 13:22:01 发布

原创最新推荐文章于 2025-05-09 13:22:01 发布 · 250 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#大模型

大模型专栏收录该内容

2 篇文章

订阅专栏

RAG

输入问题，在知识库匹配知识，构建提示词：基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重，输入问题到调整后的大模型

如何选择

如果业务要求较高，RAG和微调可以一起使用

1-动态数据

选择RAG
原因：RAG将数据存放到数据库即可，微调需要重新训练模型，微调成本大

2-模型能力定制

选择微调
原因：用户想要回答有特殊口吻/专业内容等，如猫娘大模型/阅读研报/文本抽取内容，微调可以定制回答

3-幻觉

选择RAG
原因：带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

选择RAG
原因：RAG可以给用户输出知识库数据供参考，提高回答可信度

5-成本

选择RAG
原因：RAG只需要构建出知识图谱/知识数据库即可，而微调需要考虑数据集质量以及不断训练模型，微调成本高

6-依赖大模型通用能力

选择RAG
原因：微调会改变大模型的权重，提高模型专业能力，但会降低模型通用能力（模型遗忘）

7-延迟

选择微调
原因：RAG会有如知识库检索、排序、匹配等操作，会耗时

8-智能设备

选择微调
原因：移动端小模型，业务场景需要突出专业能力

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

静待缘起

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

详解大模型微调数据集构建方法(持续更新)

herosunly的博客

06-05

28万+

本文详细介绍了大模型微调数据集构建方法，希望能对学习大模型的同学们有所帮助。文章目录 1. 前言 2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四 2.5 方法五

大模型微调选择模型的实战技巧(持续更新)

herosunly的博客

07-11

20万+

本文主要介绍了大模型微调选择模型的实战技巧(持续更新)，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 实战技巧

参与评论您还未登录，请先登录后发表或查看评论

RAG还是微调？一文教你选对大模型增强方案

沛哥儿的专栏

04-23

1368

RAG 与微调并非彼此对立的两极，而是相互补充、相得益彰的增强策略。它们各自具备独特的优势和适用场景，就如同不同的工具，适用于不同的工作任务。对于中小企业而言，资源和预算相对有限，业务需求可能也更注重快速迭代和灵活性。RAG 技术凭借其较低的技术门槛和快速集成知识的能力，成为了一个理想的起步选择。通过 RAG，中小企业可以迅速搭建起智能应用的雏形，快速验证业务价值，以较低的成本实现业务的智能化升级。而大型企业通常拥有丰富的资源、庞大的数据集以及复杂多样的业务需求。

浅谈ai落地 - 微调跟Rag的结合有什么可以优化的地方

RayLobeCode的博客

04-13

804

曾在游戏世界挥洒创意，也曾在前端和后端的浪潮间穿梭，如今，而立的我仰望AI的璀璨星空，心潮澎湃，步履不停！愿你我皆乘风破浪，逐梦星辰！首先我们要明白RAG 和微调不是互斥的，而是可以分工明确、互相配合。下面是一个结构化的解释，包括工作流程图、介入点说明，以及工程落地建议。目标用RAG用微调扩充知识✅（文档召回）❌（大模型本身没更新）提升输出质量部分可行✅（专属风格/语气/格式）修复生成幻觉✅（引入真实依据）✅（优化生成逻辑）解决无法理解的问题❌✅（定制任务认知能力）

模型微调与RAG的选择

aksjebdjj的博客

09-08

1472

微调大模型适合知识库稳定且对回答风格、准确性要求极高的场景，但需要付出较高的训练和更新成本。RAG方案适合动态知识库，能更灵活地处理大规模企业数据，尽管架构复杂，但响应速度更快，尤其在知识库频繁更新时更具优势。

大模型微调出错的解决方案（持续更新）

herosunly的博客

06-13

20万+

本文主要介绍了大模型微调出错的解决方案（持续更新），希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动

大模型微调部署实战及类GPT工具的高效使用

herosunly的博客

07-24

22万+

本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容，希望对使用大语言模型的同学们有所帮助。文章目录 1. 前言 2. 专栏亮点 3. 你的收获 4. 详细目录

大模型微调和RAG的应用场景

热门推荐

herosunly的博客

06-19

24万+

本文主要介绍了大模型微调和RAG的应用场景，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 大模型微调 vs. RAG

AIGC理论基础：大模型通识

herosunly的博客

05-09

11万+

介绍了大模型（LLM）的基本概念、发展脉络、核心结构、训练过程、能力范围、优势与不足、发展现状及分类。大模型包括自然语言处理、多模态和科学计算模型，核心为Transformer架构的注意力机制，具有长距离依赖建模和全局感受野等优势。大模型训练需海量数据、强大算力和参数调整，能力涵盖文本生成、分类、情感分析、知识问答、代码生成、语言翻译和文本摘要等。尽管大模型在提升工作效率和激发创新能力方面表现突出，但仍存在模型幻觉、知识过时和训练成本高昂等问题。当前大模型发展呈现多家竞争态势，模型长度和输出模态不断增加。

大模型LoRA微调调参的实战技巧(持续更新)

herosunly的博客

05-01

20万+

本文主要介绍了大模型LoRA微调调参的实战技巧，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 实战技巧

精选资源

大模型指令微调概述，大模型微调简单介绍ppt

10-30

大模型微调，也称为指令微调（Instruction Tuning），是针对大型语言模型进行的一种优化方法。这种技术旨在缩小模型在预训练期间的无监督目标（如预测下一个单词）与用户期望的指令执行任务之间的差距。通过在特定的...

千问大模型简单微调小项目

08-27

本项目基于千问大模型微调医疗领域QA任务，因训练环境有限（4070笔记本，仅8G显存），微调效果有限，但能观察到前后差异。作为大模型小白，此前未接触相关技术，熬夜三天才搭建好本地环境，特记录过程及报错解决方案...

lenz0a89.gsd Lenze E84AYCPM gsd

12-05

lenz0a89.gsd Lenze E84AYCPM gsd

【大厂+2025】500+真题考点合规备考双通！.zip

12-05

【大厂+2025】500+真题考点合规备考双通！.zip

【微服务架构】基于Spring Cloud Alibaba的秒杀系统设计：高并发场景下库存超卖与分布式事务解决方案

12-05

内容概要：本文详细介绍了“秒杀商城”微服务架构的设计与实战全过程，涵盖系统从需求分析、服务拆分、技术选型到核心功能开发、分布式事务处理、容器化部署及监控链路追踪的完整流程。重点解决了高并发场景下的超卖问题，采用Redis预减库存、消息队列削峰、数据库乐观锁等手段保障数据一致性，并通过Nacos实现服务注册发现与配置管理，利用Seata处理跨服务分布式事务，结合RabbitMQ实现异步下单，提升系统吞吐能力。同时，项目支持Docker Compose快速部署和Kubernetes生产级编排，集成Sleuth+Zipkin链路追踪与Prometheus+Grafana监控体系，构建可观测性强的微服务系统。; 适合人群：具备Java基础和Spring Boot开发经验，熟悉微服务基本概念的中高级研发人员，尤其是希望深入理解高并发系统设计、分布式事务、服务治理等核心技术的开发者；适合工作2-5年、有志于转型微服务或提升架构能力的工程师；使用场景及目标：①学习如何基于Spring Cloud Alibaba构建完整的微服务项目；②掌握秒杀场景下高并发、超卖控制、异步化、削峰填谷等关键技术方案；③实践分布式事务（Seata）、服务熔断降级、链路追踪、统一配置中心等企业级中间件的应用；④完成从本地开发到容器化部署的全流程落地；阅读建议：建议按照文档提供的七个阶段循序渐进地动手实践，重点关注秒杀流程设计、服务间通信机制、分布式事务实现和系统性能优化部分，结合代码调试与监控工具深入理解各组件协作原理，真正掌握高并发微服务系统的构建能力。

MATLAB基于3D FDTD的微带线馈矩形天线分析[用于模拟超宽带脉冲通过线馈矩形天线的传播，以计算微带结构的回波损耗参数]