RAG检索增强

HalukiSan

于 2024-07-22 00:15:33 发布

阅读量134

点赞数 1

文章标签：语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_73747463/article/details/140596676

版权

RAG检索增强

某些情况下，模型无法提供准确的答案，RAG应运而生，该架构整合了从大型知识库中检索到的相关信息，并以此为基础，指导大语言模型生成更准确的答案。

LLM主要面临的问题：信息偏差/幻觉、知识更新落后、内容不可追溯、专业知识欠缺、推理能力不足、应用场景受限、长文本处理较弱。

RAG是一个系统，简单的可分为数据处理、检索、增强、生成四个阶段。原始数据清理后，调用embedding模型计算embedding值，存入向量数据库（构建以及模型选择，可参考https://github.com/Halukisan/ModelDataBase: Es和向量数据库Milvus的构建与数据存储 (github.com)），然后将用户的问题输入到检索系统中，从数据库中检索相关信息，增强阶段：对检索的信息进行处理和增强。

对于模型训练，RAG和微调是两种主流方式

RAG可以更新检索知识库，无需重新训练，适合动态变化的数据，但模型的风格不好充分的自定义，推理时间也会变长，但可以有效的降低模型产生幻觉的概率，在使用RAG引用外部数据时，需要考虑隐私版权问题。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

HalukiSan 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。