大语言模型入门（四）——检索增强生成(RAG)

最新推荐文章于 2025-04-25 14:36:50 发布

CM莫问

最新推荐文章于 2025-04-25 14:36:50 发布

阅读量927

点赞数 12

分类专栏：大语言模型从小白到咸鱼文章标签：语言模型人工智能自然语言处理算法 AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ChaneMo/article/details/142656421

版权

一、什么是检索增强生成

检索增强生成（Retrieval-Augmented Generation，RAG）由Facebook AI Research（FAIR）团队于2020年首次提出，这是一种结合了信息检索技术与语言生成模型的人工智能技术。它通过从外部知识库中检索相关信息，并将其作为提示（Prompt）输入给大型语言模型（LLM），以增强模型处理知识密集型任务的能力，如问答、文本摘要、内容生成等。RAG技术的优势在于它能够提供更加准确、丰富且符合用户需求的文本内容。它允许开发人员为生成模型提供最新的研究、统计数据或新闻，从而保持信息的时效性和相关性，缓解知识截止问题（模型的知识仅限于训练时的数据）和模型幻觉（模型生成不准确或虚假的信息）。

二、RAG的流程

RAG的工作流程通常包括以下几个步骤：

1、检索（Retrieval）：根据用户的查询，从预先构建的知识库中检索出相关的信息。这些信息通常被转换成向量形式存储在数据库中，通过计算查询与数据库中向量的相似度来检索最相关的信息。

2、增强（Augmentation）：将检索到的信息与原始查询结合起来，形成增强的提示词，这个增强的提示词包含了查询的上下文信息。

3、生成（Generation）：利用增强的提示词作为输入，大语言模型生成回答或完成特定的语言任务。

三、如何应用RA

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。