大模型笔记4:RAG检索增强生成

大模型的缺陷

大模型的知识不是实时的,不具知识更新。

大模型可能不知道你的私有领域内/业务知识。

大模型幻觉。也就是看似合理但其实是错误的内容。

RAG的概念

建立索引

将文本数据转换为向量存储,为后续检索提供基础。

1.数据清洗与提取:将PDF、Docx等文件中的内容转换为纯文本,去除无关信息。

2.切分文本:将文本切分为chunk,以便后续的向量化和检索。

3.向量化:使用嵌入模型将chunk向量化,并将chunk与向量以键值对的形式存储到向量数据库中,以便于后续的搜索。

检索生成

用户输入问题后,系统将问题转换为向量,与向量数据库中的文档块向量计算相似度。

检索相似度最高的k个文档块,作为回答当前问题的上下文。

提示词模板:请阅读{知识文档块},请问{问题指令}。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值