【项目实训】RAG框架初了解

杏仁橙橙饼

于 2024-05-29 15:37:01 发布

阅读量495

点赞数 3

文章标签：语言模型 langchain AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_63711281/article/details/139296963

版权

在项目实训过程中，根据项目实训的需要，我们选择首先了解RAG架构，希望借用RAG架构实现我们对大模型的应用。

网络上已经有许多介绍RAG架构的博客，这里主要介绍RAG架构以及实现RAG架构的Langchain，并探索了我们使用RAG架构的可能性。

RAG流程

入库
- 入库就是把原始分本分割，然后每个分割后的短文本，进行分词（chunk），然后向量映射（embedding），最后入库。
- 库一般使用向量数据库
查询
- 查询时先查询本地向量知识库，查询也被转换成向量，以便与文档的嵌入向量进行比较，抽取数据，把结果作为大模型的输入，进行查询

Langchain

langchain可以实现基于各种数据库的问答

文档加载器loader，支持加载各种文档
文本分割 text splitters
- 打对勾的是可以展示每个文本的来源的文本分割器
存储
- 通常使用vectorStore 和embeddings模型完成，langchain中集成了

langchain可以与任何大语言模型进行集成

如果是openAI（如果用GLM，改成GLM的API密钥，将API密钥存储在环境变量中)

如果直接调用本地部署的大模型，就不用api钥匙了

安装依赖：

设置环境变量：

（如果是glm-6b: 本地部署用chatlocal

文本加载、分割、存储

我们需要爬取数据，保存数据，可以采用文件存储csv或者nosql（mongoDB）

比如：使用mongoDB

这里chroma中会自动根据向量的特征建立索引，所以无需手动建立索引
检索，prompt

(换成我们的promt就行)

RAG处理管道，将检索到的文档格式化为一个字符串，使用prompt,输入到llm，解析大模型输出，转换成字符串格式
- 调用：
  - 向LLM问问题，将会得到输出

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。