使用deepseek r1模型打造本地化RAG知识库

诶尔法Alpha

已于 2025-02-24 16:56:20 修改

阅读量395

点赞数 3

分类专栏：大模型文章标签：人工智能语言模型神经网络深度学习

于 2025-02-08 15:21:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45354497/article/details/145478749

版权

大模型专栏收录该内容

3 篇文章

订阅专栏

众所周知大模型在解决通用问题非常厉害，但是在专业问题上的回答可能会不太准确，有时候会编造信息(大模型幻觉，大模型训练的数据集中没有这类问题或者较少，对这类问题的理解不够)，这时候我们可以利用RAG(Retrieval-Augmented Generation)增强信息检索和生成模型，能够从大规模知识库中检索相关信息并生成高质量的反馈，在对抗大模型幻觉、高效管理用户本地文件以及数据安全保护等方面具有独到的优势。

在这里插入图片描述
如图所示为RAG的流程，红色虚线为不使用RAG流程直接向大模型提问的普通流程。

ollama

ollama是一个用于本地管理和运行大模型的工具，首先到官网下载并安装ollama。
由于我是linux系统，所以运行命令
在这里插入图片描述
当报如下的错，则说明没安装curl，按照图中命令按照一下

权限不够可能有时候sudo运行还是有的权限不足，直接su进root账户就可以了。

下载deepseek模型

命令ollama run deepseek-r1:70b
这里我使用的是70b最大参数量的，根据电脑配置来选择模型大小。

下载embedding模型

使用nomic对私有数据embedding。
命令ollama pull nomic-embed-text
也可以使用别的不同的模型，推荐几个比较常用的
在这里插入图片描述
比如bge模型下载命令ollama pull bge-m3

下载AnythingLLM

用于构建基于大模型的私有化应用程序。
首先去官网下载，我是linux需要运行命令curl -fsSL https://cdn.anythingllm.com/latest/installer.sh | sh，下载完运行命令启动./AnythingLLMDesktop/start

搭建RAG本地知识库

首先准备了个文档，记录了当时本人的学习过程，将其上传作为本地知识库。
首先打开AnythingLLM新检个工作区，然后打开设置
在这里插入图片描述

1.选择大模型

在这里插入图片描述
提供商选择ollama，然后选择刚才下载的大模型，点右上角保存。

2.选择embedding模型

在这里插入图片描述
选择刚才下载的nomic模型然后保存。

3.上传本地数据库

首先使用没上传数据库的模型测试一下效果，问他相关内容
在这里插入图片描述
可以看他回答不出来，接下来我们进行上传，首先点击上传按钮

然后选择文件

上传向量化

然后新建一个会话向其提问，可以发现他能提取里面的内容进行回答

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。