基于开发者空间云主机部署DeepSeek构建RAG向量数据库

1 概述

1.1 案例介绍

DeepSeek 是一家创新型科技公司,长久以来专注于开发先进的大语言模型(LLM)和相关技术。该公司推出了比较出名的模型有 DeepSeek-V3 和 DeekSeek-R1。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

通过实际操作,让大家熟悉如何通过云主机部署DeepSeek,并且通过本地部署的DeepSeek快速搭建RAG向量数据库!

1.2 适用对象

  • 企业
  • 个人开发者
  • 高校学生

1.3 案例时间

本案例总时长预计60分钟。

1.4 案例流程

image.png 说明: ① 云主机安装Ollama; ② 使用Ollama部署DeepSeek和mxbai-embed-large词向量模型; ③ 云主机获取项目代码及调取本地DeepSeek; ④ 上传数据集,构建RAG向量数据库。

1.5 资源总览

本案例预计花费总计0元。 |资源名称|规格|单价(元)|时长(分钟)| |-|-|-|-| |云主机|2vCPUs 4GB X86 Ubuntu 22.04 Server定制版|免费|60

2 云主机部署DeepSeek

2.1 安装Ollama

Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。 在云主机桌面右键选择Open Terminal Here,打开命令终端窗口。 image.png 执行安装命令如下: 方式一(推荐,安装速度快):

curl -fsSL https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0035/install.sh | sudo bash

image.png 方式二(备用,耗时较久、失败频率较高):

curl -fsSL https://ollama.com/install.sh | sh

image.png

2.2 模型部署

接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:

ollama run deepseek-r1:1.5b

image.png 部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了: image.png 在桌面重新打开一个终端将以下命令复制进去,下载mxbai-embed-large 词向量模型。

ollama pull mxbai-embed-large

image.png

3 RAG向量数据库创建

3.1 虚拟环境创建

打开云主机桌面CodeArts IDE for Python。 image.png 打开后,点击新建工程,输入工程名称:RAG,点击创建image.png

创建好后,左下角选择管理->设置image.png 在搜索框中输入:active,勾选在使用插件创建的终端中激活Python环境image.png 打开终端,前方出现(venv)字样表示创建成功,如果没有请点击小垃圾桶图标关闭终端重新打开一下。 image.png

3.2 RAG向量数据库构建

左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1

image.png 下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。

cd chatpdf-rag-deepseek-r1

image.png 进入到目录后在终端复制以下命令下载相应环境包。

pip install -r requirements.txt

image.png

3.3 RAG向量数据库功能实现

下载完毕后,在CodeArts IDE for Python中点击进入chatpdf-rag-deepseek-r1目录,对rag.py文件进行修改。用以下代码替换rag.py文件的第23行代码:

def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):

修改后的效果如下: image.png 修改完毕后,终端输入以下命令运行,首次运行可能会出现输入Email,出现时输入自己常用Email即可,输入完毕后效果如下:

streamlit run app.py

image.png 同时浏览器会自动弹出网址界面。 image.png 图示英文字符的意思如下: - Upload a Docunment:上传文档; - Settings(Number of Retrieved Results (k)):检索结果数; - Similarity Score Threshold:相似度得分阈值; - Chat History:聊天记录; - Message:提示信息。 注:上传的文档格式需要为PDF格式。 这里我们提前准备好了数据,数据可以用浏览器打开以下地址下载获取: https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf 上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍,这里上传数据是为了使大模型能够进行RAG向量数据库的生成,使DeepSeek可以读取到数据库中的内容。 下载完毕后点击图中Browse files字样进行数据上传。 image.png 选择下载的数据,点击打开进行数据上传。 image.png 上传后等待读取(过程需要一点时间请耐心等待),数据中包含AI方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。 image.png 可以看到返回信息,结合我们上传的数据进行检索生成。 至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值