部署DeepSeek-r1+AnythingLLM

AnythingLLM 是一款开箱即用的一体化 AI 应用,支持 RAG(检索增强生成)AI 代理等功能。它无需编写代码或处理复杂的基础设施问题,适合快速搭建私有知识库智能问答系统

DeepSeek部署

DeepSeek-r1部署请参考:Ollama本地部署DeepSeek详细操作步骤_blobs文件夹-优快云博客

版本说明

AnythingLLM版本:v1.7.3-r2

软件下载

AnythingLLM下载地址:Download AnythingLLM for Desktop

或者从这里下载:AnythingLLMDesktop-v1.7.3-r2资源-优快云文库

如图下所示,选择Windows(x64)版本进行下载

软件安装

双击图标进行安装

根据需求选择为哪位用户安装,点击下一步

选择安装的目标文件夹,点击安装

时间可能会稍微有点长,耐心等待下

安装完毕,点击完成

防火墙提示,点击允许访问

软件配置

点击Get started

点击Ollama

Ollama模型Ollama地址按照图下所示进行配置

配置好之后,点击右侧的箭头

再次点击右侧箭头

这里可以选择跳过调查

设置一下工作区名称,然后点击右侧箭头

即可进入对话界面

设置中文显示

点击图下所示图标

按照图下所示将显示语言设置为中文

点击返回图标

软件使用

点击工作区

即可进行与DeepSeek的对话了~

### 部署 DeepSeek-R1 模型到 NVIDIA Tesla P40 #### 环境准备 为了成功部署 DeepSeek-R1 模型并利用 GPU 加速,环境配置至关重要。对于配备 NVIDIA Tesla P40 的 Windows 系统而言,确保安装了最新的 NVIDIA 显卡驱动程序以及 CUDA Toolkit 和 cuDNN 库是必要的[^2]。 #### 安装依赖项 通过命令提示符或 PowerShell 执行以下操作来设置所需的软件包: ```powershell # 更新系统并安装基础工具 choco install git python --yes # 创建虚拟环境用于隔离项目依赖关系 python -m venv deepseek-env .\deepseek-env\Scripts\activate.ps1 # 升级 pip 并安装其他必需组件 pip install --upgrade pip setuptools wheel ``` #### 获取 DeepSeek-R1 运行框架 Ollama 及其配套 UI AnythingLLM 下载官方发布的最新版 Ollama 和 AnythingLLM,并解压至指定目录下。按照官方文档中的说明完成初步配置工作。 #### 设置 GPU 支持 由于 Tesla P40 是一款支持 CUDA 计算能力较高的设备,因此可以充分利用其性能优势来进行推理计算。确认已正确安装适用于该款显卡的 CUDA 版本之后,可以通过如下方式验证 PyTorch 是否能够识别到可用的 GPU 设备: ```python import torch if torch.cuda.is_available(): device = 'cuda' else: device = 'cpu' print(f'Using {device} for inference.') ``` 如果输出显示 `Using cuda` 则表明一切正常;反之则需要排查相关驱动及库文件是否存在兼容性问题。 #### 启动服务端口监听 进入 Ollama 解压缩后的根目录执行启动脚本以开启 HTTP API 接口供后续调用: ```bash cd path_to_ollama_directory start ollama.exe serve ``` 此时浏览器访问 http://localhost:8080/api/v1/models/deepseek-r1 将返回有关加载状态的信息,证明服务器已经就绪等待请求到来。 #### 测试模型功能 借助 Postman 或 curl 工具向上述地址发送 POST 请求测试具体效果,例如输入一段文本让模型生成回复内容: ```json { "prompt": "你好啊", "max_tokens": 50, "temperature": 0.7 } ``` 以上即是在 NVIDIA Tesla P40 上搭建基于 DeepSeek-R1 大规模预训练语言模型的服务流程概述。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

欲买桂花同载酒、

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值