ubuntu下ollama/vllm两种方式在本地部署Deepseek-R1

最新推荐文章于 2025-11-02 17:49:01 发布

原创最新推荐文章于 2025-11-02 17:49:01 发布 · 2.4k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#ubuntu #linux #运维 #人工智能 #deepseek #ollama #vllm

部署运行你感兴趣的模型镜像

1.前言

今年过年，deepseek一下子爆火，导致我前段时间好好用的官网直接挤爆了，一直转圈圈到没心思过了，天天挂热搜，直接导致我的科研工作受阻（dog），好吧，话不多说，看看怎么在本地部署deepseek丝滑享受以及白嫖一下api体验>_<!
部署环境：
系统：ubuntu22.04
显卡：一张4090,24G显存

2.vllm部署deepseek-R1-8B

2.1 vllm安装

conda create -n vllm python==3.11
conda activate vllm
pip install vllm

2.2 模型下载

直接去HF官网找到官方发布的模型仓库https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B/tree/main，可以自己用浏览器下载或者迅雷下载（我觉得这个快一点）亦或者HF提供的下载方式

# Make sure you have git-lfs installed (https://git-lfs.com)
git lfs install

git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

下载路径随意

2.3 使用 vLLM 启动推理服务

python -m vllm.entrypoints.openai.api_server --model <你下载的模型的路径>  --served-model-name <Deepseek-R1-8B> --max-model-len=16384 --trust-remote-code

部署结束

3.ollama部署deepseek-R1-32B

3.1下载安装ollama

直接搜索ollama官网，首页直接下载，
在这里插入图片描述

ollama在linux上的下载命令如下：

curl -fsSL https://ollama.com/install.sh | sh

有时候可能下载会中断，按照下面的方法修改可以解决：

# 下载安装脚本
curl -fsSL https://ollama.com/install.sh -o ollama_install.sh

# 给脚本添加执行权限
chmod +x ollama_install.sh

# 使用github文件加速替换github下载地址
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh

#执行下载
sh ollama_install.sh