在 Linux 系统本地部署 DeepSeek 大语言模型完整指南

再往楠

已于 2025-03-01 10:38:47 修改

阅读量1.8k

点赞数 28

文章标签： linux 语言模型运维 ai AI编程

于 2025-03-01 10:02:11 首次发布

本文链接：https://blog.youkuaiyun.com/dyy_2009/article/details/145943501

版权

在 Linux 系统本地部署 DeepSeek 大语言模型完整指南

在这里插入图片描述

一、DeepSeek 简介与部署价值
DeepSeek 是由国内团队开发的高性能开源大语言模型，其推理能力接近 GPT-4，尤其在数学、编程和逻辑推理任务中表现优异。本地部署的优势包括：

隐私保障：数据完全离线处理，避免敏感信息泄露。
零延迟响应：无需依赖云端服务器，提升交互效率。
灵活定制：支持模型微调和本地优化。

二、部署前的准备工作

硬件要求

模型版本 CPU 核心内存显存（GPU）适用场景
1.5B 4核 8GB 可选低配设备快速体验
7B/8B 8核 16GB 6GB+ 编程/文本生成
32B+ 16核 32GB+ 24GB+ 复杂推理任务
（参考硬件配置表）
系统环境
- 推荐 Ubuntu 22.04 LTS 或 CentOS 8+
- 安装 curl 和 wget 工具：
```
sudo apt update && sudo apt install curl wget -y
```

模型版本	CPU 核心	内存	显存（GPU）	适用场景
1.5B	4核	8GB	可选	低配设备快速体验
7B/8B	8核	16GB	6GB+	编程/文本生成
32B+	16核	32GB+	24GB+	复杂推理任务
（参考硬件配置表）

三、安装 Ollama 框架
Ollama 是专为本地运行大模型设计的开源工具，支持一键部署 DeepSeek 等模型。

方法 1：官方脚本安装

下载安装脚本 
curl -fsSL https://ollama.com/install.sh | sh 
验证安装 
ollama --version

方法 2：手动加速安装（针对网络问题）

替换 GitHub 下载地址为加速源
export OLLAMA_URL="https://ghproxy.com/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux-amd64"
下载并安装 
wget $OLLAMA_URL -O ollama 
chmod +x ollama 
sudo mv ollama /usr/local/bin/

（参考加速方案）

四、部署 DeepSeek 模型

拉取模型
根据硬件选择合适的版本：

轻量版（1.5B 参数）
ollama pull deepseek-r1:1.5b 
高性能版（7B 参数）
ollama pull deepseek-r1:7b

启动模型服务

运行模型（后台模式）
ollama run deepseek-r1:7b 
测试对话 
>>> 你好，请写一段 Python 排序代码

文件存储路径

默认模型路径：/usr/share/ollama/.ollama/models
可通过环境变量修改存储位置：
```
export OLLAMA_MODELS="/mnt/ssd/models"
```

五、配置图形化界面（Chatbox）

下载 Chatbox
- 访问下载 Linux 版 APPImage 文件。
连接 Ollama API
- 打开 Chatbox → 设置 → API 配置：
  - API 类型：Ollama
  - 终端地址：http://localhost:11434
- 选择 deepseek-r1 作为默认模型。

六、高级配置技巧

开放远程访问
修改 Ollama 服务配置以支持远程调用：

# 编辑服务文件 
sudo systemctl edit ollama.service 
# 添加环境变量 
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
# 重启服务 
sudo systemctl restart ollama

多模型管理

# 查看已安装模型 
ollama list 
# 删除旧模型 
ollama rm deepseek-r1:1.5b

七、常见问题解决

端口冲突
修改默认端口号：
```
OLLAMA_HOST=0.0.0.0:2233 ollama serve 
```
显存不足
添加 --num-gpu 1 参数限制 GPU 使用：
```
ollama run deepseek-r1:7b --num-gpu 1 
```
模型下载中断
Ollama 支持断点续传，重新执行 ollama pull 即可。