【保姆级】ollama 部署 deepseek-r1 70B 模型完整指南

ollama 部署 deepseek-r1 70B 模型完整指南

图片

Ollama运行界面

一、模型下载与准备

1. 获取GGUF格式模型文件

通过ModelScope平台下载量化后的模型文件(推荐Q5_K_M中等量化级别):

pip install modelscope
modelscope download --model unsloth/DeepSeek-R1-Distill-Llama-70B-GGUF DeepSeek-R1-Distill-Llama-70B-Q5_K_M.gguf --local_dir  /DeepSeek-R1-Distill-Llama-70B-GGUF

技术说明:GGUF(GPT-Generated Unified Format)是专为LLM设计的跨平台格式,支持CPU/GPU混合推理,特别适合在苹果芯片设备或纯CPU环境运行。Q5_K_M量化在保持94%精度的同时,将模型体积压缩至49GB。

二、Ollama环境配置

1. 安装Ollama推理框架

参考官网ollama/ollama: Get up and running with Llama 3.3, Phi 4, Gemma 2, and other large language models.

curl -fsSL https://ollama.com/install.sh | sudo sh

2. 配置远程访问(可选)

参考ollama/docs/faq.md at main · ollama/ollama

如需通过其他设备访问,需修改服务配置:

sudo nano /etc/systemd/system/ollama.service

[Service]部分添加:

Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_ORIGINS=*"

刷新服务配置:

sudo systemctl daemon-reload
sudo systemctl restart ollama

三、模型配置文件编写

创建Modelfile配置文件:

# 这里填入gguf文件路径
FROM /home/DeepSeek-R1-Distill-Llama-70B-GGUF/DeepSeek-R1-Distill-Llama-70B-Q5_K_M.gguf

# 以下为模型模板配置
TEMPLATE """{{- if .System }}{{ .System }}{{ end }}
{{- range $i, $_ := .Messages }}
{{- $last := eq (len (slice $.Messages $i)) 1}}
{{- if eq .Role "user" }}<|User|>{{ .Content }}
{{- else if eq .Role "assistant" }}<|Assistant|>{{ .Content }}{{- if not $last }}<|end▁of▁sentence|>{{- end }}
{{- end }}
{{- if and $last (ne .Role "assistant") }}<|Assistant|>{{- end }}
{{- end }}"""


PARAMETER stop "<|begin▁of▁sentence|>"
PARAMETER stop "<|end▁of▁sentence|>"
PARAMETER stop "<|User|>"
PARAMETER stop "<|Assistant|>"

PARAMETER num_ctx 12800

参数解析

  • stop: 设置对话终止符

  • num_ctx: 扩展上下文窗口至12800 tokens

四、模型加载与运行

1. 创建Ollama模型实例

ollama create DeepSeek-R1-Distill-Llama-70B-Q5_K_M -f /home/DeepSeek-R1-Distill-Llama-70B-GGUF/Modelfile

2. 验证模型列表

ollama list

# 预期输出
NAME                                           ID              SIZE     MODIFIED
DeepSeek-R1-Distill-Llama-70B-Q5_K_M:latest    dd7ae729f6fc    49 GB    46 minutes ago

3. 启动模型服务

ollama run DeepSeek-R1-Distill-Llama-70B-Q5_K_M:latest

成功运行后将进入交互式命令行界面。

图片

image.png

五、远程访问验证

访问http://{服务器IP}:11434/,出现以下界面即表示服务正常运行:

界面显示 Ollama is running,表示可以远程访问

Ollama服务状态

六、高级应用场景

现在可通过以下方式接入模型:

  1. Open WebUI:搭建可视化聊天界面

  2. API集成:通过RESTful API对接应用程序

  3. LangChain:构建自动化AI工作流

<think>好的,我需要帮助用户了解如何使用Ollama下载deepseek-r170B模型。根据用户提供的引用信息,我应该分步骤解释整个过程。首先,用户需要安装ModelScope来下载模型文件,然后配置Ollama的Modelfile,最后创建和运行模型实例。我要确保每一步都清晰,包括必要的命令和参数设置,比如选择量化别Q5_K_M,扩展上下文窗口到12800 tokens。同时,要提醒用户注意模型文件的大小和硬件要求,以及如何验证安装是否成功。最后,生成相关问题来覆盖用户可能遇到的后续疑问,比如量化别的选择、配置参数的作用等。</think>以下是通过Ollama部署deepseek-r1:70b模型完整步骤: ### 一、环境准备 1. 安装Python包管理器 ```bash pip install modelscope ``` 2. 创建模型存储目录 ```bash mkdir -p /home/DeepSeek-R1-Distill-Llama-70B-GGUF ``` ### 二、模型下载 使用ModelScope平台下载量化模型(推荐Q5_K_M中等量化别): ```bash modelscope download --model unsloth/DeepSeek-R1-Distill-Llama-70B-GGUF \ DeepSeek-R1-Distill-Llama-70B-Q5_K_M.gguf \ --local_dir /home/DeepSeek-R1-Distill-Llama-70B-GGUF ``` 注意:模型文件约49GB,需确保存储空间充足[^2] ### 三、Ollama配置 创建Modelfile配置文件: ```bash FROM /home/DeepSeek-R1-Distill-Llama-70B-GGUF/DeepSeek-R1-Distill-Llama-70B-Q5_K_M.gguf PARAMETER num_ctx 12800 # 扩展上下文窗口 PARAMETER temperature 0.7 PARAMETER num_predict 4096 ``` 保存为`/home/DeepSeek-R1-Distill-Llama-70B-GGUF/Modelfile`[^3] ### 四、模型部署 1. 创建模型实例 ```bash ollama create DeepSeek-R1-Distill-Llama-70B-Q5_K_M -f /home/DeepSeek-R1-Distill-Llama-70B-GGUF/Modelfile ``` 2. 验证安装 ```bash ollama list # 应显示: # DeepSeek-R1-Distill-Llama-70B-Q5_K_M:latest dd7ae729f6fc 49 GB ``` 3. 启动服务 ```bash ollama run DeepSeek-R1-Distill-Llama-70B-Q5_K_M:latest ``` ### 五、API调用配置 在Ollama界面选择: ``` 模型提供方:OLLAMA API API域名:默认 模型选择:deepseek-r1:70b ``` [^1]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

呱牛 do IT

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值