个人电脑本地部署DeepSeek671B满血版Q4大模型流程拆解与避坑攻略

前言

朋友们,你是否曾被DeepSeek官网或APP的一句‘服务器正忙,请稍后再试’气得拍桌而起?没错,这波操作不仅让人头疼,还让不少人心里打起了小算盘:如果能在自己的电脑上部署个大模型,那该多爽啊!但说到几百G的‘满血版’DeepSeek R1 671B,是不是光想想就心累?

别急,今天咱们来点不一样的——用一帮老硬件组合,让你在个人电脑上也能跑起来这数百GB的大模型,而且总成本竟然控制在万元以内!效果如何?这配置还能达到2.18 tokens/s的速度,简直物超所值。赶紧来看看这个神操作吧!

QQ20250211-191422

【视频演示】

挑战4张2080Ti22G纯本地部署Deepseek-R1 671B满血版大模型速度可达2.53tokens/s

1. 硬件配置

服务器:技嘉X99

CPU:单路E5-2673v4

显卡:2080Ti 22G*4

内存:512G

机箱:工作站全塔机箱

电源:1200W

image-20250218112655164

2. 软件配置

操作系统:Ubuntu 22.04.5

本地大模型运行工具:Ollama

curl -fsSL https://ollama.com/install.sh | sh

大模型:DeepSeek R1 671B满血量化版 404GB

ollama run deepseek-r1:671b

3. 调优配置

如果按默认安装Ollama会报内存溢出错误,这里配置了几个调优参数,可以使得显卡不再内存溢出,会使用内存当显存,同时因为是4张显卡启动,所以在开机初始化时,加了延迟10秒启动Ollama,这样会让4

评论 15
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小余要努力

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值