单双卡4090挑战DeepSeek70B：本地部署效果揭秘

小深ai硬件分享

已于 2025-02-07 12:43:35 修改

阅读量1.2w

点赞数 37

文章标签：深度学习服务器人工智能

于 2025-02-07 10:49:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sunly31489/article/details/145489899

版权

一、引言

在人工智能领域，模型的规模与性能一直是开发者们关注的焦点。随着技术的不断进步，越来越多的超大模型被推出，其中DeepSeek70B无疑是近期备受瞩目的明星之一。然而因为访问人数过多，deepseek的服务器有时候相应不过来，因此把它部署到本地，以便获得更好的体验，作为一名ai爱好者，我最近尝试在单卡和双卡NVIDIA RTX 4090上本地部署了DeepSeek70B，并对其效果进行了实测。本文将详细分享我的部署过程、性能表现以及实际应用体验，希望能为对超大模型感兴趣的朋友提供一些参考。

二、准备工作

在开始本地部署之前，我们需要确保硬件和软件环境都已准备就绪。这一步骤至关重要，就像是搭建房屋前要先打好地基，只有准备充分，才能让后续的部署过程更加顺利。

（一）硬件与软件清单

本次测试硬件配置如下：

GPU 选用 NVIDIA GeForce RTX 4090，24GB 显存，分别用单卡和双卡测评。

CPU 选择≥16 核、主频≥2.5GHz 的 Intel Xeon 或 AMD EPYC 系列处理器，在数据加载和预处理阶段发挥重要作用。

内存准备≥256GB，因 70B 模型内存需≥1.5 倍模型参数内存（FP16），避免内存不足问题。

存储配备≥1TB 的 NVMe SSD，deepseek70b 模型文件约 140GB（FP16），高速读写可提升加载效率，也需足够磁盘空间存放。

软件环境：

操作系统：推荐使用 Ubuntu 20.04 及以上版本，其在深度学习领域有着广泛的应用和良好的兼容性，

最低0.47元/天解锁文章

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。