vLLM 在一台机器上8个A10的GPU的部署模型的方案

最新推荐文章于 2025-07-09 16:03:14 发布

MonkeyKing.sun

最新推荐文章于 2025-07-09 16:03:14 发布

阅读量1.3k

点赞数 7

CC 4.0 BY-SA版权

文章标签： vLLM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sunyuhua_keyboard/article/details/143469532

在一台配有8个A10 GPU的机器上部署 vLLM 模型的方案可以参考以下步骤：

1. 环境准备

操作系统：确保你的操作系统是最新版本，建议使用 Ubuntu。
CUDA 和 cuDNN：安装与 A10 GPU 兼容的 CUDA 和 cuDNN 版本。确保这些组件与 PyTorch 版本兼容。
Python 和依赖项：安装 Python 3.8 或更高版本，并安装 vLLM 及其他相关库：
```
pip install torch torchvision torchaudio
pip install vllm
```

2. GPU 配置

环境变量：设置环境变量以确保 PyTorch 可以使用所有 GPU：
```
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
```
GPU 监控：可以使用 nvidia-smi 命令监控 GPU 的使用情况，确保在运行模型时 GPU 资源正常。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MonkeyKing.sun 对你有帮助的话，可以打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。