vllm-openai多服务器集群部署AI模型

服务器配置是两台ubantu系统电脑,每台电脑安装两张4090-48G显存的显卡,共计192G显存。

服务器1
在这里插入图片描述
服务器2
在这里插入图片描述
准备工作:
1.两台电脑都已经安装了docker
2.两台电脑都已经安装了nvidia驱动

参考vllm官方资料
https://docs.vllm.ai/en/latest/serving/distributed_serving.html#
在这里插入图片描述
1.先下载.sh文件
https://github.com/vllm-project/vllm/blob/main/examples/online_serving/run_cluster.sh

在这里插入图片描述
做主从关联
主节点(主节点是自己的ip)
nohup bash run_cl

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值