tensorflow 多卡测试_阿里云 GPU 云服务器 TensorFlow 单机多卡训练性能实践

本文在阿里云GN5 GPU云服务器上,通过TensorFlow测试了InceptionV3、ResNet50、ResNet152、AlexNet、VGG16等模型的单机多卡训练性能,对比了Parameter Server(CPU/GPU)与Replicated(NCCL/NONE/PSCPU)策略的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

阿里云 GPU 云服务器 TensorFlow 单机多卡训练性能实践

4 性能实测

我们在阿里云上的 GN5 GPU 云服务器(8 卡 P100)上使用 TensorFlow 测试了 InceptionV3、ResNet50、ResNet152、AlexNet、VGG16 几个经典卷积神经网络的用于图像分类模型的训练性能,并使用不同的策略做了比较,具体实测数据如下。

4.1 InceptionV3

Parameter Server(CPU):

Parameter Server(GPU):

Replicated(NCCL):

Replicated(NONE):

Replicated(PSCPU):

4.2 ResNet50

Parameter Server(CPU):

Parameter Server(GPU):

Replicated(NCCL):

Replicated(NONE):

Replicated(PSCPU):

4.3 ResNet152

Parameter Server(CPU):

Parameter Server(GPU):

Replicated(NCCL):

Replicated(NONE):

Replicated(PSCPU):

4.4 AlexNet

Parameter Server(CPU):

Parameter Server(GPU):

Replicated(NCCL):

Replicated(NONE):

Replicated(PSCPU):

4.5 VGG16

Parameter Server(CPU):

Parameter Server(GPU):

Replicated(NCCL):

Replicated(NONE):

Replicated(PSCPU):

5 数据分析

来源: https://yq.aliyun.com/articles/318391

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值