今天拿到了滴滴云内测版A100,跑了一下 TensorFlow基准测试,现在把结果记录一下!
运行环境
平台为:滴滴云
系统为:Ubuntu 18.04
显卡为:A100-SXM4-40GB
Python版本: 3.6
TensorFlow版本:1.15.2 NV编译版
系统环境:
测试方法
TensorFlow benchmarks测试方法:
https://github.com/tensorflow/benchmarks
resnet50_v1.5
python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50_v1.5
Step Img/sec total_loss
1 images/sec: 602.4 +/- 0.0 (jitter = 0.0) 7.847
10 images/sec: 606.8 +/- 1.2 (jitter = 5.4) 8.053
20 images/sec: 606.3 +/- 0.8 (jitter = 4.4) 8.102
30 images/sec: 605.8 +/- 0.8 (jitter = 3.8) 8.117
40 images/sec: 606.2 +/- 0.7 (jitter = 3.8) 7.893
50 images/sec: 606.1 +/- 0.5 (jitter = 3.0) 7.919
60 images/sec: 606.2 +/- 0.5 (jitter = 2.9) 8.104
70 images/sec: 606.6 +/- 0.5 (jitter = 2.9) 7.985
80 images/sec: 606.6 +/- 0.4 (jitter = 2.8) 7.805
90 images/sec: 606.6 +/- 0.4 (jitter = 2.8) 7.973
100 images/sec: 606.7 +/- 0.4 (jitter = 2.8) 7.644
----------------------------------------------------------------
total images/sec: 606.23
----------------------------------------------------------------
--use_fp16
python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50_v1.5 --use_fp16
Step Img/sec total_loss
1 images/sec: 1327.1 +/- 0.0 (jitter = 0.0) 7.972
10 images/sec: 1321.2

本文分享了使用滴滴云内测版A100进行TensorFlow基准测试的结果,详细记录了不同模型如ResNet50、AlexNet等在使用FP32及FP16精度下的性能表现。


最低0.47元/天 解锁文章
2460

被折叠的 条评论
为什么被折叠?



