滴滴云A100 40G+TensorFlow1.15.2 +Ubuntu 18.04 性能测试

本文分享了使用滴滴云内测版A100进行TensorFlow基准测试的结果,详细记录了不同模型如ResNet50、AlexNet等在使用FP32及FP16精度下的性能表现。

今天拿到了滴滴云内测版A100,跑了一下 TensorFlow基准测试,现在把结果记录一下!

 

运行环境

 

平台为:滴滴云

系统为:Ubuntu 18.04

显卡为:A100-SXM4-40GB

Python版本: 3.6

TensorFlow版本:1.15.2 NV编译版

 

系统环境:

 

测试方法

TensorFlow benchmarks测试方法:

https://github.com/tensorflow/benchmarks

 

resnet50_v1.5

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50_v1.5
Step    Img/sec total_loss
1       images/sec: 602.4 +/- 0.0 (jitter = 0.0)        7.847
10      images/sec: 606.8 +/- 1.2 (jitter = 5.4)        8.053
20      images/sec: 606.3 +/- 0.8 (jitter = 4.4)        8.102
30      images/sec: 605.8 +/- 0.8 (jitter = 3.8)        8.117
40      images/sec: 606.2 +/- 0.7 (jitter = 3.8)        7.893
50      images/sec: 606.1 +/- 0.5 (jitter = 3.0)        7.919
60      images/sec: 606.2 +/- 0.5 (jitter = 2.9)        8.104
70      images/sec: 606.6 +/- 0.5 (jitter = 2.9)        7.985
80      images/sec: 606.6 +/- 0.4 (jitter = 2.8)        7.805
90      images/sec: 606.6 +/- 0.4 (jitter = 2.8)        7.973
100     images/sec: 606.7 +/- 0.4 (jitter = 2.8)        7.644
----------------------------------------------------------------
total images/sec: 606.23
----------------------------------------------------------------

 

--use_fp16

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50_v1.5 --use_fp16

 

Step    Img/sec total_loss
1       images/sec: 1327.1 +/- 0.0 (jitter = 0.0)       7.972
10      images/sec: 1321.2 
### 如何安装和配置 TensorFlow 1.15.2 和 NVIDIA 版本的 TensorFlow #### 准备工作 为了成功安装并配置 TensorFlow 1.15.2 及其对应的 NVIDIA 版本,环境准备至关重要。确保操作系统支持 CUDA 工具包,并已正确安装所需的驱动程序。 #### 安装 Python 虚拟环境 建议创建独立的 Python 环境来管理项目依赖项。这可以通过 `virtualenv` 或者 Anaconda 来实现: ```bash # 创建虚拟环境 (Python 3.x) python3 -m venv tf_venv # 激活虚拟环境 source tf_venv/bin/activate # Linux/MacOS .\tf_venv\Scripts\activate # Windows PowerShell ``` #### 配置 pip 源加速下载速度 国内用户可考虑使用豆瓣 PyPI 镜像源或其他镜像站点提高下载效率: ```bash pip config set global.index-url https://pypi.douban.com/simple/ ``` #### 安装特定版本的 TensorFlow 对于 TensorFlow 1.15.2 的安装命令如下所示: ```bash pip install --upgrade tensorflow-gpu==1.15.2[^1] ``` 需要注意的是,在某些情况下可能还需要指定额外参数以匹配硬件条件或解决兼容性问题。例如,当目标平台为 Nvidia GPU 并希望获得最佳性能时,则应选择带有相应标签的二进制文件。 #### 校验安装情况 完成上述操作后可通过简单的测试脚本来验证是否正常加载库: ```python import tensorflow as tf print(tf.__version__) sess = tf.Session() hello = tf.constant('Hello, TensorFlow!') print(sess.run(hello)) ``` 如果一切顺利的话,这段代码应该能够打印出所期望的 TensorFlow 版本号以及字符串 "Hello, TensorFlow!"。 #### 处理常见错误提示 遇到诸如 launchpadlib 报错等问题可能是由于本地环境中存在冲突或是缺少必要的组件所致。此时应当仔细检查日志信息中的具体描述,并参照官方文档排查原因[^3]。 #### 卸载与重试 若多次尝试仍未解决问题,不妨先彻底清除现有安装再重新开始: ```bash pip uninstall tensorflow tensorflow-gpu nvidia-tensorflow ``` 随后按照前述指导再次执行完整的安装流程即可。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值