矩池云 RTX 2080 Ti+Ubuntu18.04+Tensorflow1.15.2 性能测试!

本文记录了使用RTX2080Ti显卡进行的TensorFlow基准测试结果,包括Resnet50、AlexNet、Inceptionv3等模型的性能表现,并与A100和V100进行了对比。
部署运行你感兴趣的模型镜像

今天为了对比滴滴云 NVIDIA A100,特地跑了一下RTX2080的TensorFlow基准测试,现在把结果记录一下!

 

运行环境

平台为:矩池云

系统为:Ubuntu 18.04

显卡为:RTX 2080 Ti

Python版本: 3.6.10

TensorFlow版本:1.15.2

 

显卡相关内容如下:

 

系统配置如下:

 

 

测试方法

https://github.com/tensorflow/benchmarks

 

Resnet50 BS64

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50
Step Img/sec total_loss
1 images/sec: 305.5 +/- 0.0 (jitter = 0.0) 8.220
10 images/sec: 305.2 +/- 0.3 (jitter = 0.7) 7.880
20 images/sec: 305.3 +/- 0.2 (jitter = 0.9) 7.910
30 images/sec: 305.1 +/- 0.2 (jitter = 0.8) 7.820
40 images/sec: 304.9 +/- 0.2 (jitter = 0.7) 8.005
50 images/sec: 304.8 +/- 0.1 (jitter = 0.9) 7.770
60 images/sec: 304.5 +/- 0.2 (jitter = 1.1) 8.114
70 images/sec: 304.3 +/- 0.2 (jitter = 1.3) 7.816
80 images/sec: 304.2 +/- 0.2 (jitter = 1.5) 7.975
90 images/sec: 304.0 +/- 0.1 (jitter = 1.5) 8.094
100 images/sec: 303.8 +/- 0.1 (jitter = 1.6) 8.035
----------------------------------------------------------------
total images/sec: 303.65
----------------------------------------------------------------

 

AlexNet BS512

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=512 --model=alexnet
Step    Img/sec total_loss
1       images/sec: 3939.5 +/- 0.0 (jitter = 0.0)       nan
10      images/sec: 3927.5 +/- 3.0 (jitter = 12.2)      nan
20      images/sec: 3923.9 +/- 2.1 (jitter = 11.7)      nan
30      images/sec: 3923.0 +/- 2.5 (jitter = 11.0)      nan
40      images/sec: 3921.2 +/- 2.0 (jitter = 9.4)       nan
50      images/sec: 3919.0 +/- 1.8 (jitter = 9.2)       nan
60      images/sec: 3915.4 +/- 1.9 (jitter = 11.5)      nan
70      images/sec: 3912.2 +/- 2.0 (jitter = 13.7)      nan
80      images/sec: 3911.5 +/- 1.8 (jitter = 14.5)      nan
90      images/sec: 3909.8 +/- 1.8 (jitter = 15.9)      nan
100     images/sec: 3907.9 +/- 1.7 (jitter = 15.9)      nan
----------------------------------------------------------------
total images/sec: 3905.13
----------------------------------------------------------------

Inception v3 BS64

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=inception3
Step    Img/sec total_loss
1       images/sec: 200.6 +/- 0.0 (jitter = 0.0)        7.278
10      images/sec: 200.6 +/- 0.1 (jitter = 0.6)        7.298
20      images/sec: 200.5 +/- 0.1 (jitter = 0.4)        7.291
30      images/sec: 200.3 +/- 0.1 (jitter = 0.4)        7.412
40      images/sec: 200.1 +/- 0.1 (jitter = 0.7)        7.306
50      images/sec: 199.9 +/- 0.1 (jitter = 0.8)        7.287
60      images/sec: 199.7 +/- 0.1 (jitter = 1.0)        7.378
70      images/sec: 199.5 +/- 0.1 (jitter = 1.2)        7.351
80      images/sec: 199.3 +/- 0.1 (jitter = 1.3)        7.402
90      images/sec: 199.2 +/- 0.1 (jitter = 1.2)        7.309
100     images/sec: 199.0 +/- 0.1 (jitter = 1.2)        7.354
----------------------------------------------------------------
total images/sec: 198.97
----------------------------------------------------------------

VGG16 BS64

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=vgg16
Step    Img/sec total_loss
1       images/sec: 180.0 +/- 0.0 (jitter = 0.0)        7.346
10      images/sec: 179.5 +/- 0.1 (jitter = 0.2)        7.294
20      images/sec: 179.4 +/- 0.1 (jitter = 0.3)        7.282
30      images/sec: 179.1 +/- 0.1 (jitter = 0.4)        7.278
40      images/sec: 178.9 +/- 0.1 (jitter = 0.8)        7.287
50      images/sec: 178.7 +/- 0.1 (jitter = 0.7)        7.272
60      images/sec: 178.6 +/- 0.1 (jitter = 0.7)        7.261
70      images/sec: 178.4 +/- 0.1 (jitter = 1.0)        7.267
80      images/sec: 178.3 +/- 0.1 (jitter = 1.1)        7.280
90      images/sec: 178.2 +/- 0.1 (jitter = 1.0)        7.270
100     images/sec: 178.1 +/- 0.1 (jitter = 0.9)        7.268
----------------------------------------------------------------
total images/sec: 178.02
----------------------------------------------------------------

GoogLeNet BS128

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=128 --model=googlenet
Step    Img/sec total_loss
1       images/sec: 784.7 +/- 0.0 (jitter = 0.0)        7.104
10      images/sec: 782.9 +/- 0.4 (jitter = 1.4)        7.104
20      images/sec: 782.3 +/- 0.6 (jitter = 2.1)        7.092
30      images/sec: 780.3 +/- 0.7 (jitter = 4.3)        7.087
40      images/sec: 779.2 +/- 0.6 (jitter = 5.5)        7.067
50      images/sec: 778.9 +/- 0.5 (jitter = 5.0)        7.092
60      images/sec: 778.4 +/- 0.5 (jitter = 4.7)        7.050
70      images/sec: 778.3 +/- 0.4 (jitter = 4.2)        7.073
80      images/sec: 778.2 +/- 0.4 (jitter = 3.9)        7.077
90      images/sec: 778.2 +/- 0.4 (jitter = 3.0)        7.079
100     images/sec: 778.1 +/- 0.3 (jitter = 2.7)        7.066
----------------------------------------------------------------
total images/sec: 777.65
----------------------------------------------------------------

ResNet152 BS32

python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=32 --model=resnet152
Step    Img/sec total_loss
1       images/sec: 116.5 +/- 0.0 (jitter = 0.0)        9.028
10      images/sec: 116.3 +/- 0.1 (jitter = 0.2)        8.593
20      images/sec: 116.2 +/- 0.1 (jitter = 0.3)        8.603
30      images/sec: 116.0 +/- 0.1 (jitter = 0.4)        8.712
40      images/sec: 115.8 +/- 0.1 (jitter = 0.5)        8.655
50      images/sec: 115.7 +/- 0.1 (jitter = 0.6)        8.800
60      images/sec: 115.7 +/- 0.1 (jitter = 0.6)        8.625
70      images/sec: 115.5 +/- 0.1 (jitter = 0.6)        9.093
80      images/sec: 115.5 +/- 0.1 (jitter = 0.6)        8.856
90      images/sec: 115.4 +/- 0.1 (jitter = 0.6)        8.996
100     images/sec: 115.3 +/- 0.1 (jitter = 0.6)        8.842
----------------------------------------------------------------
total images/sec: 115.28
----------------------------------------------------------------

 

性能对比

A100 和V100 和 2080ti 性能对比:

https://www.tonyisstark.com/383.html

 

 

 

 

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

### 关于矩池云的服务介绍和技术文档 #### 服务概述 矩池云是一种面向开发者和研究人员的云计算服务平台,提供多种资源和服务支持。它不仅为用户提供计算能力,还提供了存储功能以及针对特定场景优化的工作流工具。例如,每位用户都可以获得 **5GB 的免费存储空间**,这些存储空间位于用户的个人网盘中[^1]。 #### 数据管理与隐私保护 在数据管理方面,矩池云允许用户将文件上传至个人中心下的“我的网盘”,从而方便地在所租用的虚拟机中调用所需的数据。值得注意的是,即使用户释放了当前使用的主机实例,存放在网盘中的数据也不会丢失,并且平台承诺保障用户数据的安全性和私密性[^1]。 #### 资源租赁与环境保存 对于需要长期运行的任务或者频繁切换工作状态的情况,矩池云建议用户完成任务后及时关闭服务器以节省成本。具体操作是在控制面板中找到对应实例并点击“停止并释放”。另外,为了减少重复劳动,比如重新安装依赖库等问题,系统支持保存已配置好的运行环境,这样后续可以直接加载先前的状态继续作业而无需再次准备软件包等资源[^2]。 #### 高级特性——自动化教学辅助 除了常规的企业和个人用途外,矩池云也特别设计了一些适合教育领域的解决方案。其中一项重要功能便是能够设置是否启用自动分配课时时长给学员的功能。一旦激活此选项,在审核通过某个学生的加入请求之后便会自动生成一张有效期内可用的时间券发放给他;不过前提是授课老师的账户余额充足才能顺利完成整个流程,否则可能需要管理员介入处理异常情况[^3]。 #### 文件传输最佳实践案例分析 (CIFAR-10 数据集为例) 当涉及到大型数据集的操作时,直接在线获取可能会消耗大量时间和带宽资源。因此推荐预先在外围准备好目标素材后再上传到云端指定位置。以 TensorFlow CIFAR-10 数据集为例,以下是具体的实施步骤: 1. 使用 Jupyter Notebook 提供的图形化界面轻松实现本地计算机与远程服务器之间的拖放式上传; 2. 将原始压缩包改名为 `cifar-10-batches-py.tar.gz` ,因为这是框架内部识别的标准名称; 3. 启动一个新的终端窗口并通过一系列 Linux 命令行指令移动该档案至正确的路径下 (`~/.keras/datasets/`) ; 4. 完成上述准备工作后即可无缝衔接原有程序逻辑而不必担心网络延迟带来的影响[^4]. ```bash cd ~/ cp /mnt/cifar-10-batches-py.tar.gz ~/.keras/datasets/ ``` #### 总结 综上所述,矩池云作为一个综合性的公共基础设施提供商,涵盖了从小规模实验探索到大规模生产部署全生命周期内的各类需求点。无论是初学者还是资深工程师都能从中受益匪浅。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值