关于深度学习的Nvidia的GPU加速网络训练参数性能测试
英伟达RTX 30系列已出,有预算的,建议直接30系列了
深度学习的GPU型号和参数选择
深度学习注重的参数有两个,分别是显存带宽和单精度浮点计算能力(这里不考虑双精度浮点计算能力)
显存带宽计算涉及到的显卡参数:显存位宽(位)、显存频率(Mhz)
单精度浮点据算能力涉及到的显卡参数:显卡主频(Mhz)、cuda核心
下面介绍常见的几种显卡参数:
显卡型号 | 显存 | 单精度计算能力 | 显存带宽 |
---|---|---|---|
主频xCuda核心数x2/1000 (TFlops) | 显存位宽x显存频率/8/1000(Gb/s) | ||
1060 | 6G | 1.582x1280x2=4.05 | 192.2 |
1660ti | 6G | 1.580x1536x2=4.85 | 288 |
1070 |