引子
市场上用于深度学习训练计算机大致情况如下:
(1)服务器/工作站(支持2、4、8块GPU架构):普遍存在噪音大,无法放置于办公环境,必须放到专门的机房,维护成本高,另外数据存储带宽、延迟、容量也不尽如意。
(2)分布式集群架构:性能强大,但是开发成本太高(太贵),是大多数科研单位及个人无法承受。
(3)组装电脑:这类特点是价格便宜,但是在散热和功率方面依然是普通家用/游戏电脑标准,稳定性巨差。
(4)大部分GPU计算机(服务器/工作站):重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了。
然而,机器硬件配置还需要整体均衡,不同的学习框架更需要不同GPU卡去适配。

主流学习框架

主流框架加速效能
上图是不同的DL框架加速效能(NVIDIA GP100为例),不同的框架并不是GPU越多效能就越高。
深度学习计算密集,所以需要一个快速多核CPU,对吧?!
听说深度学习有很多显卡就可以了,一个高速CPU可能是种浪费?!
搭建一个深度学习系统时,最糟糕的事情之一就是把钱浪费在并非必需的硬件上。
一个高性能且经济的深度学习系统所需的硬件到底要如何配置?!
一. 深度学习计算特点与硬件配置分析: