测评 数据
FeaturesTesla K10Tesla M2090Tesla M2075Tesla M2070-Q
Number and Type of GPU2 Kepler GK104s1 Fermi GPU1 Fermi GPU1 Fermi GPU
GPU Computing ApplicationsSeismic processing, signal and image processing, video analyticsSeismic processing, CFD, CAE, Financial computing, Computational chemistry and Physics, Data analytics, Satellite imaging, Weather modeling
Visualization ApplicationsN/AN/AN/ACAD, CAM, CAE pre/post processing Remote desktop
Peak double precision floating point performance190 Gigaflops
(95 Gflops per GPU)665 Gigaflops515 Gigaflops515 Gigaflops
Peak single precision floating point performance4577 Gigaflops
(2288 Gflops per GPU)1331 Gigaflops1030 Gigaflops1030 Gigaflops
Memory bandwidth (ECC off)320 GB/sec
(160 GB/sec per GPU177 GBytes/sec150 GBytes/sec150 GBytes/sec
Memory size (GDDR5)8GB
(4 GB per GPU)6 GigaBytes6 GigaBytes6 GigaBytes
CUDA cores3072
(1536 per GPU)512448448
英伟达官网:http://www.nvidia.com/object/tesla-servers.html
参考资料:
NV正式发布Tesla K10和K20 GK104
作者:D.ufo(王晓创)
在今天早些时候举行的GTC 2012大会上,NVIDIA正式发布了新一代Tesla加速卡,出乎所有人意料的是,NVIDIA此次发布的Tesla计算卡有两款,其中一款是基于双核GK104也就是GTX 690演变而来,另外一款则是真正的GK110架构,预计今年第四季度推出。
Tesla K10
Tesla K10基于两颗GK104核心设计,可以看作GTX 690显卡的变种,拥有3072个CUDA核心,2*256bit位宽,单精度浮点运算能力为4.58TFLOPS,带宽320GB/s。得益于GK104架构良好的效能比,Tesla家族首次出现了双芯卡型号。
Tesla K20
GK110架构示意图
K20是真正的新架构产品,基于GK110核心,专为高性能HPC环境设计,双精度浮点能力可达Fermi核心的三倍,橡树岭国家实验室已经选定K20作为超级计算机“Titan”的核心,伊利诺伊大学的国家超级计算机应用中心的“Blue Water”超级计算机也选择了K20加速卡。
Tesla K20将在今年第四季度正式推出。
有关Tesla K10和K20的详细介绍正在准备中,敬请关注。
NVIDIA巨兽GK110正式现身:第四季度上市
NVIDIA创始人兼CEO黄仁勋于北京时间今日凌晨在GTC 2012大会上发表主题演讲,光重大宣布就有三四项,但其中最受关注GPU发展动态的用户关注的还是Tesla K20的现身——Kepler架构的真正旗舰GK110终于来了。
此次黄仁勋通过讲解Kepler架构新特性的方式引出了两款产品——Tesla K10与Tesla K20,实际上三种特性中除SMX外均为GK110所独有,包括加强GPU利用率减少轻载使用情况的Hyper-Q以及加强任务并行度的Dynamic Parallelism。
Hyper-Q
由于Kepler架构的改进,GK110可以让最多32个CPU核心为单个GPU提供硬件工作队列,相比之下上代Fermi旗舰GF110只有1个。多条硬件工作队列可显著提升小负载的执行效率。
Dynamic Parallelism
此前的GPU如GF110在执行Kernel(程序内核)时,每执行一个或者一组Kernel都需要与CPU互动一次,Kernel需要由CPU创建。而在GK110中Dynamic Parallelism使得GPU能自己在执行完Kernel后自行判定并创建下面的Kernel,减少了与CPU互动的频率可节省时间,并提升GPU的计算效率。
GK110规格
NVIDIA Tesla K10(双GK104)
实际上宣布的两款产品中,Tesla K10正是此前BSN爆料声称的GeForce GTX 690的Tesla版,并且目前已经上市。NVIDIA宣称其具有3倍于上代Tesla旗舰M2090的单精度浮点计算能力——4.577T FLOPS,内存带宽为320GB/s,单个GPU 160GB/s略小于GTX 690,内存为8GB GDDR5。
GK110核心照片
新产品基于GK110核心的Tesla K20目前NVIDIA官方只宣称双精度浮点约3倍于Tesla M2090,晶体管数量为71亿个,将于2012年第四季度进入市场。从核心图上来看,GK110拥有15个SMX,也就是CUDA Core数量为192*15=2880个。但根据PCinlife管理员cho爆料,其中一组被屏蔽作为冗余之用,上市产品CUDA Core数量为2688个,双精度浮点计算能力为1.4-1.5T FLOPS左右。
NVIDIA Tesla K20(GK110)
而BSN在现场带来的信息是GK110核心集成384bit显存控制器,支持6GB、12GB和24GB显存,黄仁勋称最终产品显存容量要取决于DRAM业界的进展,预计届时Tesla K20的显存数量为12GB。功耗部分,据称Tesla K20的辅助供电接口设计为6pin+8pin,TDP不超300W。至于GK110核心何时进入Quadro或者GeForce产品尚无相关消息。