特斯拉 DOJO超级计算系统究竟是个啥?(2)

本文详细介绍了特斯拉DOJO超级计算系统的非分离架构,强调其存算一体设计,减少布线,并与A100进行对比。重点讲解了Dojo Core的组成,包括前端、执行引擎、SRAM和Noc路由,特别是矩阵计算单元,展现其高效率和低延迟特性。

最近把欠读者的连载的坑先填完,再开新坑,除非有特别的事件驱动临时更新新内容以外

      书接前文:特斯拉 DOJO超级计算系统究竟是个啥?(1) (qq.com)

      复习一下上节课的内容

图片

      总结一下Dojo的几个特点:

  • 非分离架构,存算一体:这其实也会是今后的方向,因为你存CKPT越快,你训练速度越快,以后的所有训练架构肯定都不会做存算分离,这是趋势,片内片外都是

  • 每个core都可以扩展到D1或者D2,每个D1或者D2都能扩展到Tile,积木式玩法,大概率是今后自产芯片的趋势,(我司的Maia也是,但是没细粒度到Core级别,后面我会讲)

  • 减少布线:core--->D1--->Tile几乎都是尽可能片内,减少布线,算力堆叠降低延迟

  • 效率最大化,内核就给2Ghz,除了分支预测和小指令的缓存,其他面积全给NPU组件,向量和矩阵计算单元,和Nvidia相比,良心到极致,反正也是自己用

    图片

  • 能省就省:Dojo core没有数据端缓存,没虚拟内存,不支持精确异常处理,说白了Dojo 等于战神GTR,"我不会让你等到弯道,而是在直道就开始加速干翻你!

    图片

    "

      Dojo和比它早出1年的A100做个对比

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值