GPU杂记

为了提升效率,GPU一般会将若干个线程(thread)组织起来。NVIDIA将这些线程的组织成为wrap,AMD将其成为wavefronts。调度是以wrap为单位进行的。
什么叫GPU里的lane,
体系结构量化分析方法中的描述如下:
All modern vector computers have vector functional units with multiple parallel pipelines (or lanes) that can produce two or more results per clock cycle, but they may also have some functional units that are not fully pipelined.
也就是说lane是一种pipeline,这种pipeline可以在一个周期内产生多个结果。
GPGPU 处理器架构中的描述如下:
Each thread executes on the function unit associated with a lane ……
这里说了一个lane有多个function unit和其相关联。有哪些function unit呢,举了个例子,NVIDIA GPU的function unit有special function unit(SFU),load/store unit, floating -point function unit, integer funtcion unit……
通过SIMT Stack和predication可以让GPU的各个线程在程序员的角度看起来是互相独立的。
什么是STIMT Stack: stack of predicate masks that we shall refer to as the SIMT stack。SIMT为thread相互独立的运行解决了两个关键问题,嵌套控制流和skipping computation。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值