- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 CUDA Toolkit Documentation 1
Hardware Implementation NVIDIA GPU体系结构由一组可扩展的多线程流式多处理器(Streaming Multiprocessors)组成SM包括 用于线程执行的数以千计的寄存器 多级缓存 - 用于线程间数据交换的shared memory - 用于从constant memory快速读取的constant cache - 用于提升texture ...
2018-10-06 23:58:48
738
转载 分支分歧(branch divergence)造成SIMT性能降低的原因
分支分歧(branch divergence)造成SIMT性能降低的原因warp中的线程按照SIMD(Single Instruction Multiple Data)模式执行——它们执行相同的代码,但处理不同的数据。当遇到分支指令时,执行不同分支路径的线程只能串行执行。这种因不一致分支行为引起的串行执行现象被称作Branch Divergence,它的出现严重影响了GPU的执行效率,降低了程...
2018-08-30 11:40:39
2701
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人