
GPU
文章平均质量分 53
HeMiJack
这个作者很懒,什么都没留下…
展开
-
Warp内循环展开 & Warp内部的硬件调度特性
// unrolling warp if (tid < 32) { volatile int *vmem = idata; vmem[tid] += vmem[tid + 32]; vmem[tid] += vmem[tid + 16]; vmem[tid] += vmem[tid + 8]; vmem[tid] += vmem[tid + 4]; vmem[tid] += vmem[t原创 2021-07-01 16:12:30 · 382 阅读 · 1 评论 -
Warp内部的硬件调度特性
// unrolling warpif (tid < 32){ volatile int *vmem = idata; vmem[tid] += vmem[tid + 32]; vmem[tid] += vmem[tid + 16]; vmem[tid] += vmem[tid + 8]; vmem[tid] += vmem[tid + 4]; vmem[tid] += vmem[tid + 2]; vmem[tid] += vmem[原创 2021-03-06 18:51:34 · 359 阅读 · 0 评论