
cuda
文章平均质量分 89
NewCoder_BL
new coder, keep moving
展开
-
Bank conflict for shared memory
reference: http://cuda-programming.blogspot.ca/2013/02/bank-conflicts-in-shared-memory-in-cuda.htmlhttp://www.cnblogs.com/1024incn/p/4605502.htmlBank conflicts in GPUs are specific to shared memory an原创 2017-01-24 12:09:55 · 613 阅读 · 0 评论 -
CUDA-GPU programming Introduction (3)
关于提高performance的一些建议: 内存的读写方式,shared memory的调用,bank confict的解决原创 2017-05-14 11:49:18 · 401 阅读 · 0 评论 -
CUDA-GPU programming Introduction (4)
Concurrent execution and streams如果使用GPU的stream设置增加device操作的并行性原创 2017-05-15 13:08:46 · 280 阅读 · 0 评论 -
CUDA-GPU programming Introduction (5)
Reduction with CUDAreduciton指的是min/max,sum, average等操作,不难发现这些操作都很难做到高度并行。一直也是并行计算里的典型瓶颈。没什么好的处理方法,基本处理就是两种: binary reduction atomic reduction前者就是二分法处理,两两相加,逐步reduction,后者具体参见cuda的官方文档原创 2017-05-15 14:54:28 · 462 阅读 · 0 评论 -
CUDA-GPU programming Introduction (1)
GPU和cuda编程的基本介绍原创 2017-04-25 11:39:42 · 675 阅读 · 0 评论 -
CUDA-GPU programming introduction (2)
CUDA的语言设置和寻址示例原创 2017-04-27 02:55:29 · 463 阅读 · 0 评论 -
CUDA以及NVCC编译流程
NVCC编译流程原创 2017-05-18 12:50:20 · 34530 阅读 · 0 评论