
CUDA
Lion.Kuo
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA学习笔记之 CUDA存储器模型
CUDA存储器模型:GPU片内:register,shared memory;板载显存:local memory,constant memory, texture memory, texture memory,global memory;host 内存: host memory, pinned memory. register: 访问延迟极低; 基转载 2016-09-26 13:57:27 · 403 阅读 · 0 评论 -
CUDA学习笔记
GPU开发简史GPU是现代PC机中的常见设备,采用了最先进的半导体制造工艺,能够实时生成逼真的3D图形。传统上,GPU的强大处理能力只被用于3D图像渲染,应用领域受到了限制,这无疑是对计算资源的极大浪费。随着GPU的可编程性的不断提高,利用GPU完成通用计算的研究渐渐活跃起来。将GPU用于图形渲染以外领域的计算称为GPGPU。GPGPU计算通常采用CPU+GPU异构模式,由CPU负责执行复杂逻原创 2016-11-14 17:38:26 · 1737 阅读 · 0 评论 -
cuda线程配置
1 每个SM上面失少要有192个激活线程,寄存器写后读的数据依赖才能被掩盖 2 将 寄存器 的bank冲突降到最低,应尽量使每个block含有的线程数是64的倍数 3 block的数量应设置得令可用的计算资源被充分的利用。由于每个block映射到一个sm上面,所以至少应该让block的数目跟sm的数目一样多。 4 当Block中的线程被同步时或者等待转载 2017-01-19 16:08:54 · 826 阅读 · 0 评论