CUDA编程
linusyue
在运动中,失真往往是世界真实性的一部分
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
计算机视觉大型攻略 —— CUDA(3)内存模型(二)Aligned and Coalesced内存访问
上一篇介绍了CUDA内存空间。GPU对片外DRAM的访问往往是访存性能的瓶颈。[1]第四章的后半部分,通过Global内存为例,说明了GPU访问DRAM的工作模式以及在该模式下,如何高效的使用DRAM内存。同样的内容也可以参考[2]的5.3.2一节。原创 2020-02-21 18:17:21 · 1523 阅读 · 1 评论 -
计算机视觉大型攻略 —— CUDA(3)内存模型(一)CUDA内存
上篇写了执行模型,这篇继续总结[1]的第四章: 内存模型。首先介绍CUDA内存空间以及物理内存与逻辑内存的对应关系,后续文章写如何通过改善访存策略来提升CUDA Kernel函数的性能。原创 2020-02-21 15:39:39 · 2601 阅读 · 0 评论 -
计算机视觉大型攻略 —— CUDA(2)执行模型
Professional CUDA C Programming[1]是一本不错的入门书籍,虽说命名为"Professional",但实际上确实很适合入门阅读。他几乎涵盖了所有理论部分和编程技巧,更重要的是每一章都有完整的实例程序。不过对于入门来讲,这本书有点太厚了,行文有些啰嗦,粗读容易错过很多关键部分。准备写几篇文章提取一下关键章节的关键部分。原创 2020-02-18 18:16:01 · 977 阅读 · 1 评论 -
计算机视觉大型攻略 —— CUDA(1)编程基础
基于CUDA的并行编程在计算机视觉和机器学习邻域得到了广泛的应用。[1]Professional Cuda C Programming一书系统的介绍了CUDA的编程模型和各种优化的奇技淫巧,虽说文中GPU的系统架构有些过时,但是基础理论和架构仍然适合当前的主流GPU。准备写几篇blog总(fan)结(yi)一下书中第二章到第六章的部分,最后再举一个例子将这几章的内容贯穿起来。原创 2020-02-13 15:18:12 · 1084 阅读 · 0 评论
分享