
cuda
IT沐沐
必须好好努力,才能看起来毫不费力。
展开
-
对CUDA内核函数运行时间测量的方法
方法一:[cpp] view plain copycudaEvent_t start1; cudaEventCreate(&start1); cudaEvent_t stop1; cudaEventCreate(&stop1); cudaEventRecord(start1, NULL); // 需要测时间的内核原创 2016-04-05 15:47:10 · 4635 阅读 · 0 评论 -
NVCC CUDA编译流程
一、CUDA编译流程简介Nvcc是一种编译器驱动,通过命令行选项可以在不同阶段启动不同的工具完成编译工作,其目的在于隐藏了复杂的CUDA编译细节,并且它不是一个特殊的CUDA编译驱动而是在模仿一般的通用编译驱动如gcc,它接受一定的传统编译选项如宏定义,库函数路径以及编译过程控制等。所有非CUDA编译步骤扔给通用的C编译器,在Windows下是MS的“cl”编译器,而在Linux下是gcc转载 2016-03-24 10:10:17 · 5410 阅读 · 2 评论 -
CUDA内存类型
前两天楼主面试时被问到CUDA内存类型的问题,关于各种缓存的问题没怎么弄清楚,乱答了一通。。。CUDA存储器类型:每个线程拥有自己的register and loacal memory;每个线程块拥有一块shared memory;所有线程都可以访问global memory;还有,可以被所有线程访问的只读存储器:constant memory and text原创 2016-03-01 09:45:58 · 616 阅读 · 0 评论 -
cuda优化
面试时如果有CUDA方面的问题,那么经常被问到的一个就是“请你列举出一些常用的优化方法”。下面这篇文章总结了15条,大家可以参考以下。不过值得注意的是,文章的时间较早,而随着计算能力版本的提高,有些优化方法可能不太一样了,大家还是以手册为准。http://tech.it168.com/a2011/0706/1213/000001213855.shtml1. memory coale转载 2016-03-01 09:50:57 · 583 阅读 · 0 评论