
CUDA
文章平均质量分 93
NineDays66
email:547691062@qq.com
展开
-
Nsight visual studio 断点调试
记Nsight Debug时总是跳过断点的解决方案1. 在对工程做了任何修改后,特别是对代码的修改,都应该重新生成解决方案:生成->重新生成解决方案(Build->Rebuild Solution)。2. 路径中一定一定不能有中文GPU调试一直是一个很头疼的问题,在kernel比较简单的时候可以选择把一些计算结果打印出来进行查看,但当kernel很复杂的时候就没法这样进...原创 2018-08-14 18:50:40 · 7231 阅读 · 1 评论 -
CUDA 矩阵相乘
优化点:1.block分成多个,可以不受图片大小的限制 (一个block内的线程数量有限)2.每个block内使用shared momery 可以优化数据访问速度const int TILE_WIDTH = 32;__global__ void mulKernel(int *c, uchar *a, uchar *b, int Width){ __shared__ ucha...原创 2018-08-12 16:43:17 · 2518 阅读 · 0 评论 -
CUDA 半浮点数运算
cudaSamples里面0_Simple里面有个关于fp16的例子,做fp16矢量的点积的。自己简单实现一个,做个对自己的测试。1、关于fp16定义CUDA 7.5 新特性介绍 -- FP16(即fp16是cuda7.5引入的,需要计算能力达到5.3或以上)16-bit Floating Point (半精度浮点)从 Tegra X1 开始,NVIDIA 的 GPU 将支持原生的...转载 2018-08-08 15:07:57 · 8374 阅读 · 2 评论 -
使用 CUBLAS 库给矩阵运算提速
前言 编写 CUDA 程序真心不是个简单的事儿,调试也不方便,很费时。那么有没有一些现成的 CUDA 库来调用呢? 答案是有的,如 CUBLAS 就是 CUDA 专门用来解决线性代数运算的库。 本文将大致介绍如何使用 CUBLAS 库,同时演示一个使用 CUBLAS 库进行矩阵乘法的例子。CUBLAS 内容 CUBLAS 是 CUDA 专门用来解决线性代数运算的库,它分...原创 2018-08-13 09:27:59 · 1845 阅读 · 0 评论 -
CUDFF 图像傅里叶变换
cudff 快速傅里叶变换利用cuda进行fft变换时,会有一些参数设置的规则,一下举例进行说明:float *h_Data; //"h_": host,表示CPU内存float *d_Data; //"d_":device,表示GPU内存fComplex *d_DataSpectrum, //fComplex:为float复数形式,x为实数,y为复数cufftHandle ff...原创 2018-08-17 15:23:49 · 2246 阅读 · 1 评论