
CUDA
文章平均质量分 90
小落叶不憨
又可以发一篇博客了!
展开
-
那些年CUDA编程那些事(三)
使用CUDA和OpenCV将图像进行分块处理1、概述2、实现步骤2.1 使用OpenCV输入一张8000*1000的单通道图像2.2 为CUDA数组分配内存2.3 分配线程和线程,执行核函数2.4 结果输出与程序结束3、核函数的具体实现过程3.1 定义共享内存3.2 计算每个线程对应在图像中的索引3.3 保存图像块的每个像素值3.4 使用归约算法计算最终结果3.5 另一种线程模式4、完整工程代码5、实验结果6、其他1、概述前面两篇文章介绍了CUDA的基本概念,以及对数组、矩阵的简单求和操作:那些年C原创 2021-09-15 22:40:29 · 693 阅读 · 2 评论 -
那些年CUDA编程那些事(二)
使用CUDA实现简单的矩阵运算一、概述二、一维矩阵的运算一、概述上一篇大致介绍了CUDA的安装和结构,同时以一个基本的例程实现了CUDA的简单使用。这一篇具体介绍一下CUDA关于矩阵的实现步骤。二、一维矩阵的运算初始化CUDA以及其ID,这里表示使用ID为0的GPU执行算法。 cudaSetDevice(0);为CUDA内部变量分配内存,主要包括输入和输出的变量内存预分配。 //需要计算的向量的大小:2^14 int nElem = 1 << 14; printf("原创 2021-09-11 14:19:22 · 567 阅读 · 0 评论 -
那些年CUDA编程那些事(一)
详解CUDA的第一个例程一、概述二、简单结构描述三、标准例子四、参考一、概述使用CUDA编程的目的:在普通的加速手段(SIMD指令、C++多线程、OpenMP等)无法满足实际需求时,使用CUDA对算法运行的进行加速,以满足系统的实时性要求。举个例子:立体匹配算法、深度学习训练与测试、三维重建等。硬件需求:可以在官网上查到支持CUDA的显卡,以及显卡的运算能力。二、简单结构描述以下是Host(CPU)和Device(可以称为CUDA或GPU)的简单数据流过程。Grid是最外面的一层,称为原创 2021-09-09 21:43:32 · 1374 阅读 · 0 评论