CUDA
文章平均质量分 66
滑了丝的螺丝钉
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA学习笔记(大白话入门课程)
CUDA的基本概念:CUDA是NVIDIA公司推出的并行计算框架,只能基于自家GPU的硬件平台进行性能加速运算,所以使用CUDA编程的前提是必须要有NVIDIA的显卡。主流的深度学习框架也都是基于CUDA进行GPU并行加速的,几乎无一例外。还有一个叫做cudnn,是针对深度卷积神经网络的加速库。与之相类似的并行计算框架还有苹果公司推出的OpenCL,OpenCL其优势在于跨平台性和通用性,更像是一个开放标准,按理说OpenCL会更加受欢迎,但是由于NVIDIA公司在GPU显卡领域一家独大,市场份额独原创 2022-01-05 14:23:29 · 1538 阅读 · 0 评论 -
CUDA学习笔记(使用 CPU和GPU 计时器)
在使用CUDA 提升加速计算时,有时会需要和CPU运算的时间做一个对比,以此计算性能提升指标。在CUDA中,event (事件) API 提供创建和销毁事件、记录事件(包括时间戳)以及将时间戳差异转换为以毫秒为单位的浮点值的调用。CPU计时器当计算程序在CPU中执行的时间,可以用#include “time.h”头文件。C/C++中的计时函数是clock(),而与其相关的数据类型是clock_t,其中clock_t用来保存时间的数据类型。clock_t start, finish; //定义计原创 2022-01-07 20:46:29 · 1869 阅读 · 0 评论 -
CUDA学习笔记(对图像进行并行加速运算)
在对CUDA的kernel函数有了一定了解之后,就可以对图像进行多线程加速计算,下面是我在CPU和GPU上各自遍历一张图像,对比两者的性能差异。这里需要用到opencv的函数读取图像以及显示图像,因此opencv的头文件需要包含进去。其他的注意事项主要是图像的内存分配和存储类型问题,比如彩色图像是三通道的,申请的内存为row * col * sizeof(uchar3)。首先在CPU上遍历一张彩色图像的所有像素: for (int i = 0; i < row; i++) { for (i原创 2022-01-10 17:57:03 · 7973 阅读 · 2 评论
分享