
CUDA 编程
文章平均质量分 91
CUDA 编程语法与例子
qq_26697045
这个作者很懒,什么都没留下…
展开
-
CUDA 编程入门
CUDA 线程与核函数1. 立方和1. 立方和 第一个 CUDA 程序用于计算若干个数的立方和。1. 核函数__global__ static void sumOfSquares(int* num, int* result, int size) { int sum = 0; for (int i = 0; i < size; i++) sum += num[i] * num[i] * num[i]; *result = sum;} 核函数需要 global 修饰且不能有返原创 2021-07-27 20:46:42 · 1009 阅读 · 0 评论 -
环境搭建与 CUDA 介绍
环境搭建与 CUDA 介绍1. 环境搭建2. 读取设备信息3. 参考1. 环境搭建1. C++ 环境搭建 GPU 需要对应版本的驱动,驱动需要对应版本的 CUDA Toolkit,CUDA Toolkit 需要对应版本的 visual studio。此外,CUDA Toolkit 对 GPU 的算力也有要求,比如 CUDA Toolkit 9 不支持 3.0 以下算力的 GPU。安装前要弄清楚硬件和软件版本。 CUDA Toolkit 安装包中包含显卡驱动。应该先确定自己的显卡支持什么版本的原创 2021-07-27 20:30:03 · 867 阅读 · 0 评论 -
卷积
平面一步长卷积1. 平面一步长卷积2. 参考1. 平面一步长卷积 把卷积步长设置为 1 的目的是保持特征宽高不变,假设卷积核尺寸为 (2m+1, 2n+1),则还需要在左右各填充 m 行,上下各填充 n 行,这样卷积前后特征的宽高尺寸就相等了。 下面使用 CUDA 实现的卷积:步长只能为 1,输入、输出的通道也都只能为 1;特征尺寸和卷积核尺寸可以任意指定。1. 工具函数void generate_mat(float* mat, size_t h, size_t w) { for (siz原创 2021-07-24 21:55:24 · 531 阅读 · 0 评论 -
矩阵乘法
CUDA 编程环境配置参考参考CUDA Toolkit 下载原创 2021-07-08 23:57:10 · 696 阅读 · 0 评论