
CUDA
文章平均质量分 88
黑山老妖的笔记本
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA笔记--2D高斯卷积实现
__global__ void convolution_1D_basic_kernel(float *N, float *P, int Mask_Width, int Width, int Height){ int i = blockIdx.x * blockDim.x + threadIdx.x; int j = blockIdx.y * blockDim.y + threadIdx.y; int n = size_kernel / 2; // 在共享存储器上分配一个TILE_SIZE*T.原创 2023-01-29 10:51:57 · 789 阅读 · 0 评论 -
CUDA笔记-卷积计算
CUDA 3D convolution - ijpq - 博客园overview https://www.cnblogs.com/ijpq/p/15405106.html原创 2022-04-26 18:12:24 · 4925 阅读 · 0 评论 -
CUDA笔记--GPU的存储结构
1.GPU存储结构模型 从上面的存储结构可以看到如下内容: 1.CPU可以读写GPU设备中的Global Memory、Constant Memory以及Texture Memory内存储的内容;主机代码可以把数据传输到设备上,也可以从设备中读取数据; 2.GPU中的线程使用Register、Shared Memory、Local Memory、Global Memory、Constant Memory以及Texture Memory;不同Me...原创 2022-03-25 16:02:59 · 3847 阅读 · 0 评论 -
CUDA笔记--实现一个__global__向量加法
目标:实现两个长向量的加法; 代码规范:在主机代码的每一段中,给那些只由主机处理的变量名字加上前缀h_,给主要设备处理的变量名加上前缀d_;使用CPU代码的版本void vecAdd(float* h_A, float* h_B, float* h_C, int n) { for (int i = 0; i < n; i++) { h_C[i] = h_A[i] + h_B[i]; }}void init(float* ptr, in...原创 2022-03-24 11:32:02 · 1062 阅读 · 0 评论