CUDA
文章平均质量分 89
moyakxhh
通感一体
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDAC知识回顾1-3章课后题
1.1是一个单纯的块在图像上的划分,划分结果如下图1.2hello.cu#include<stdio.h>__global__ void hellofromGPU(void){printf("hello world from CPU\n");}int main(){printf("hello world from gpu\n");hellofromGPU<<<1,10>>>();cudaDeviceReset();return 0原创 2021-01-04 21:53:58 · 652 阅读 · 0 评论 -
cublas矩阵乘法(SGEMM)
//cublas计算矩阵乘法(sgemm)#include<cuda_runtime.h>#include<device_launch_parameters.h>#include<cublas_v2.h>#include<curand.h>#include<stdlib.h>#include<stdio.h>#include<assert.h>#include<time.h>#include.原创 2020-10-29 16:00:14 · 1153 阅读 · 0 评论 -
cublas 简单示例
//一些基本的cublas示例#include<cuda_runtime.h>#include<device_launch_parameters.h>#include<cublas_v2.h>#include<stdlib.h>#include<assert.h>#include<math.h>//初始化向量void vector_init(float*a, int n) { for (int i = 0; i &.原创 2020-10-29 11:41:33 · 658 阅读 · 0 评论 -
CUDA 矩阵乘法 优化版本
//矩阵乘法的优化版本#include<cuda_runtime.h>#include<device_launch_parameters.h>#include<stdlib.h>#include<stdio.h>#include<assert.h>#include<math.h>#define SHMEM_SIZE 16*16*4 //为方便起见,静态shmem计算 16x16矩阵__global__ void .原创 2020-10-29 10:15:02 · 391 阅读 · 0 评论
分享