
CUDA
qulay
博士在读,关注于计算机视觉领域中物体检测与识别,重点关注地面估计与障碍物检测,室外物体识别。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
多人多车求距离_cpu&&gpu_寄存器优化_sharememory优化
#include #include #include #include #include using namespace std;#define M 3200 //num of person#define N 3200 //num of car#define B_S 32#define tile_x 2#define tile_y 2#define SHOW//P[M]*C[N]=D[M][N原创 2016-10-10 20:54:30 · 515 阅读 · 0 评论 -
多人多车求距离_cpu&gpu
#include #include #include #include #include using namespace std;#define M 3200 //num of person#define N 3200 //num of car#define B_S 32//#define SHOW//P[M]*C[N]=D[M][N]__global__ void distance_gpu(fl原创 2016-10-10 20:54:33 · 451 阅读 · 0 评论 -
二维矩阵相乘——cpu&&gpu
#include #include #include #include #include using namespace std;#define M 3200#define N 3200#define P 3200#define B_S 32//#define SHOW//A[M][P]*B[P][N]=C[M][N]__global__void mulMatri_gpu(float* A, fl原创 2016-10-10 20:54:35 · 1355 阅读 · 0 评论 -
多人多车求距离——cpu&gpu
#include #include #include #include #include using namespace std;#define M 3200 //num of person#define N 3200 //num of car#define B_S 32//#define SHOW//P[M]*C[N]=D[M][N]__global__ void distance_gpu(fl原创 2016-10-10 20:54:39 · 342 阅读 · 0 评论 -
二维矩阵实现矩阵相乘
#include #include #include #include using namespace std;#define M 1024#define N 1024#define P 512//void mulMatri(int A[M][P],int B[P][N],int C[M][N],int m,int n,int p);inline void mulMatri(float** A,f原创 2016-10-10 20:54:41 · 1624 阅读 · 0 评论 -
二维矩阵实现的多人多车求距离
#include #include #include #include #include using namespace std;#define M 5000#define N 50000#define P 1struct Point{ int x; int y;};//void mulMatri(int A[M][P],int B[P][N],int C[M][N],int m,i原创 2016-10-10 20:54:44 · 385 阅读 · 0 评论 -
CUDA编程快速入门
1.架构理解1).包括grid,block,(warp),thread这几个层次, 这就是我们所说的SM;即:grid对应整个GPU,block数量代表SM数量,每个block的thread数量对应ALU数量 2.编写规范 1)核函数前缀__global__,而且必须是void类型。 2)>>,N个block,每个block有M个线程。3)GPU的核函数的执行与CP原创 2016-10-10 20:54:47 · 1273 阅读 · 0 评论