
CUDA
沙雅云
这个作者很懒,什么都没留下…
展开
-
cuda编程实现计算两个向量之间的距离
代码解释:实现的多个向量和一个向量之间的距离的计算。让kernal函数去执行开设一定的线程去做。代码详细解释如下:#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <iostream>#include <fstream>#include <iomanip>#...原创 2019-05-05 17:42:35 · 896 阅读 · 0 评论 -
重新理顺CUDA编程的软硬件关系
软硬件的对应关系1. sp是GPU的最小的硬件单元,对应的是CUDA core,软件上对应的是一个thread。2. sm是一个独立的CPU core,GPU的并行性由sm决定,一个sm包含的是:CUDA coresShared Memory/L1CacheRegister FileLoad/Store UnitsSpecial Function UnitsWarp Sched...原创 2019-05-14 10:44:48 · 552 阅读 · 0 评论 -
cuda trust 库的使用
1 研究cuda编程一个月了,对于cuda的运行机制也基本上是了解了,有时候加速是必须的,但是有时候程序设计的不好,加速就起不到作用,特备是共享内存设计的时候,如果没有让数据一直处于重复利用的状态,那么加速是没有效果的, 所以我觉得就是只有数据需要连续重复使用的时候放在共享内存里面才是真正的加快速度,之前的关于cuda的一些基本的机制也都有介绍过,软件硬件都有设及,现在发现了cuda有一个比较好用...原创 2019-06-01 15:34:55 · 2480 阅读 · 0 评论