
cuda
andeyeluguo
这个作者很懒,什么都没留下…
展开
-
转置的好用的cuda程序
通过sample的例子自己改编的一个例子#include #define BLOCK_DIM 5// Transpose kernel (see transpose CUDA Sample for details)__global__ void d_transpose(float *odata, float *idata, int width, int height){ __原创 2017-05-25 17:02:17 · 511 阅读 · 0 评论 -
加法
加法代码参考了别人的博客#include #include //#include "kmeans.h" using namespace std; const int count = 1000; void generate_data(int *arr) { for(int i=0;i<count;i++) {原创 2017-05-10 15:09:34 · 439 阅读 · 0 评论 -
cuda的kernal调用kernal
cuda可以用kernal调用kernal但是必须在计算能力sm35以上#include #include #include #include // 定义一个 4*4 的矩阵来做 加法和减法#define WIDTH 4 // 定义 子内核// 子内核 对 矩阵中的数加 1__global__ void Child_Kernel ( int * Matrix ){原创 2018-01-02 19:49:56 · 1023 阅读 · 0 评论 -
cuda使用thrust的api求一个向量的最值
懒得自己写了,就使用了thrust的api算了。还挺不错。cuda程序#include <thrust/extrema.h>#include <thrust/device_ptr.h>#include <iostream>int main(){ float* deviceArray; float max, test; int lengt...原创 2018-04-26 14:52:10 · 1185 阅读 · 0 评论