
CUDA
ForeverYang2015
IT搬砖工!
展开
-
使用cuda加速图像缩放的例子
一、前言本文主要讲解了cuda并行加速的一个小例子,对图像缩放的最近邻插值算法做加速。二、代码实现由于进行缩放时,每个新像素点的计算方法均一致,故可使用并行计算,opencv中的resize也是这么做的。//main.cu////#include "cuda_runtime.h"#include #include #include #include #incl原创 2016-09-15 15:20:25 · 12310 阅读 · 5 评论 -
vs2013和cuda7.5配置使用
一、前言由于想学习gpu并行运算提高计算效率,并且经过数次配置失败,最后终于成功了,于是决定把配置过程写下来,希望别人少走个坑,vs2013和cuda7.5配置主要参考了http://blog.youkuaiyun.com/u013422712/article/details/49498055二、电脑配置电脑配置为Windows7 + VS2013+ NVIDIA GeForce GT 550原创 2016-08-07 00:31:13 · 4704 阅读 · 3 评论 -
cuda《学习笔记三》——共享内存和同步
一、前言 本文介绍CUDA编程的共享内存和同步。共享内存中的变量(核函数中用__shared__声明),在GPU上启动的每个线程块,编译器都创建该变量的副本,若启动N个线程块,则有N个该变量副本,为每个线程块私有;同步则是使线程块中所有的线程能够在执行完某些语句后,才执行后续语句。二、线程块、线程索引以下为线程块与线程的层次结构图原创 2017-02-06 00:08:46 · 3389 阅读 · 1 评论 -
modprobe: FATAL: Module nvidia-uvm not found 解决方法
一、前言 在linux系统上使用cuda时遇到个狗血问题,出现modprobe: FATAL: Module nvidia-uvm not found 错误,查找资料发现是modprobe无法加载nvidia-uvm模块二、解决方法 终端输入: sudo updatedb locate --regex nvidia.*uvm.ko原创 2017-02-07 11:58:56 · 16643 阅读 · 3 评论 -
cuda《学习笔记一》——查询属性
一、前言 本文是对学习cuda编程过程的一些基本知识进行总结,参考自《GPU高性能编程实战》二、查询显卡支持的属性属性查询中,需要重点知道的是显卡所支持的CUDA处理器数量、计算能力、一个线程格中每一维可包含的最大线程块数量、多维线程块数组中每一维可包含的最大线程数量、一个线程块中可包含的最大线程数量等三、查询属性代码//main.cu#include #inc原创 2016-10-22 17:57:39 · 1983 阅读 · 0 评论 -
cuda《学习笔记二》——基本用法
一、前言 本文对使用cuda加速一维数组运算、二维图像处理运算的方法作总结,参考自《CUDA By Example》二、一维数组并行运算 经过查询,本人的老显卡GT550M,可得其3维线程格,每维包含线程块数量为(65536,65536,65536),相应的每维包含线程数为(1024,1024,64),故可得知线程格的每一维可开启的线程块最大数均为655原创 2017-02-04 11:26:07 · 3241 阅读 · 1 评论