
CUDA技术专区
文章平均质量分 72
shi06
四川大学计算机学院硕士,研究方向包括数字图像处理、数字信号处理以及高性能并行计算等,目前主攻的一些课题是CUDA技术在医学信息处理中的应用!
展开
-
谈谈显存的使用分析(一)
在基本完成了对nvcc的使用分析解决了实验室的CUDA环境统一问题后,我转向解决存储器传输问题。看起来这个部分没有设计算法那样光纤,但作为实验室GPU组的组长脏活累活得自己干,抱怨一下下!其实也不算是,看起来参考指南上已经说的很清楚了,我主要就是去了解实现细节和测试性能,但是尽信书不如无书,而且没有自己的性能分析数据,就无法确切的知道,这个CUDA程序的“沉没成本”到底有多大!其实了解CU原创 2010-01-28 15:11:00 · 2647 阅读 · 0 评论 -
深入浅出说CUDA程序设计(一)
最近看书做研究,感慨良多,想以一个软件工程师的角度,总结整理这几年关于CUDA的学习和工程应用的过程,我会想到一点写一点,预计是会写6章,本文只是开头的开头吧!原创 2011-05-06 12:43:00 · 5664 阅读 · 3 评论 -
深入浅出说CUDA程序设计(二)
想到什么就写什么!原创 2011-06-01 12:31:00 · 8336 阅读 · 1 评论 -
D3D学习笔记整理(五)
这一节是本系列最后一节,主要是介绍了CUDA如何与D3D实现互操作。到此为止,我个人对D3D的入门学习告一段落了!下一站又有什么等着呢?!原创 2010-08-07 15:01:00 · 2117 阅读 · 0 评论 -
D3D学习笔记整理(三)
本文主要介绍了使用D3D如何完成顶点的坐标转换,光照流水线的坐标转换以及光照处理。原创 2010-07-29 14:07:00 · 5089 阅读 · 0 评论 -
D3D学习笔记整理(二)
本文主要介绍了使用D3D如何完成一个图形的绘制。原创 2010-07-28 12:41:00 · 1747 阅读 · 0 评论 -
谈谈显存的使用分析(三)
本篇文章主要介绍异步数据传输的使用方法,并简单的介绍了下自己的测试分析结果!以此作为《谈谈显存的使用分析》这个系列专题的结束!原创 2010-07-26 16:41:00 · 1644 阅读 · 3 评论 -
D3D学习笔记整理(一)
最近想要把由CUDA计算生成的图像直接做显示,所以开始学一下D3D,把我自己学习记录整理,既可以与同道分享交流,又是对自己的鞭策吧!开篇我还是比较喜欢把要学的东西整理结构理解下,所以从D3D的简述开始写吧!第一篇主要介绍了一个D3D程序的基本框架和环境配置。原创 2010-07-26 15:57:00 · 3527 阅读 · 0 评论 -
浅析CUDA编译流程与配置方法(3)
三、Nvcc的命令选项的分析说明Nvcc的选项命令形式大概有以下3类:boolean (flag-)选项,单值选项和列表(multivalued-)选项。下面是使用规则举例:-o file -o=file -Idir1,dir2 -I=dir3 -I dir4,dir5每一个选项命令都有两个名字,全称和简写,例如–I就是--include-path的简称,注本文后面的选项命原创 2010-01-12 02:50:00 · 4575 阅读 · 2 评论 -
浅析CUDA编译流程与配置方法(2)
二、Nvcc启动与配置说明1、nvcc的启动条件在我们的工程文件编译选项的命令行下加入"C:/CUDA/bin/nvcc.exe",表示启动nvcc,要成功启动nvcc首先必须保证所需绑定的一般的C/C++编译器如VS下的cl,在编译器搜索路径范围内,一般默认目录下,如:"C:/CUDA/bin/nvcc.exe" -ccbin "C:/Program Files/Microsoft原创 2010-01-04 10:57:00 · 6113 阅读 · 0 评论 -
浅析CUDA编译流程与配置方法(1)
不知不觉做CUDA程序已经有大半年的时间了,参加CUDA校园竞赛也得到一个优秀作品奖,也算是对自己的一个肯定,但是从来没有好好整理和记录自己的技术应用心得。由于最近实验室要求统一自己的CUDA软件开发环境,当然一个大问题就是编译选项如何配置。原先一直使用网上勇哥提供的向导自动配置好的环境,以及参照模仿SDK下的一些模板进行配置,这样就做了这么久,但是boss的意思是要我们自己更多的掌握,也就是要知原创 2009-12-31 02:14:00 · 6481 阅读 · 1 评论 -
一个使用share memory进行性能优化的实例
下面是这段代码是我的一个算法中用来求和以及求平方和的kernel函数:__global__ static void CompSumAndSquare(int rate,int I_n,int size,int width,int wsize,int *image,float *sum,float *sumOfSquare){ int x,y,p,i,j,ix,k; co原创 2009-12-31 15:27:00 · 2421 阅读 · 3 评论 -
谈谈显存的使用分析(二)
二、内存与显存的数据传输类型与使用说明(1)主机端分页内存的使用方式对于C语言,主机端的分页内存是用calloc或者malloc函数进行一维空间的分配。而对于二维空间的分配则可以使用下面的函数进行分配:float **get_matrix_float(int m,int n){ int i; float **a; a=(float **)calloc(m,sizeo原创 2010-01-28 15:30:00 · 5468 阅读 · 1 评论 -
深入浅出说CUDA程序设计(三)
CUDA: You can do it!原创 2011-07-22 13:14:54 · 7833 阅读 · 3 评论