前面两天头有点晕晕的,主要是天气变得太快啊,没有及时适应,再加上一些其他原因,没有看书,也没有记笔记。今天总算看了一点,也找到了一些关于学习GPU的比较好的地方,已经一些相对比较专业的人。 今天看这篇文章算是遇到了比较困难了,有些程序实在是想不通啊??也许是缺乏相关的编程经验吧,还是希望大家能够帮点忙,帮我看看啊。。。谢谢了,
这次的问题如下:
1. blockDim.x还是没有完全理解,按照以前的理解是一个block在x方向上的维度,但是这个概念太模糊了,举例如下:(是第二个程序的第一次改良)
extern __shared__ float data[];
const int tid = threadIdx.x;
const int row = blockIdx.x;
int i, j;
for(i = tid; i < n; i += blockDim.x) //这里的blockDim.x多少呢??
{
data[i] = a[row * lda + i];
} //整个这段程序说的是将整个 row 读到 shared memory 中
所以能不能麻烦高手们给解释一下,blockDim.x到底该如何理解,在这段程序里又是多少。
2.文章里面提到利用 Kahan's Summation Formula 来提高精确度,程序代码见下,我没有办法理解为何这样做就可以提高精度啊???
if(row < n && column < n) {
float t = 0;
float y = 0;
for(i = 0; i < n; i++) {
float r;
y -= a[row * lda + i] * b[i * ldb + column];
r = t - y;
y = (r - t) + y;
t = r; } }
3.Kernel程序后面接的变量名称有什么映出啊??是不是作为变量传递的???
4.今天无意中又翻了翻那本编程指南,搜索了一下,发下很多函数,里面还是有比较详细的介绍的,哈哈哈,发现自己有些问题问的太傻了啊??大家莫要见怪啊。原来就是因为是全英文的所以不是很想看,但是现在看来不看不行了啊。其实也不难啊,英语语法很简单,就是有些许单词陌生。好,加油,明天一边看这篇文章,一边看编程手册了。
这次的心得体会以及查到的知识如下:
1.函数cudaMallocPitch((void**)&ac,&pitch,width*sizeof(float),height),以前老是不明白最后一个变量是什么意思,原来是二维向量的高,
2.这里还要介绍一点学习GPU的东东啊。
首先就是官网了,http://www.nvidia.cn/object/cuda_home_cn.html
其次准官网 http://cuda.youkuaiyun.com/
优快云开勇的博客 http://blog.youkuaiyun.com/OpenHero
高性能运算社区 http://bbs.hpctech.com/
一个博客 http://heresy.spaces.live.com/blog/cns!E0070FB8ECF9015F!3114.entry?wa=wsignin1.0&sa=11939525
此外,还有两本关于GPU,CUDA的书(书名,封面,作者等大家百度就知道了,我就不在这里宣传了,呵呵),我都定了,但是还没有到货,目前也就这两本书,都是编程一线的人员写的,应该不错吧,上面的开勇就是作者之一,第四条就是其中一本书的讨论坛子,希望有更多的人来学习CUDA。大家一起加油啊。