编写CUDA程序经验教训
1.在编写cuda程序时,不管是在cpu还是gpu执行的代码,所有n维数组均用cudaMalloc/malloc开辟一维空间,通过 [行号*列数+列号] 来获取其值。
慎用:cudaMallocPitch、cudaMemset2D、cudaMemcpy2D 这一套二维数组相关函数,因为这套函数的对齐操作会导致矩阵旋转操作中结果有误。
2.注意:线程函数里,在指针变化时,禁止用 += -= 这种运算!!!
3.注意:列向量、行向量 都用 一维数组 表示。
3.在编写cuda程序时,不管是在cpu还是gpu执行的代码,所有n维数组均有cudaMalloc/malloc开辟一维空间,通过 [行号*列数+列号] 来获取其值
本文总结了CUDA编程时的经验教训,包括避免使用cudaMallocPitch等可能导致矩阵旋转错误的函数,禁止在指针变化时使用复合赋值运算,以及统一使用一维数组表示多维数组。这些要点对于提高CUDA程序的正确性和效率至关重要。
1947

被折叠的 条评论
为什么被折叠?



