前言
这两天学到第七章了,发现这几章代码对我来说都有点小复杂于是就把我对第七章的代码理解也写一下,仅供学习,如果大家有发现不对的地方欢迎指正。(文章代码顺序按照官方示例代码顺序给出,可按顺序食用)
cuda by example这本书及其代码下载链接如下https://github.com/yottaawesome/cuda-by-example
个人认为这段代码在纹理内存上的应用主要在blend_kernel,copy_const_kernel这两个函数上,因此我会对这两段代码进行详细注释
这部分代码不在赘述,定义了一些变量,引入头文件
#include "cuda.h"
#include "../common/book.h"
#include "../common/cpu_anim.h"
#define DIM 1024
#define PI 3.1415926535897932f
#define MAX_TEMP 1.0f
#define MIN_TEMP 0.0001f
#define SPEED 0.25f
在gpu上分配三个纹理内存,texConstSrc存储发热源,texIn用来存储输入,texOut用来存储输出
texture<float> texConstSrc;
texture<float> texIn;
texture<float> texOut;
blend_kernel函数
定义blend_kernel函数,其中有两个参数float*dst用来指定要修改数据的内存区域,在本文中分别是dev_inSrc与dev_outSrc,一个bool类型的dstOut,主要用来变换输入与输出(后面会详细解释这个变量的用处)
__global__ void blend_kernel(float* dst,
bool dstOut) {
// map from threadIdx/BlockIdx to pixel position
int x = threadIdx.x + blockIdx.x * blockDim.x;
int y = threadIdx.y + blockIdx.y * blockDim.y;
int offset = x + y * blockDim.x * gridDim.x;
int left = offset - 1;
int right = offset + 1;
if (x == 0) left++;
if (x == DIM - 1) right