同步性和屏障
同步性synchronisation和屏障barrier。
不同的线程在共享和全局内存中读写数据需要有先后的控制。屏障的作用:用来控制多个线程的停止与等待,当所有线程都到达了屏障点,程序才继续运行。
CUDA负责完成的事情
1.从CPU同步数据到GPU
2.从GPU同步数据到CPU
3.(1、2使用cudaMemcpy)
4.给GPU分配内存
5.加载Kernel到GPU上,并开始计算
同步性synchronisation和屏障barrier。
不同的线程在共享和全局内存中读写数据需要有先后的控制。屏障的作用:用来控制多个线程的停止与等待,当所有线程都到达了屏障点,程序才继续运行。
1.从CPU同步数据到GPU
2.从GPU同步数据到CPU
3.(1、2使用cudaMemcpy)
4.给GPU分配内存
5.加载Kernel到GPU上,并开始计算