首先要保证使用的显卡的计算功能集(计算能力)在1.1以上,因为只有1.1或者更高版本的GPU计算功能集才能支持全局内存上的原子操作;此外,只有1.2或者更高版本的GPU计算功能集才能支持共享内存上的原子操作。可以在命令行下运行"C:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.0\bin\win64\Release\deviceQuery.exe"来查看自己的
GPU计算功能集(CUDA Capability Major/Minor version number)。
对于
计算能力1.1. 把所有.cu文件以及项目改为compte_11,sm_11(右击项目--》属性--》CUDA C/C++--》Device--》Code Generate), 在需要用到原子操作函数的文件头加上#include
sm_11_atomic_functions.h
(记得加尖括号)
,那么就可以正确使用对于int的atomicAdd了。
对于计算能力2.0.同理,把所有.cu文件以及项目改为compte_20,sm_20
(右击项目--》属性--》CUDA C/C++--》Device--》Code Generate)
, 在需要用到原子操作函数的文件头加上#include
m_20_atomic_functions.h (记得加尖括号)
,那么就可以正确使用对于int和float的atomicAdd了。