最近使用cuda编程经常遇到 invalid device function错误
核函数不能执行。
经过漫长的调试才发现我犯了一个比较二的问题。
我定义了一个3维数组 大概有2000*2000*21这么大。定义为device static 变量
就是它导致编译通过后的各种bug
最后还是老老实实cudaMalloc来申请空间吧
PS: 我开始写的代码有时可以运行 有时又不可以。改了之后就稳定了
最近使用cuda编程经常遇到 invalid device function错误
核函数不能执行。
经过漫长的调试才发现我犯了一个比较二的问题。
我定义了一个3维数组 大概有2000*2000*21这么大。定义为device static 变量
就是它导致编译通过后的各种bug
最后还是老老实实cudaMalloc来申请空间吧
PS: 我开始写的代码有时可以运行 有时又不可以。改了之后就稳定了