CUDA 编程 之 invalid device function

本文探讨了在使用CUDA编程时遇到的invaliddevicefunction错误的原因及解决方法,作者通过实例分析,指出问题出在一个大规模的静态三维数组上,并分享了将空间申请方式从静态变量更改为动态分配的解决方案,最终实现程序的稳定运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近使用cuda编程经常遇到 invalid device function错误

核函数不能执行。

经过漫长的调试才发现我犯了一个比较二的问题。

我定义了一个3维数组 大概有2000*2000*21这么大。定义为device static 变量

就是它导致编译通过后的各种bug

最后还是老老实实cudaMalloc来申请空间吧



PS: 我开始写的代码有时可以运行 有时又不可以。改了之后就稳定了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值