调用CUDA kernel函数后,报错“invalid configuration argument”排查方法:
1)使用cudaGetLastError()确定是哪个kernel函数导致的。
2)检查kernel<<<GridDim,BlockDim>>>();其中,grid dim在前,block dim在后。
注意:调用CUDA kernel函数,如果有指针,必须所有的指针都能够被GPU访问。
调用CUDA kernel函数后,报错“invalid configuration argument”排查方法:
1)使用cudaGetLastError()确定是哪个kernel函数导致的。
2)检查kernel<<<GridDim,BlockDim>>>();其中,grid dim在前,block dim在后。
注意:调用CUDA kernel函数,如果有指针,必须所有的指针都能够被GPU访问。
您可能感兴趣的与本文相关的镜像
PyTorch 2.9
PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理
5249
1390

被折叠的 条评论
为什么被折叠?