RuntimeError: CUDA error: device-side assert triggered

最新推荐文章于 2024-07-10 08:38:27 发布

特立独行的蜗牛

最新推荐文章于 2024-07-10 08:38:27 发布

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏：域不对称自适应论文与源码分享 bug python 文章标签： pytorch 深度学习人工智能

本文链接：https://blog.youkuaiyun.com/qq_41722101/article/details/127516812

bug 同时被 3 个专栏收录

3 篇文章

订阅专栏

python

2 篇文章

订阅专栏

域不对称自适应论文与源码分享

1 篇文章

订阅专栏

在使用PyTorch进行深度学习训练时，将官方数据集替换为自定义数据集后，遇到`RuntimeError: CUDA error: device-side assert triggered`的错误。尝试了调整loss处理和改变batch_size，但问题依旧存在。可能是由于标签不匹配导致的错误。参考相关博客文章寻求解决方案。

跑了三轮迭代后，死掉了，遇到上面的bug,

/opt/conda/conda-bld/pytorch_1614378063927/work/aten/src/THCUNN/ClassNLLCriterion.cu:59: ClassNLLCriterion_updateOutput_no_reduce_kernel: block: [0,0,0], thread: [0,0,0] Assertion `cur_target >= 0 && cur_target < n_classes` failed.

跑的GitHub的模型，用官方给的数据集可以正确出结果，换成我自己的数据集开始报上边的错，

百度到的结果大概分三类: