

解决PyTorch中的RuntimeError: CUDA error: device-side assert triggered
大家好,我是默语,擅长全栈开发、运维和人工智能技术。在这篇文章中,我将深入探讨如何解决PyTorch中的一个常见错误:RuntimeError: CUDA error: device-side assert triggered。这个错误常常让开发者头疼,因为它涉及到GPU设备的断言错误,可能会导致程序崩溃。通过本文的详细分析和代码示例,希望帮助大家顺利解决这个问题,提高模型的运行效率。在PyTorch中,张量的数据类型必须与模型的预期类型匹配。如果存在不匹配,可能会导致CUDA设备上的断言失败。



WSL2下Ubuntu20.04环境配置(Anaconda、Pytorch、CUDA安装)与项目导入
如果想知道自己显卡版本对应CUDA版本可以前往(https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html)查看,理论上可以安装低版本CUDA。3. 下载完 Ubuntu 后直接打开会出现问题,需要先下载内核:https://aka.ms/wsl2kernel,下载完成后双击安装即可。新建终端,cd到项目所在目录,即可开始编译。,选择对应版本下载(注意选择WSL版或者自己系统对应的),如下图,然后复制红框里的代码安装即可。


麒麟V10 安装cuda12.1,Anaconda3,python3.11,pytorch2.4.1
前期系统安装步骤省略,使用ventoy刻录U盘,下载镜像后,拷贝进入U盘,启动安装就可。至此,麒麟系统配置cuda,pytorch 配置完成,python里面调用GPU成功。编辑 /lib/modprobe.d/dist-blacklist.conf。如缺少进行yum安装或者升级内核保持一致即可,安装cuda不一直胡导致报错。这里麒麟系统我下载的Centos7的二进制包,执行安装即可。执行conda list | grep torch。网卡信息:网讯 WX1860A2。网页显示如下可选其他版本:地址如下。
