- 无法启用GPU加速,
torch::cuda::is_available()返回值一直是false - 将模型转入GPU时抛出异常
c10::NotImplementedError - 在RTX3070上,CUDA的初始化速度非非非非非非非非非非非非非非常慢
第一个问题从最一开始就遇到了,原因不明,版本为1.10.0+cu102 。
解决方案为通过编译器的参数引入一个额外的符号,参数具体为:
/INCLUDE:?warp_size@cuda@at@@YAHXZ
第二个问题在升级libTorch,依赖cuda11.3的时候遇到了,原因依旧不明,版本号为1.11.0+cu113。
具体的,以下代码:
m_convnet = std::make_shared<ConVNet>(m_config);
m_convnet->
CUDA 11.3升级问题:GPU加速启用难题与NotImplementedError解决

本文探讨了在使用PyTorch时遇到的GPU加速问题,包括torch::cuda::is_available()返回false、模型转GPU时的c10::NotImplementedError,以及CUDA 11对RTX30系列支持延迟。通过编译器参数解决了这些问题,并揭示了CUDA初始化速度变慢的现象。
最低0.47元/天 解锁文章
4110





