- 博客(2)
- 收藏
- 关注
原创 RuntimeError: Numpy is not available
【代码】RuntimeError: Numpy is not available。
2024-11-12 14:54:52
968
1
原创 ncclUnhandledCudaError: Call to CUDA function failed.
训练又报新的错误,ModuleNotFoundError: No module named 'fused_layer_norm_cuda'。在没有被选用训练的GPU上进行测试,发现可以正常训练模型。后来查看进程,发现训练所选用GPU进程太多。一开始,以为是cuda版本和NCCL版本不匹配导致的问题,升级cuda后问题仍然存在。怀疑是进程太多卡住了,运行下面指令后重新训练。在网上查询发现是apex的错误,卸载apex。
2024-05-28 21:56:36
1592
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人