- 博客(3)
- 收藏
- 关注
原创 换源下载Huggingface模型权重,以及出现[Errno 13] Permission denied : ‘/.cache‘
是由于huggingface会默认去/home/ubuntu的/.cache文件夹下读取已下载的模型权重,而/.cache无读写权限。因此,需要修改Huggingface的环境变量HF_HOME,使用/.cache以外的其他目录作为缓存路径。
2024-07-10 13:56:44
1296
原创 cuda、torch与显卡问题:解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
复现Shi等人的工作时,手动修复FileNotFound错误后定位到RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED。可以确定此错误由显卡算力、cuda、torch三部分的不匹配问题导致。其他问题可能有:python版本、训练参数要求的显卡算力过大等,但出现可能性很低。注意到,如果错误是由于显卡不足的简单问题导致的,修改batch_size可以解决问题,但会影响模型的梯度,故尝试不修改。
2024-04-17 15:12:10
3522
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人