1 问题描述
运行模型训练,错误信息如下:
Traceback (most recent call last):
File "/opt/Bert-VITS2/./text/chinese_bert.py", line 3, in <module>
import torch
File "/root/anaconda3/envs/vits/lib/python3.9/site-packages/torch/__init__.py", line 191, in <module>
_load_global_deps()
File "/root/anaconda3/envs/vits/lib/python3.9/site-packages/torch/__init__.py", line 153, in _load_global_deps
ctypes.CDLL(lib_path, mode=ctypes.RTLD_GLOBAL)
File "/root/anaconda3/envs/vits/lib/python3.9/ctypes/__init__.py", line 382, in __init__
self._handle = _dlopen(self._name, mode)
OSError: /root/anaconda3/envs/vits/lib/python3.9/site-packages/torch/lib/../../nvidia/cublas/lib/libcublas.so.11: symbol cublasLtGetStatusString, version libcublasLt.so.11 not defined in file libcublasLt.so.11 with link time reference
2 问题分析
查看模块版本,显示如下:
pip list
Package Version
----------------------------- ----------
.

文章讲述了在进行模型训练时遇到的CUDA版本与PyTorch版本不匹配的错误,通过检查模块版本并调整安装的torch、torchaudio和torchvision版本至cu117,成功解决了问题。同时介绍了Conda作为包管理和环境管理工具在Python项目中的重要性及其核心功能和优势。
最低0.47元/天 解锁文章
3292

被折叠的 条评论
为什么被折叠?



