transformer+Torch+Nvidia CUDA 相关错误解决记录

文章描述了在使用Tensorboard时遇到的ImportError,具体表现为无法导入tensorboard.compat中的notf模块。解决方法是通过pip卸载并重新安装protobuf,推荐版本为3.20.0。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、错误信息:cannot import name 'notf' from 'tensorboard.compat'

(dl_base) [root@localhost WiNGPT2]# python test.py
[2023-10-08 02:18:35,071] [INFO] [real_accelerator.py:158:get_accelerator] Setting ds_accelerator to cuda (auto detect)
Traceback (most recent call last):
  File "/home/software/miniconda3/envs/dl_base/lib/python3.9/site-packages/tensorboard/compat/__init__.py", line 42, in tf
    from tensorboard.compat import notf  # noqa: F401
ImportError: cannot import name 'notf' from 'tensorboard.compat' (/home/software/miniconda3/envs/dl_base/lib/python3.9/site-packages/tensorboard/compat/__init__.py)

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/software/miniconda3/envs/dl_base/lib/python3.9/site-packages/transformers/utils/import_utils.py", line 1184, in _get_module
    return importlib.import_module("." + module_name, self.__name__)
  File "/home/software/miniconda3/envs/dl_base/lib/python3.9/importlib/__init__.py", line 127, in import_module
    return _bootstrap._gcd_import(name[level:], package, level)
。。。。。。。。

解决方法:

pip uninstall protobuf

pip install protobuf==3.20.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

2、报错信息:

Exception: data did not match any variant of untagged enum ModelWrapper at line 1250992 column 3

解决方法:

pip install -U transformers

3、某张卡明明没有进程使用,但是GPU-utils利用率为100%;

解决方法:

fuser -v /dev/nvidia*

结果如下:

 

关闭上述进程

kill -9 4075 29223 58864 

结果确认:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值