
深度学习记录
码冰糖
静下来
展开
-
SongNet在Windows10环境下的复现过程及遇到的问题
SongNet网络巨坑调试,踩了一大堆坑。原创 2024-02-01 17:16:16 · 1088 阅读 · 1 评论 -
RuntimeError: CUDA error: device-side assert triggered
环境:两张显卡有两个人在用,都是用的双卡训练,也不知道是否与多人公共显卡有关,因为之前自己用的时候没发生过这种错误。运行了14个epoch之后第15个epoch才报错,看报错像是计算loss的时候数组越界了,没找到问题原因。原创 2023-02-11 01:33:05 · 1780 阅读 · 1 评论 -
numba.core.errors.TypingError: Failed in nopython mode pipeline (step: nopython frontend)No impleme
深度学习项目中numba报错。根据报错提示,尝试安装了scipy,问题得到解决。原创 2023-02-07 22:14:06 · 2779 阅读 · 0 评论 -
深度学习:用del删掉不用的tensor真的能降低显存消耗吗
del能降显存占用么?能不能解决显存溢出不能训练的问题?原创 2023-01-07 06:20:18 · 1224 阅读 · 0 评论 -
pytorch怎么显示unused_parameters
本文讲解pytorch遇到unused_parameters时怎么显示,并说明了预训练模型自定义修改导致有未使用参数怎么解决原创 2022-12-10 03:09:03 · 509 阅读 · 0 评论 -
Import Error:undefined symbol THPVariableClass
inplace-abn需要根据当前版本的pytorch与CUDA编译安装,如果在旧环境编译安装然后更新了环境比如更新pytorch,就会导致这个问题。重新编译inplace-abn:先pip卸载inplace-abn,再删除pip缓存,再重装。原创 2022-12-10 02:23:00 · 1244 阅读 · 0 评论 -
ERROR: Failed building wheel for inplace-abn
pip安装并编译inplace-abn时报错,是cuda版本的问题原创 2022-12-09 21:34:44 · 1888 阅读 · 1 评论 -
AttributeError: Can‘t pickle local object ‘get_scheduler.<locals>.<lambda>‘
pytorch lightning设置优化器的学习率调整策略为LambdaLR时,训练一轮后出现如下报错。pickle无法处理不带有名字的lambda匿名返回值,需要用变量存储后再传入。将代码的匿名函数传入改为用变量存储的具名函数传入。原创 2022-12-09 21:22:37 · 789 阅读 · 0 评论