- 博客(6)
- 收藏
- 关注
原创 训练出现nan
问题描述训练时出现nan,有时出现在刚开始的时候,有时出现在训练中。解决debug,发现是BatchNorm时出现了问题。我的代码中有的batch size为1,这时torch.var(data,dim=0)会返回nan
2021-11-09 21:40:54
236
原创 CUDA ERROR: device-side assert triggered
# device-side assert triggeredoperator(): block: [116,0,0], thread: [95,0,0] Assertion `index >= -sizes[i] && index < sizes[i] && "index out of bounds"` failed.在网上的很多资料都说这个问题是索引有问题从报错行一行行向上check,发现确实存在索引出错的问题在我的代码中,需要一个广播的功能类似于,
2021-10-13 11:14:26
843
原创 矩阵分析(一)
博客地址https://blog.youkuaiyun.com/myan/article/details/647511一些记录首先原来不是只有我自己上来学习线性代数的时候就蒙蔽,还记得当初学那本棕色的书,一个定义不懂就往前翻,还是有新的定义,再往前翻,都是中文我却看不懂,那时还不知道B站,知乎也刚有,也不知道查资料,只心想自己真笨不是学数学的料。看大佬的文章,心里有点开心原来也不全是我的问题。大佬在文中的蓝色文字的思考和提问方式值得我学习。“空间”的概念很重要。线性空间——定义范数——>赋范线性空间—
2021-09-13 09:42:56
208
原创 解决RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cubla...
解决RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cubla...跑实验遇到了这个问题,一开始查资料发现有人说是因为维度可能不同,但是经过检查,不存在这个问题,另外也有解决方法是加一句代码torch.backends.cudnn.enabled = False,但是还没尝试,因为发现main.py文件和其他文件的CUDA device设置不同(数据不多,我没设置nn.parallel),更改一致后就没有问题了。
2021-09-06 19:04:41
34898
9
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人