
Pytorch
机器学习了解一下
这个作者很懒,什么都没留下…
展开
-
PyTorch踩坑记录
使用Pytorch也一年多了,记录一下自己遇到的各种问题。各种踩坑记录loss.backward()报错一种非常常见的错误,在网络前向传播时没问题,但是当loss.backward()时会报错导致这个错误的原因非常多样in-place操作导致,具体的in-place操作有很多,例如squeeze_(), x[:]=y, 等等,网上相关资料很多,不细写loss需要是一个标量,如果是向量的话,需要x.sum();有些向量不需要传递梯度时,使用x.detach()截断梯度传递;一个非常有用的命令原创 2020-10-04 14:10:31 · 1367 阅读 · 0 评论 -
Pytorch模型训练相关函数记录
训练模型时,对梯度进行截断import torch as t_ = nn.utils.clip_grad_norm_(model.parameters(), clip)2.load预训练好的模型cpu->cpu或者gpu->gpu,直接model.load_state_dict(t.load(param_file)) # load模型gpu上训练,在cpu上载入...原创 2019-03-06 13:55:32 · 992 阅读 · 3 评论 -
Pytorch常用函数总结
1、乘法torch中矩阵元素点乘【哈达马积(hadamard product)】为t.mul(batch数据也是)torch中矩阵乘法为t.mm 涉及到batch的矩阵乘法为t.bmm, t.matmul也可以原创 2019-03-29 16:05:50 · 1345 阅读 · 0 评论 -
Pytorch常见错误记录
1、cuDNN版本不匹配被这个问题困了一上午。。。首先$LD_LIBRARY_PATH显示的路径为/usr/local/cuda-9.0/lib64cd到这个路径下发现对应的cudnn版本为7102但是conda list显示自己anaconda对应的cudnn版本为7301因此产生了版本不匹配解决方案: conda install cudnn=7.1.2将自己的cudnn版本改...原创 2019-03-28 14:03:52 · 2399 阅读 · 0 评论 -
记录一个Pytorch运行bug
python: symbol lookup error: /home/wrn/anaconda3/lib/python3.6/site-packages/numpy/core/…/…/…/…/libmkl_intel_thread.so: undefined symbol: __kmpc_global_thread_num在服务器上运行Pytorch程序时,出现了这个报错服务器上的各个包版本为...原创 2019-07-24 13:05:31 · 1015 阅读 · 0 评论