- 博客(4)
- 收藏
- 关注
原创 问题解决:GPU满了但是没有进程
在vscode终端测试代码,确认能运行之后就直接把终端杀掉了,但是显存没有释放,再次挂tmux跑报OOM。69919就是要找到的进程,使用kill -9 69919就可以了。记录以下微调ChatGLM2-6B中遇到的问题。
2023-11-12 23:54:02
411
1
原创 CUDA SETUP: Something unexpected happened.问题解决
解决方法:千万不要向网上说的那样重新按照CUDA,将bitsandbytes版本降低到0.40.0以下即可,例如pip install bitsandbytes==0.39.0。
2023-11-12 19:10:23
767
1
原创 记录跑Sentence-Bert中出现的问题和收获
2. 报错torch‘ has no attribute ‘inference_mode‘和AttributeError: module 'torch' has no attribute 'autocast', 实测在另一台服务器上torch版本为2.0.1并不会出现此类问题,能升级最好是通过升级解决。1. 服务器网速太慢的时候在 pip install xx 后面加上 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com.
2023-10-25 15:06:56
194
1
原创 李宏毅视频学习笔记1
在实际学习过程中,我们将整个样本分成了一个个batch,先取第一个batch开始,计算出batch1的Loss,记为L1,计算出此时L1的梯度。以此类推,我们可以对剩余的batch挨个进行这样的操作,依次对θ进行更新。2. 深度学习使用的是类神经网络,输入可以是向量、序列、矩阵,输出可以是数值(regression)、类别(classification)、文本图片。随着网络层数的加深,在训练集上的表现更好,但在测试集上的表现会变差,原因在于过拟合(overfitting)a. 先猜测一下函数的基本形式。
2023-07-23 16:48:00
55
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人