
环境配置
isunLt
这个作者很懒,什么都没留下…
展开
-
Pytorch使用DDP加载预训练权重时出现占用显存的多余进程
感谢知乎作者 https://www.zhihu.com/question/67209417/answer/866488638在使用DDP进行单机多卡分布式训练时,出现了在加载预训练权重时显存不够的现象,但是相同的代码单机单卡运行并不会出现问题,后来发现是在多卡训练时,额外出现了3个进程同时占用了0卡的部分显存导致的,而这3个进程正是另外3张卡load进来的数据,默认这些数据被放在了0卡上。解决的方法是把load进来的数据放在cpu(也就是内存)里。# 原来代码,load进的数据放在gpu里# pre原创 2021-09-16 20:56:41 · 2354 阅读 · 1 评论 -
Ubuntu离线安装curl
学校服务器联网要curl,但是服务器curl没装,没网又没法apt在线安装curl(首选)sudo apt install curl离线安装curl从这里下载curl源码curl-7.75.0.tar.gz解压./configure --prefix=/home/xxx/software/curl-7.75.0make -j8make installvim ~/.profile在.profile中添加PATH=/home/xxx/software/curl-7.75.0/bin:{PA原创 2021-03-08 22:23:32 · 7469 阅读 · 0 评论 -
本地打开服务器上的TensorBoard
假设服务器ip为123.456.789.123,服务器上tensorboard记录文件地址在/home/xxx/code/projectA/logs/tensorboard服务器端tensorboard --logdir=/home/xxx/code/projectA/logs/tensorboard --host=123.456.789.123输入后得到结果TensorBoard x.x.x at https://123.456.789.123:6006/(Press CTRL+C to qui原创 2021-03-12 15:07:13 · 370 阅读 · 2 评论 -
关于Import pykeops时出现warnning No cuda detect
具体问题在pykeops.common.gpu_utils的函数get_gpu_number()中 libnames = ("libcuda.so", "libcuda.dylib", "cuda.dll") for libname in libnames: try: cuda = ctypes.CDLL(libname) except OSError: continue else:原创 2021-03-27 19:13:21 · 1042 阅读 · 0 评论 -
解决GitHub访问慢
问题描述git clone 非常慢或者根本链接不上git clone https://github.com/XXXXXX/YYYYYYYY.git解决方案访问GitHub镜像网站git clone https://github.com.cnpmjs.org/XXXXXX/YYYYYYYY.git缺点:每次都要在github.com后面加.cnpmjs.org缺点弥补方案: 编写alias命令将输入的https://github.com/XXXXXX/YYYYYYYY.git自动替换成git原创 2021-06-19 16:22:33 · 282 阅读 · 0 评论