- 博客(44)
- 收藏
- 关注
原创 RuntimeError: NCCL error in: ../torch/csrc/distributed/c10d/ProcessGroupNCCL.cpp:1123, internal erro
用命令ifconfig查看网卡,然后重新设置。
2023-04-03 11:38:26
2616
1
原创 Some NCCL operations have failed or timed out. Due to the asynchronous nature of CUDA kernels, subse
2、第二步是看是不是某一张卡出现了问题,过程是分别设置0、1卡,0、1、2、3卡,0、1、2、3、4、5卡,0、1、2、3、4、5、6卡,我的实验中这些都没问题,但是0、1、2、3、4、5、6、7就有问题了,所以怀疑是7卡有问题,然后试了一下1、2、3、4、5、6、7卡跑,也没问题,所以怀疑是0卡和7卡之间有冲突,然后试了一下0、7卡,也没有问题。所以问题不是在某一张卡上。1、首先先看1张卡能不能跑通,以此来排除代码本身问题。代码运行成功,问题解决。
2023-04-02 14:56:55
4846
3
原创 ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.22‘ not found
然后我们知道GLIBCXX_3.4.22这个包是anaconda下的,但是这个报错是由于搜索到了服务器根目录的路径/usr/lib/x86_64-linux-gnu/,而anaconda下其实是有这个包的,所以在使用时把搜索路径优先设置成先搜索anaconda的路径。此处/opt/conda/envs/ptca/lib/是anaconda的路径,可以通过上述的which python来找到。本句的意思是所有的依赖包的搜索都是先从anaconda的路径先开始搜索。
2023-03-24 14:00:55
829
1
原创 通过命令ssh连接的机器,出现python导入文件的路径问题
问题:同样的代码在vscode里就能正常运行,但是通过ssh命令连接的机器,出现python导入文件的路径问题。原因:vscode有导入插件,可以自动寻找文件路径,但是我连接的另外的机器没有。
2022-12-30 11:43:49
234
原创 /usr/bin/env: “perl\r”: 没有那个文件或目录
问题:是因为linux和windows文件属性问题,我有个文件是在windows下创建,挪到linux系统下运行报错解决方法:把文件属性改为linux成功解决
2022-07-07 12:06:55
4317
1
原创 LaTeX指南
首先,选择一款编译器,详解在这里说一说 TeXstudio - 知乎我选择了texstudio编译器(在线编译器slager和overleaf都需要花钱)下载完成后,需要下载配置相应环境,详解最新TeXLive 环境的安装与配置 - 知乎 (zhihu.com)...
2022-05-10 09:47:06
292
原创 在cuda11.2的条件下下载tensorflow1.12
用cudatoolkit下载:conda install tensorflow=1.12 cudatoolkit=9.0 -c tensorflow
2022-05-09 00:54:45
817
1
原创 pytorch,cuda,cudatoolkit,driver版本详解
pytorch,cuda,cudatoolkit,driver版本详解_Tan Jiang的博客-优快云博客_cudatoolkit版本
2022-05-09 00:38:38
741
原创 pip install 出现问题
Looking in indexes: https://pypi.nioint.com/simpleERROR: Could not find a version that satisfies the requirement clickhouse_driver (from versions: none)ERROR: No matching distribution found for clickhouse_driver命令如下:pip install packName -i http:/.
2022-05-07 15:06:30
1024
原创 在一个局域网内的两个服务器可以通过scp传递文件
scp -r 文件名 zhaoqing.li@10.113.4.16:/home/zhaoqing.li/
2022-05-07 11:46:53
430
原创 mac通过本地终端连接服务器
先下载homebrew(网上找教程),再在终端brew install corkscrew然后更改~/.ssh/configHost 16 HostName 10.***(ip地址) User ***(服务器的用户名) IdentityFile ~/.ssh/id_rsa (通过本地的什么私钥连接)Host * User ***(服务器的用户名) SendEnv LANG LC_* TCPKeepAlive yes ServerAliveInterval 30 Se
2022-04-28 15:29:11
1523
原创 MAC用git时出现Corkscrew问题,下载不了文件
具体报错找不到了开始以为是公钥的问题,原来是把~/.ssh里的config给删了换成别的了,所以没法用了,恢复了一下就成功了
2022-04-27 16:54:03
976
原创 WARNING:root:No sentence-transformers model found with name /Users/zhaoqing.li/Desktop/transformers-
WARNING:root:No sentence-transformers model found with name /Users/zhaoqing.li/Desktop/transformers-nlu/models/bert-base-chinese. Creating a new one with MEAN pooling.使用sentence_transformers的时候出现的warning,因为读的自己路径下的模型,不是huggingface上的,这个warning可以省略...
2022-04-25 19:13:46
10888
5
原创 ERROR: Could not build wheels for tokenizers, which is required to install pyproject.toml-based...
ERROR: Could not build wheels for tokenizers, which is required to install pyproject.toml-based..._JOJO黄金之风的博客-优快云博客
2022-04-25 19:10:53
9721
原创 git使用记录
用git branch查看现在在哪个分支用git checkout master(或者别的分支来切换分支)再git pull更新代码
2022-04-24 11:05:11
299
原创 ERROR: Could not install packages due to an OSError: HTTPSConnectionPool(host=‘pypi.nioint.com‘, por
pip install sentence_transformersLooking in indexes: https://pypi.nioint.com/simpleCollecting sentence_transformers Downloading https://pypi.nioint.com/packages/source/s/sentence-transformers/sentence-transformers-2.2.0.tar.gz?remote=https%3A%2F%2Fmir.
2022-04-22 17:32:57
4723
原创 CommandNotFoundError: Your shell has not been properly configured to use ‘conda activate‘.If your s
CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.If your shell is Bash or a Bourne variant, enable conda for the current user with $ echo ". /home/zhaoqing.li/anaconda3/etc/profile.d/conda.sh" >> ~/.ba...
2022-04-22 11:59:14
2470
1
原创 在有很多用户的服务器下配置环境
情况如下:只能通过跳板机连接相应服务器,进入服务器后,显示的不是自己的账号:[jump@p-kcbj-nomi-16 ~]切换到自己的账号:sudo su ***要先切换到自己的文件下,再安装anaconda什么的:
2022-04-22 11:48:08
187
原创 mac安装Homebrew出现的问题
用brew install corkcrew的时候出现以下问题:zhaoqing.li@MBC02XC04EJGH7 ~ % brew install corkscrewWarning: No available formula with the name "corkscrew".==> Searching for similarly named formulae...Error: No similarly named formulae found.==> Searching f.
2022-04-19 17:05:50
11859
1
原创 服务器连接github
原来一个服务器的一个账号只用生成一对密钥就可以了......ssh-keygen -t rsacd ~/.sshcat id_rsa.pub
2022-04-13 17:35:38
1182
原创 from torch._C import *ImportError: numpy.core.multiarray failed to import
File "/home/test.py", line 1, in <module> import torch File "/home/anaconda3/envs/consert/lib/python3.6/site-packages/torch/__init__.py", line 196, in <module> from torch._C import *ImportError: numpy.core.multiarray failed to impor.
2022-04-10 12:23:28
2104
1
原创 在linux服务器中安装anaconda3
把安装包下载到服务器中然后在服务器中使用bash命令安装,安装过程中一路回车就好了安装完成后,需要添加环境变量:vim ~/.bashrc在文档末尾加上:export PATH=$PATH:/home/.../anaconda3/bin (中间...是看你的anaconda3的路径在哪里,需要修改)保存更改后,运行:source ~/.bashrc就OK了推荐一个环境安装的入门级别视频:AI杀疯了!2022年保姆级AI算法教程,新年必玩!_哔
2022-04-10 11:49:56
1629
原创 Pytorch tensor 如何找到特定值的索引 (index)
(4条消息) Pytorch tensor 如何找到特定值的索引 (index)_江浙沪讲吴语的博客-优快云博客
2022-04-08 11:11:57
4186
原创 TypeError: cannot unpack non-iterable NoneType object
报错的原因是函数返回值得数量不一致,查看函数返回值数量和调用函数时接收返回值的数量是不是一致,修改一致即可
2022-04-02 11:47:16
718
原创 AttributeError: ‘numpy.float64‘ object has no attribute ‘epoch‘
AttributeError: 'numpy.float64' object has no attribute 'epoch'是自己不小心写成f1.epoch了,改成f1, epoch
2022-04-02 11:46:00
2169
原创 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 0: invalid start byte解决方法
问题出在版本上,因为在前面的函数里把fw = open(filename,'w')改成了fw = open(filename,'wb'),所以在这个函数中也把fr = open(filename)改为fr = open(filename,'rb'),问题解决,事实证明确实是版本不同导致的。...
2022-04-01 17:21:03
8200
原创 Attempted to load tokenizers/punkt/PY3/english.pickle
分明已经把punkt放到服务器相应文件下,但是还是显示没成功。错误原因是解压得时候文件目录有两个punkt!!!
2022-03-31 09:22:47
1686
2
原创 解决Google Drive 大文件下载过程中中途失败问题
使用Internet Download Manager的断点续传功能进行下载大文件。解决Google Drive 大文件下载过程中中途失败问题 - 知乎 (zhihu.com)
2022-03-31 00:42:38
4838
原创 RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`我的问题出现的代码地方:百度的时候看到这个问题的两个解决办法:1.可能是shape不对,但是我查看了自己的shape,没有问题2.可能是放在了不同的device上,
2022-03-30 15:23:02
15009
9
原创 ERROR: pip’s dependency resolver does not currently take into account all the packages that are inst
ERROR: pip’s dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.imbalanced-learn 0.7.0 requires joblib>=0.11, which is not installed.imbalanc
2022-03-26 17:34:47
4038
原创 RuntimeError: CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling `cublasCreate(handle)`
batch_size太大了
2022-03-24 17:04:25
3703
2
原创 VSCode调试带-m参数的python指令
问题:我在命令行运行的是python3 -m sosed.run -i input_examples/input.txt -o output/closure/,但是在VSCode中的普通调试,会报模块找不到的问题(原因是普通调试不会带-m参数,所以有些路径就会找不到)。因此,本文记录如何用VSCode调试在命令行输入的如上Python指令。解决方案:# 先按照这个modulepython3 -m pip install debugpy# 在命令行运行:python3 -m debug.
2022-03-23 20:11:56
1372
原创 vscode带参数的debug
问题:在launch.json加了args结果还是运行不出来:问题解决:把主函数中的args的required=True注释掉required参数为True,代表不可省略,所以运行时候需要输入文件目录。
2022-03-21 21:28:11
815
原创 Resource punkt not found. Please use the NLTK Downloader to obtain the resource: >>> import nlt
问题如下:Resource punkt not found.Please use the NLTK Downloader to obtain the resource: >>> import nltk >>> nltk.download('punkt')For more information see: https://www.nltk.org/data.htmlAttempted to load tokenizers/punkt/PY3/e...
2022-03-21 20:02:08
1457
原创 vscode连服务器python拓展出现问题
尝试解决办法:1. 重新下载拓展,结果下载半天,也没反应,下载不下来,失败2. 在官网Extensions for Visual Studio family of products | Visual Studio Marketplace下载一下相应的拓展包,放在服务器随便一个位置,在vscode的拓展里选择“从VSIX安装”导入包,但是好像出现了文件残缺的问题,失败问题的解决:tnnd原来是服务器没地方了!!!把服务器清理一下,重新下载python拓展就成功了...
2022-03-20 16:03:15
3153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人