
深度学习
文章平均质量分 60
乐乐灬小Y
我不懒,我不懒
展开
-
Anaconda添加安装tensorflow以及horovod
本文仅为个人记录使用注意几个重要的点:1、conda中创建环境要注意要安装的tensorflow对应的python版本(就比如目前的horovod支持的ensorflow最高为2.0.0,tesorflow2.0.0支持的python版本最高为3.7)从源代码构建 | TensorFlowhttps://tensorflow.google.cn/install/source#gpu这个是官方的tensorflow对应python等相关环境的对应表2、可以用如下操作配置一个专属的pyt..原创 2021-10-19 11:59:58 · 1012 阅读 · 0 评论 -
基于智云星云服务器tensorflow的版本升级和Horovod安装与使用
智云星云服务器默认环境如下tensorflow:1.14.0tensorflow是否支持调用gpu:是gcc:7.5.0CUDA version:10.0.130Driver Version:460.73.01Cmake:无CUDNN_VERSION:7.6.5.32目前要配置horovod环境,查询资料可知,目前horovod只支持tensorflwo>=1.15的版本,因此要更新tensoflow版本,但是为了不破坏原本已经配好的环境,因此使用tensorfl.原创 2021-08-09 09:59:43 · 612 阅读 · 0 评论 -
报错:“AssertionError: Bad argument number for Name: 3, expecting 4“
记录一下问题的结决办法环境:tensorflow:tensorflow-gpu1.14.0horovod:0.19.5python:3.7.9CMake:3.21.1是否安装了nccl:是nccl版本:nccl_2.6.4-1+cuda10.0_x86_64CUDA:CUDA10.0CUDNN_VERSION=7.6.5.32找到解决办法的地方:https://github.com/youdao-ai/SRNet/issues/4中ursaminor0401的回答.原创 2021-08-05 09:58:09 · 393 阅读 · 0 评论 -
dlerror: libcuda rt.so.11.0: cannot open shared object file: No such file or directory的问题解决办法
全报错:dlerror: libcuda rt.so.11.0: cannot open shared object file: No such file or directory; LD_LIBRAR Y_PATH: /usr/local/cuda/lib64::/usr/local/nccl_2.10.3-1+cuda11.0_x86_64/lib首先要在cuda安装的路径下面查看以下 cd /usr/local/cuda/lib64查看是否有libcuda rt.so.11.0文件,以.原创 2021-08-03 14:24:58 · 4332 阅读 · 0 评论 -
ubuntu 配置 Horovod环境
最近在学习深度学习,导师叫我看看horovod,并自己配一下horovod的环境,看了网上很多很多的文章,自己也配了很多次,甚至把实验室的服务器给配崩了/(ㄒoㄒ)/~~。得出了一个血一般的教训:主要看官方的文档,百度的教程只是作为辅助Horovod官方GitHUb配置网站:https://github.com/horovod/horovod/blob/master/docs/install.rstHorovod官方gpu配置教程:https://github.com/horovod/horov原创 2021-08-03 14:08:35 · 1235 阅读 · 0 评论