
CUDA
lumping
写博客主要是记录自己在实践中遇到的一些问题和解决方法,也希望能为其他遇到同样问题的人提供一点点帮助。
所有文章免费向所有人公开,如遇到文章被设置为VIP而无法阅读的情况,请私信联系。
展开
-
利用CUDA查看多张显卡可用显存和总显存大小
利用CUDA查看每张显卡上的可用显存大小和总的显存大小,主要参考了博文1,博文2,主要使用的函数是cudaMemGetInfo(),和cudaGetDeviceCount();cudaSetDevice()#include <cuda.h>#include <stdio.h>#include <cuda_runtime.h>#include <device_launch_parameters.h>int main(){ size_t ava原创 2021-02-05 20:43:50 · 3127 阅读 · 0 评论 -
tensorflow gpu版 import 时候报错 return _load(spec) ImportError: DLL load failed: 找不到指定的模块
1.检查TF 版本和CUDA版本以及 cuDNN版本之间是否匹配可以在这个网站查看https://tensorflow.google.cn/install/source_windows例如我的配置就是py3.6+ cuda10.0 +cuDNN7.42.MSC++ 2015-2019 没有安装MSC++ 2015-2019 优快云免积分下载地址以上两个过程基本就可以解决问题了,但是tensorflow-gpu只支持算力在3.5以上的卡,以下的就算了...原创 2021-02-03 21:40:02 · 1355 阅读 · 0 评论 -
nvidia-smi 报错 NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver
1.安装dkmssudo apt-get install dkms安装以后再试试 nvidia-smi,如果没有问题就OK,如果还有问题2.查看原来安装的驱动版本ls /usr/src | grep -i nvidia会显示驱动版本号,比如输出的是nvidia-440.100#那就执行sudo dkms install -m nvidia -v 440.100参考:https://zhuanlan.zhihu.com/p/89714824https://.原创 2021-01-25 13:49:38 · 227 阅读 · 0 评论 -
CPU GPU 压力负载测试
CPU:1.cat /dev/urandom | md5sum2.下载cpuburn,可直接使用http://www.cpuburnin.com/downloads/cpuburn-in.tar.gzGPU:下载gpuburn编译安装参考链接:原创 2020-08-26 12:07:58 · 1620 阅读 · 0 评论 -
CUDA相关资料(待完善)
每个SM包含的SP数量依据GPU架构而不同,Fermi架构GF100是32个,GF10X是48个,Kepler架构都是192个,maxwell128,pascal 64/128,Turing 64 ,Volte 642008特斯拉,2010费米,2012开普勒,2014麦克斯韦,2016帕斯卡,2017伏特,2018图灵TTV 用的是伏特架构P4000 用的是pascal架构Titan Black Kepler架构RTX 2080 Turing架构...原创 2020-08-05 18:09:14 · 187 阅读 · 0 评论 -
CUDA 计算线程索引的一般公式
CUDA thread index:int blockId = blockIdx.z * (gridDim.x*gridDim.y) + blockIdx.y * gridDim.x + blockIdx.x;int threadId = blockId * (blockDim.x * blockDim.y * blockDim.z) + threadIdx.z * (bloc...转载 2020-08-05 11:25:53 · 1003 阅读 · 1 评论 -
Windows下 VSCode配置cuda编译环境
Windows系统下,在Visual Studio 里配置CUDA环境网上已经有很多资料了,而在轻量级IDE VScode上编译CUDA的材料不是很多,本篇博文将简要介绍在Windows 系统下配置CUDA环境的方法。一、VScode插件 code-runner法在VScode里安装插件——coder-runner,在settings.json里添加(win10下的)"code-runner.executorMap": { "cu": "cd $dir; nvcc $fileN原创 2020-07-29 11:39:35 · 18161 阅读 · 15 评论