
cuda
文章平均质量分 76
海棠花不香
这个作者很懒,什么都没留下…
展开
-
基于mps的pytorch 多实例并行推理
不开启mps服务下,相同任务的双进程耗时是单进程耗时的2倍,说明双进程是串行运行的。符合预期。开启mps服务下,相同让任务的双进程耗时是单进程耗时的1~1.3倍,说明两个进程在并发运行,但是有抢占某种资源的情况,无法做到接近单进程耗时,需要进一步研究。原创 2023-12-01 20:05:47 · 2013 阅读 · 5 评论 -
可视化性能分析器nvvp的安装
这里有一个坑,如果去官网下载最新的jdk17,安装(其实就是将解压后的目录添加到环境变量)后,会有如下报错。windows上安装完cuda后,nvvp程序在安装目录下了。如果有将该目录添加到环境变量,在命令行执行nvvp,可以看到类似如下提示。检查是否正常安装完成,在命令行输入java -version(在这个过程中不用手动添加环境变量)最后,命令行输入nvvp,可以正常启动性能分析界面。一句话总结,找到靠谱网站,下载并安装jdk8。,这里可以安全,愉快地下载到安装包。双击开始安装,更改安装目录。原创 2022-11-28 22:35:21 · 761 阅读 · 0 评论 -
cuda中关于占用率的计算
官方文档CUDA C++ Best Practices Guide中提到一个例子:对于7.0的设备,每个multiprocessor有65536个寄存器,且支持最大的并发线程束为64。可以使用官方提供的NVIDIA GPU Computing Toolkit\CUDA\v11.1\tools目录下的CUDA_Occupancy_Calculator.xls来计算相关参数。这里最重要的数据是每个SM上的活跃线程块,这个数值受两个方面的资源限制,一个是寄存器资源,一个是共享内存的资源。原创 2022-11-10 16:43:26 · 824 阅读 · 0 评论 -
win10上使用gpu版的tensorflow
提示找不到cudart64_100.dll这个cuda运行时的库文件,推测是cuda11相对tensorflow2.0版本来说高了。一个讨巧的版本是找到cudart64_110.dll文件,将其复制,并改名,可以去掉错误,但这种方法后续使用时存在隐患。,安装好显卡驱动,cuda和cudnn。根据报错信息,缺少c++编译工具的动态库,需安装Visual c++ 2015。改名后,再次导入,没有错误,可以正常打印出版本信息。安装完成后,重新导入,出现新的报错。双击安装,只需安装8.1即可。至此,初步完成安装。原创 2022-10-11 14:10:50 · 740 阅读 · 0 评论 -
windows10下visual studio 2019安装以及cuda11配置
windows10下visual studio 2019安装以及cuda11配置原创 2021-12-31 15:33:06 · 31202 阅读 · 40 评论