打开NVIDIA Visual Profiler,新建session,在File里选择需要分析的exe文件,exe文件在解决方案的debug文件夹下。然后next,再finish,就可以看到分析结果了。
需要注意的是,直接这样运行会出错,需要在main函数的最后加上一句cudaThreadExit();才能运行成功。
本文介绍了如何使用NVIDIA Visual Profiler进行性能分析。通过新建session并选择目标exe文件即可开始分析,需确保在main函数末尾加入cudaThreadExit()以使程序正常运行。
打开NVIDIA Visual Profiler,新建session,在File里选择需要分析的exe文件,exe文件在解决方案的debug文件夹下。然后next,再finish,就可以看到分析结果了。
需要注意的是,直接这样运行会出错,需要在main函数的最后加上一句cudaThreadExit();才能运行成功。
您可能感兴趣的与本文相关的镜像
PyTorch 2.8
PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

被折叠的 条评论
为什么被折叠?