今天编译了个算矩阵相乘的程序,想用nvprof工具来分析kernel的运行状况。
输入nvprof ./matrix.out
结果报错======== Error: unified memory profiling failed.
改为
nvprof --unified-memory-profiling off ./matrix.out
成功!
作者在使用nvprof工具分析GPU上运行的矩阵相乘程序时遇到unifiedmemoryprofilingfailed错误。通过关闭统一内存分析功能,问题得以解决。
今天编译了个算矩阵相乘的程序,想用nvprof工具来分析kernel的运行状况。
输入nvprof ./matrix.out
结果报错======== Error: unified memory profiling failed.
改为
nvprof --unified-memory-profiling off ./matrix.out
成功!
3521
3305
943
4422
904

被折叠的 条评论
为什么被折叠?