nvprof --metrics achieved_occupancy,gld_throughput,gst_throughput,gld_efficiency,gst_efficiency,gld_transactions,gst_transactions,gld_transactions_per_request,gst_transactions_per_request,branch_efficiency,shared_store_transactions_per_request,tex_cache_hit_rate,tex_cache_transactions
用例:
nvprof --metrics achieved_occupancy ./sumMatrix 32 32
本文深入探讨了使用NVPROF工具进行GPU性能分析的方法,详细解释了包括occupancy、throughput、efficiency等在内的多项关键性能指标,旨在帮助开发者更有效地优化GPU应用程序。
2978

被折叠的 条评论
为什么被折叠?



