- 博客(2)
- 资源 (1)
- 收藏
- 关注
翻译 CUDA C/C++ 中如何优化数据传输
设备内存和 GPU 之间的峰值带宽(例如,在 NVIDIA Tesla C2050 上为 144 GB/s)远高于主机内存和设备内存之间的峰值带宽(在 PCIe x16 Gen2 上为 8 GB/s)。这种差异意味着您在主机和 GPU 设备之间实现数据传输可能破坏您的整体应用程序性能。在对以上策略展开介绍之前,首先给出如何在不修改源代码的情况下测量数据传输所花费的时间。
2022-11-20 10:12:05
1747
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人