如何查询GPU卡每个block支持的最大thread(线程)数
1.打开CUDA维基百科
https://en.wikipedia.org/wiki/CUDA

2.根据卡的GPU卡的型号,在网页中部找到对应的计算能力。
如Quadro K4000,计算能力是3.0,框架是Kepler


3.已知计算能力,在网页下部找到计算能力3.0对应的Maximum number of threads per block,可知K4000对应的是1024。
在利用GPU对Monte Carlo仿真进行加速时,需要设定thread per block、histories per thread两个参数。
根据经验,thread per block值越大,计算速度越快。

了解如何通过CUDA维基百科查询GPU的最大线程数,以提升Monte Carlo仿真的效率。以Quadro K4000为例,其计算能力为3.0,最大线程数为1024。设置合理的threadperblock和historiesperthread参数可以加快计算速度。
3155

被折叠的 条评论
为什么被折叠?



