如何查询GPU卡每个block支持的最大thread(线程)数
1.打开CUDA*
https://en.wikipedia.org/wiki/CUDA
2.根据卡的GPU卡的型号,在网页中部找到对应的计算能力。
如Quadro K4000,计算能力是3.0,框架是Kepler
3.已知计算能力,在网页下部找到计算能力3.0对应的Maximum number of threads per block,可知K4000对应的是1024。
在利用GPU对Monte Carlo仿真进行加速时,需要设定thread per block、histories per thread两个参数。
根据经验,thread per block值越大,计算速度越快。