栅栏同步:
__syncthreads():只能够同步一个block的线程,同时要注意可能造成死锁。并且cuda没有提供全局同步的机制,因此很多东西,你得自己来处理;如果要执行全局同步的话,你可以重新执行kernal。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22785983/viewspace-662154/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22785983/viewspace-662154/
本文介绍了CUDA中的栅栏同步机制,特别关注了__syncthreads()函数的作用与限制,包括其仅能同步单个block内的线程及可能导致的死锁问题。此外,还讨论了全局同步的缺失以及实现方法。
3555

被折叠的 条评论
为什么被折叠?



