🔔 NVIDIA之CUDA 相关技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…)
限定符__shared__
共享内存是CUDA中最重要的性能优化工具之一,它位于每个流多处理器(SM)上,提供比全局内存快100倍以上的访问速度。__shared__限定符用于声明共享内存变量。
核心特性

基本声明方式
静态分配(编译时确定大小)
1、生命周期与线程块绑定:静态分配的共享内存与线程块的生命周期一致,线程块启动时分配,结束时释放。
2、编译时确定大小:需要在核函数编译时确定共享内存的大小(如__shared__ int smem),运行时无法动态调整。
3、线程块内可见:同一线程块内
订阅专栏 解锁全文
2281

被折叠的 条评论
为什么被折叠?



