模板类定义:
PitchLinearStripminedThreadMap模板类的定义,用于将一个 pitch-linear 格式的张量 tile 分配给多个线程进行访问,通过在给定数量的线程中沿连续维度然后沿跨步维度对pitch-linear tile进行Strip-mines(条带挖掘)访问的方式。它实现了“RegularThreadMapping”概念,即每个线程以规则的方式访问内存。
PitchLinearStripminedThreadMap是一个模板类,具有模板参数Shape_(张量形状)、Threads(线程数)和ElementsPerAccess(每次访问的元素数,默认为1)。
类型定义:
TensorCoord:使用layout::PitchLinearCoord作为张量坐标。
Shape:使用模板参数Shape_作为tile的形状,
kThreads:线程总数,定义为模板参数Threads。
kElementsPerAccess:每次访问的元素数,定义为模板参数ElementsPerAccess。
ThreadAccessShape:线程访问的形状,使用layout::PitchLinearShape定义。
内部实现细节:
ShapeVec:定义tile形状为向量形式,确保线程数能够整除tile的连续和跨步维度。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



