cutlass2.x源码解读之PitchLinearStripminedThreadMap

模板类定义:

        PitchLinearStripminedThreadMap模板类的定义,用于将一个 pitch-linear 格式的张量 tile 分配给多个线程进行访问,通过在给定数量的线程中沿连续维度然后沿跨步维度对pitch-linear tile进行Strip-mines(条带挖掘)访问的方式。它实现了“RegularThreadMapping”概念,即每个线程以规则的方式访问内存。
        PitchLinearStripminedThreadMap是一个模板类,具有模板参数Shape_(张量形状)、Threads(线程数)和ElementsPerAccess(每次访问的元素数,默认为1)。


类型定义:


        TensorCoord:使用layout::PitchLinearCoord作为张量坐标。
        Shape:使用模板参数Shape_作为tile的形状,
        kThreads:线程总数,定义为模板参数Threads。
        kElementsPerAccess:每次访问的元素数,定义为模板参数ElementsPerAccess。
        ThreadAccessShape:线程访问的形状,使用layout::PitchLinearShape定义。


内部实现细节:


        ShapeVec:定义tile形状为向量形式,确保线程数能够整除tile的连续和跨步维度。

                

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值