【2023 · CANN训练营第一季】TIK C++矢量算子动态shape输入的实现

文章讨论了如何将传统固定shape的算子转换为支持动态shape的实现,以避免因不同输入shape导致的多次编译。通过将控制形状的参数如BLOCK_DIM,TOTAL_LENGTH,TILE_NUM等作为外部输入,在核函数中引入tiling变量来调整逻辑处理,实现了动态shape的灵活性,适应更多场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

TIK C++矢量算子动态shape输入的实现

当算子shape固定时,开发者使用不同shape时需要重新对算子进行编译,带来大量的算子二进制文件。而动态shape的算子可以将形状通过核函数的入参传入核函数内,参与内部逻辑计算,从而符合不同shape下的使用场景。两者对比如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FfR19UK8-1685276563668)(../../../../AppData/Roaming/Typora/typora-user-images/image-20230528201151927.png)]

  1. 固定shape的输入

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3OuZzeA6-1685276563669)(../../../../AppData/Roaming/Typora/typora-user-images/image-20230528201309672.png)]

  1. 动态shape的输入

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XirpIKvt-1685276563670)(../../../../AppData/Roaming/Typora/typora-user-images/image-20230528201432240.png)]

基于现有的固定shape算子,将其改装为动态shape的算子。将控制形状的BLOCK_DIMTOTAL_LENGTHTILE_NUM这些变量
依靠外界输入得到,在核函数中额外传入一个tiling,它将指向控制核函数逻辑处理的至关重要的这几个变量。

  1. 固定shape和动态shape代码文件的对比

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L1zy3Ee9-1685276563671)(../../../../AppData/Roaming/Typora/typora-user-images/image-20230528201812282.png)]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值