<2022-05-06 周五>
如何写ScaleImage()的硬件加速函数(十一)
“如何写ScaleImage()的硬件加速函数(十)”这里的代码写得比较随意,其中stopi = 0;赋值为0后,下面的循环根本没有执行,这才使得显示的图片变正确了;且async_work_group_copy()的参数传得可能也不对,等等等。
- 我原来的想法是在外部计算好需要的行数传入
kernel函数,并按照此行数申请好一定长度的一维数组,在async_work_group_copy()时拷贝相应行数的像素。 - 然后在
async_work_group_copy()拷贝好的local内存里按照ScaleImage()的算法实现Y方向的缩放。 - 有一个顾虑需不需要考虑?因为
local内存是对应一个work-group的,它的各work-item共享这片local内存,那每个work-item是不是都会按照ScaleImage()的算法处理一次Y方向的缩放? - 目前看好像不要考虑这个问题,即不影响结果也不影响效率。
- 同时也在考虑,可不可以在进入
kernel函数之前就缩放好Y方向呢?
优化ScaleImage的硬件加速函数:工作原理与改进策略
本文讨论了如何改进ScaleImage的硬件加速函数,包括解决代码随意性问题、优化内存使用以及考虑工作-item间的同步。作者分享了commit中的新修订版本,探讨了Y方向缩放的处理方式和内存共享问题。

457

被折叠的 条评论
为什么被折叠?



