
OpenCL
文章平均质量分 54
天律界中子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OpenCL clCreateBuffer占用太多时间
最近在做一个图像处理的算法,跑在高通平台上,需要使用OpenCL加速。代码分为三个部分: 1. 初始化 2. 处理图像 3. 释放资源为了尽可能地减少算法的运行时间,我将一切可以预处理的内容都放到了初始化中,其中就包括了创建buffer。在初始化中,我调用clCreateBuffer()创建了9个buffer,共计约占用600MB内存。然后在处理图像中重复使用这些buffer,最后在释放...原创 2018-06-07 23:43:00 · 2545 阅读 · 0 评论 -
OpenCL优化小技巧:预创建所有Kernel
最近做了一些图像处理的算法,跑在高通的开发板上,其中使用了OpenCL进行加速。在此过程中,也总结了几个加速的小技巧。今天就来谈其中一个不太有用的小技巧:预创建所有Kernel。第一次进行OpenCL加速时,我注意到,创建cl_kernel时,会耗费几毫秒到二十几毫秒的时间。如果算法中需要创建几十个cl_kernel,那花费的时间也有几百毫秒了。这让人很难接受。后来我又注意到,对于同一个K...原创 2018-06-08 00:13:57 · 3075 阅读 · 2 评论