
OpenCL
文章平均质量分 59
清风水岸
当技术已成习惯,转眼已多年。接触语言良多,最终才发现原来最基础的才是最根本,才转而回头。目前主要关注Linux系统下编程,Shell,Qt,Python,OpenCL。
展开
-
AMD OpenCL例子阅读笔记系列之AtomicCounters
学了OpenCL有一段时间了,对于其思想已经有了一些了解。但是对于y原创 2014-04-21 21:35:49 · 5012 阅读 · 6 评论 -
使用CodeBlocks编写OpenCL程序
在我很久之前的博文中提到过CodeBlock在Ubuntu中的下载和设置:http://blog.youkuaiyun.com/hanxing0/article/details/23552751一直感觉VS中的设置略显麻烦,后来在CodeBlock中使用因为一个小错误,以为不支持OpenCL提示,也就没继续,偶然的机会发现是我误会了这个编程环境。我使用的平台是联想Lenovo Y485P,A10原创 2014-12-25 13:40:01 · 4144 阅读 · 2 评论 -
AMD编程手册小译
小译之5.5.3 Memory Allocation5.5.3.1 使用CPU翻译 2014-06-20 15:42:44 · 4920 阅读 · 3 评论 -
OpenCL小知识笔记本
This is just a small notebook.原创 2014-06-16 21:28:19 · 2447 阅读 · 0 评论 -
小感慨
神迹啊,竟然发现还有原创 2014-05-22 21:00:12 · 2095 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(六)
终于到最后出结果的时刻了,有点小激动呢哼。通过5的分析,实际上再看最后一个内核函数就会很轻松了。最后一个内核函数是permute函数,以64*256个元素为组进行处理。每个work-item处理256个数据。在单倍情况下就只有64*256个数据处理,这时候全局和局部都是64,一维情况。 看了下,似乎没有什么难以理解的地方,主要用到了局部内存和内核同步等知识。直接上内核函数。原创 2014-05-20 10:43:03 · 2618 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(一)
又是好久没来了,这次我们来看看Radix_Sort也就是基数排序。为了更好地理解,这里先贴一个网上的基数排序的博文: http://www.cnblogs.com/Braveliu/archive/2013/01/21/2870201.html 再贴上百度上的一些介绍性的内容: (radix sort)则是属于“分配式排序”(distribution s原创 2014-05-13 15:24:42 · 3156 阅读 · 1 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(四)
在三中我们又得到了两个中间结果sumBufferin以及scanedHistogramBinsBuf两个结果。那么接下来如何呢?我们继续循着程序执行路径往下看,因为numGroups=64,所以runFixOffsetKernel中间的if部分判断的内容将不会执行。也就是我们说的单倍形式下只需要3个内核。 那么下一个内核通过查看我们发现是scanArrayKerneldim1,弄原创 2014-05-19 16:19:21 · 2578 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(五)
首先我们先整理下我们目前通过上面几讲的内容得到的结果:1. sumBufferin:组加和结果2. summaryBUfferout:组加和结果进行偏移量整理的结果3. scanedHistogramBinBuf:以组为单位进行偏移量计算结果 那么这些结果与最后我们需要的偏移量有什么关系,我们先来看下最后一个内核函数:FixOffset原创 2014-05-19 16:55:44 · 2408 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(三)
在完成了二中的histogramBinsBuf的统计后,需要对其进行进一步的处理以得到基数排序的最终偏移信息。这个过程是本例子中最复杂的一部分。其中根据分组的情况包含3个内核调用或者5个内核调用。 这里需要说明下,内核本身执行时需要对数据进行预处理才能放到GPU上运算。这个例子的使用上面,采用的规则是: 数据的个数必须是64*256=16384的倍数。原创 2014-05-19 16:01:23 · 3207 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之Radix_Sort(二)
因为Radix Sort本身比较大,这里分块对系统做阐述。在上一个博文中,已经向大家介绍了该例子的主机部分。这里向大家重点讲述下内核的并行思想。至于内存对象及调用顺序等需要大家结合AMD的例子来看,都弄到博文会很长。今天来讲一下例子中的比较简单的内核函数应用histogram内核应用。Histogram内核用于分组统计随机生成的数据。统计的规则为:1. 将所有数据分成以256原创 2014-05-19 14:34:44 · 2921 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之BinarySearch
首先为了更好地理解,先把附带的文档大概翻一下。这个例子的主要思想是将大数据to原创 2014-04-21 22:02:58 · 3068 阅读 · 0 评论 -
AMD OpenCL例子阅读笔记系列之DeviceFission
1. 什么是DeviceFission? D原创 2014-04-23 16:24:06 · 3417 阅读 · 0 评论 -
OpenCL中设置内核参数整理
很久没来了,一直在忙毕设的东西。这篇博文整理下OpenCL内核参数设置的问题。资源摘自OpenCL实战首先,说一下kernel中的几种地址空间限定符:(1)__global该参数的数据会保存在全局数据空间,在内核中的参数使用例子如下:__kernel void kernel_func(__global float *f){}(2)__constant该参数的原创 2014-12-25 13:26:42 · 9253 阅读 · 2 评论