
OpenCL
文章平均质量分 72
哇小明
这个作者很懒,什么都没留下…
展开
-
C++实战之OpenCL 并行优化编程从零学起系列文章
接下去一大段时间,会把所有的精力放在opencl 并行优化编程的学习中,在此过程中记录学习的要点,开发环境是:macbook pro + xcode + c++迷迷糊糊毕业两年多了,做过系统工程师,做过android应用开发,最终我选择C++开发,但是目前职场上C++开发的职位大都是后台服务器开发,我曾经一度想选择服务器这个方向,但是我我的内心深处告诉我,你曾经学的那些机器学习算法呢?原创 2017-09-19 04:29:07 · 2910 阅读 · 0 评论 -
C++ 实战之OpenCL环境搭建(一)
前言:接触opencl并行计算变成之前,在我的认知观中,所谓的并行应该就是应用多线程技术达到,比如openMP,openMPI等多线程技术。不过这些都是在cpu上运行,原理都是更好的利用多核处理器的硬件特性,让程序最大程度的利用了多核的优势。 接触opencl之后,认识到了opencl编程技术可以把一些复杂的代码搬运到GPU或其他加速处理器上运行,而gpu又比cpu更适应与计算比如加法,乘法等。第原创 2017-10-05 01:04:21 · 11381 阅读 · 1 评论 -
C++实战之OpenCL矩阵相乘优化(二)
前言上一篇文章,分析了简单的矩阵相乘在opencl里面的优化kernel代码,每个work-item只负责计算结果矩阵的一个元素。下一步准备每次计算出结果矩阵的块元素,看看计算时间是如何。这个矩阵系列参考国外一个大神的教程: https://cnugteren.github.io/tutorial/pages/page4.html 有每个kernel的详解工程,还有github代码工程。具体分析原创 2017-11-21 14:51:00 · 10147 阅读 · 4 评论 -
C++实战之OpenCL矩阵相乘
简单概念理解在opencl中,有个索引空间NDRange的概念,NDRange是一个N维的索引空间,N可以是1,2,3。NDRange由一个长度为N的整数阵列来定义,他指定了索引空间各个维度的宽度,每个work-item的全局id和局部id,都是N维元组。有多个work-item构成的叫做work-group,作業組的 ID 跟作業項的全局 ID差不多。一個長度為 N 的陣列定義了每個維度上作業組的原创 2017-11-06 15:54:40 · 5948 阅读 · 4 评论