
并行计算
文章平均质量分 95
蔡金平
目前正在北邮读研主要工作方向是软件无线电对通信系统嵌入式以及互联网感兴趣有志同道合的欢迎一起探讨
展开
-
Ubuntu12.04 之 CUDA 编程 (二) ~~~ GPU 程序加速
关于 Ubuntu12.04 下 CUDA5.5 的安装请参看如下链接Ubuntu-12.04 安装 CUDA-5.5关于 Ubuntu12.04 下 CUDA5.5 程序的运行请参看如下链接Ubuntu12.04 之 CUDA 编程 (一) ~~~ GPU 运行程序1、程序的并行化前一篇文章讲到了如何利用 CUDA5.5 在 GPU 中运行一个程序。通过程序的原创 2014-05-07 14:54:04 · 5009 阅读 · 1 评论 -
GPU 编程入门到精通(四)之 GPU 程序优化
博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,我的邮箱: caijinping220@gmail.com 。使用的是自己的老古董笔记本上面的 Geforce 103m 显卡,虽然显卡相对于现在主流的系列已经非常的弱,但是对于学习来说,还是可以用的。本系列博文也遵从由简单到复杂,记录自己学习的过程。原创 2014-10-21 15:48:59 · 9719 阅读 · 2 评论 -
GPU 编程入门到精通(三)之 第一个 GPU 程序
博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,我的邮箱:caijinping220@gmail.com 。使用的是自己的老古董笔记本上面的 Geforce 103m 显卡,虽然显卡相对于现在主流的系列已经非常的弱,但原创 2014-10-20 21:31:43 · 44211 阅读 · 1 评论 -
GPU 编程入门到精通(二)之 运行第一个程序
博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,我的邮箱: caijinping220@gmail.com 。使用的是自己的老古董笔记本上面的 Geforce 103m 显卡,虽然显卡相对于现在主流的系列已经非常的弱,但是对于学习来说,还是可以用的。本系列博文也遵从由简单到复杂,记录自己学习的过程。原创 2014-04-21 22:06:20 · 24192 阅读 · 5 评论 -
GPU 编程入门到精通(五)之 GPU 程序优化进阶
博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,我的邮箱: <caijinping220@gmail.com> 。使用的是自己的老古董笔记本上面的 Geforce 103m 显卡,虽然显卡相对于现在主流的系列已经非常的弱,但是对于学习来说,还是可以用的。本系列博文也遵从由简单到复杂,记录自己学习的过程。原创 2014-10-23 17:22:37 · 10050 阅读 · 1 评论 -
GPU 编程入门到精通(一)之 CUDA 环境安装
博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,我的邮箱: caijinping220@gmail.com 。使用的是自己的老古董笔记本上面的 Geforce 103m 显卡,虽然显卡相对于现在主流的系列已经非常的弱,但是对于学习来说,还是可以用的。本系列博文也遵从由简单到复杂,记录自己学习的过程。原创 2014-04-11 21:14:19 · 45720 阅读 · 0 评论 -
卷积神经网络的并行化模型——One weird trick for parallelizing convolutional neural networks
前段时间一直在关注 CNN 的实现,查看了 caffe 的代码以及 convnet2 的代码。目前对单机多卡的内容比较感兴趣,因此特别关注 convnet2 关于 multi-GPU 的支持。其中 cuda-convnet2 的项目地址发布在:Google Code:cuda-convnet2关于 multi-GPU 的一篇比较重要的论文就是:One weird trick for parallelizing convolutional neural networks本文也将针对这篇文章给出分析。翻译 2015-01-06 11:34:07 · 14839 阅读 · 4 评论 -
FPGA 那些事儿之异构计算
FPGA 那些事儿之异构计算FPGA 那些事儿之异构计算简介FPGA 概览传统 FPGA 开发传统 FPGA 与软件开发对比传统 FPGA 开发方式基于 OpenCL 的 FPGA 开发OpenCL 是个 whatOpenCL 案例分析采用 CPU 模拟仿真 FPGAFPGA 设备上运行矩阵乘小结简介对于一个软件开发人员,可能听说过 FPGA,甚至在大学课程设计中,可能拿FPG原创 2016-09-28 14:26:48 · 15382 阅读 · 22 评论 -
LSTM 优化之路
本文首发于滴滴云公众号:https://mp.weixin.qq.com/s/H0AKuKn1XQDEa06jDm3Nug导读谈到神经网络,相信是当下比较火的一个词。它的发展不是一蹴而就,而是通过各代人的智慧,经过一次一次的优化,迭代才慢慢建立起当下的各种网络结构,从最简单的 MLP,到 CNN,RNN,再到增强网络,对抗网络。每一种网络结构的诞生,都是为了解决某一类特定场景的问题。本文中涉及的 ...原创 2018-07-11 11:01:21 · 26733 阅读 · 6 评论