
CUDA编程
BigCowPeking
追求卓越,永不放弃
展开
-
矩阵乘法的并行计算
矩阵乘法的并行计算转载 2017-07-02 20:09:47 · 3993 阅读 · 0 评论 -
CUDA编程:Hello world
第三章 CUDA C简介 输出hello world #include<stdio.h>__global__ void kernel() { printf("hello world");}int main() { kernel<<<1, 1>>>(); return 0;} 这个程序和普通的C程序的区别值得...转载 2018-07-30 21:39:55 · 1826 阅读 · 0 评论 -
CUDA编程:caffe中GPU编程
核函数核函数的特点cuda代码文件的后缀为”.cu”,由单独的编译器进行编译 核函数是cu文件中的一部分代码,是运行在显存中的程序代码,是实现并行计算的载体 核函数一般放在cu文件中的前面,函数定义之前需要添加__global__关键字,函数体中包含CUDA_KERNEL_LOOP循环体 CUDA_KERNEL_LOOP循环体有两个参数,第一个是迭代器,第二个是总迭代数 CUDA_...转载 2018-07-30 21:52:54 · 2741 阅读 · 1 评论 -
CUDA编程:SSD的priorbox层
SSD中的pribox层的实现:__global__ void PriKernel(float *top_data,const int layer_height,const int layer_width,const int img_height, const int img_width,const float step_w,const float step_h, const int off...原创 2018-08-05 10:55:59 · 580 阅读 · 0 评论 -
GPU: 多GPU训练的同步模式和异步模式
TensorFlow可以用单个GPU,加速深度学习模型的训练过程,但要利用更多的GPU或者机器,需要了解如何并行化地训练深度学习模型。常用的并行化深度学习模型训练方式有两种:同步模式和异步模式。下面将介绍这两种模式的工作方式及其优劣。如下图,深度学习模型的训练是一个迭代的过程。在每一轮迭代中,前向传播算法会根据当前参数的取值,计算出在一小部分训练数据上的预测值,然后反向传播算法...转载 2018-10-05 21:11:13 · 6499 阅读 · 0 评论