
GPU
guoyunfei20
object detection, visual object tracking, face recognition, metric learning, pose estimation, activity recognition, semantic segmentation...
展开
-
CUDA入门
CUDA是什么CUDA(Compute Unified Device Architecture),是由NVIDIA公司创立的基于他们公司生产的图形处理器GPUs(Graphics Processing Units,可以通俗的理解为显卡)的一个并行计算平台和编程模型。通过CUDA,GPUs可以很方便地被用来进行通用计算(有点像在CPU中进行的数值计算等等)。在没有CUDA之前,GPUs一般只用来转载 2017-10-10 10:45:27 · 283 阅读 · 0 评论 -
GPU内存分类
全局内存通俗意义上的设备内存。共享内存1. 位置:设备内存。2. 形式:关键字__shared__添加到变量声明中。如__shared__ float cache[10]3. 目的:对于GPU上启动的每个线程块,CUDA C编译器都将创建该共享变量的一个副本。线程块中的每个线程都共享这块内存,但线程却无法看到也不能修改其他线程块的变量副本。这样使得一个线程块中的多个线程能够在计转载 2017-10-10 11:50:20 · 1377 阅读 · 0 评论 -
cuDNN
cuDNN(CUDA Deep Neural Network),官网:https://developer.nvidia.com/cudnn安装相比标准的cuda,它在一些常用的神经网络操作上进行了性能的优化,比如卷积,pooling,归一化,以及激活层等等。在理解上面这段的基础上,我们可以猜测配置cuDNN时是要对cuda进行一些修改,所以我们要先安装cuda。cuDNN下载需要注转载 2017-10-10 13:31:48 · 44363 阅读 · 0 评论 -
CUDA和OpenCL
什么是CUDA?CUDA是一个基于Nvidia GPU的并行计算的架构。CUDA最主要的包含两个方面:一个是ISA指令集架构;第二是硬件计算引擎;实际上是硬件和指令集。 也就是说我们可以把CUDA看做是与X86或者cell类似的架构,但是是基于GPU,而不是传统的CPU。什么是OpenCL?是由苹果公司发起,业界众多著名厂商共同制作的面向异构系统通用目的并行编程的开放式、免费标准,转载 2017-10-10 14:36:20 · 1990 阅读 · 0 评论