CUDA并行计算学习笔记
文章平均质量分 78
HelloMrDeng
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA学习笔记三---几个简单的并行计算案例
一,CUDA二维矩阵相加代码32乘32二维矩阵相加,用一个block,32*32大小的thread。#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <stdio.h>#include <math.h>#include <stdlib.h>#include <time.h>using namespace std;#define N 32__gl原创 2020-06-13 17:53:38 · 2504 阅读 · 1 评论 -
CUDA学习笔记二---编程模型
一,关于编程模型首先要了解什么是异构架构计算:即GPU和CPU协同工作,CPU端称为主机端用host表示,GPU端称为设备端用device表示。GPU和CPU连接一般协议是PCI-E,最新的协议有NVme,延迟更小。程序执行流程主要分为五个大的部分:在host端分配内存,进行数据初始化。在device端分配内存,将数据从host拷贝到device。用CUDA核函数在device端完成指定的运算。将运算结果从device端拷贝回host端。将host和device上之前分配的内存释放掉。原创 2020-05-12 09:49:57 · 446 阅读 · 0 评论 -
CUDA学习笔记一---GPU基本架构
以Fermi GPU为例:左侧是一个粗略的GPU架构图,可以看到GPU由“显存”和“计算单元”组成,有以下几个部分:DRAM:Dynamic Random Access Memory,即GPU的显存,容量较大,速度慢,CPU和GPU都可以访问。DRAM相当于CPU的RAM,里面存放的数据断电就没有了。SM:streaming multiprocessor,即计算单元,一个GPU有多个SM。CPU可以使多核的,比如四核八核,而GPU的核心就特别多,一个SM里面包含多个核心(core)。原创 2020-05-09 00:42:59 · 1735 阅读 · 0 评论
分享