- 博客(8)
- 收藏
- 关注
原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 7 -原子操作
CUDA的原子操作可以理解为对一个Global Memory或Shared Memory中变量进行“读取-修改-写入”这三个操作为一个最小单位的执行过程。它在执行过程中不允许其他并行线程对该变量进行读取和写入操作。CUDA中的原子操作本质上是让线程在某个内存单元完成读-修改-写的过程中不被其他线程打扰。基于这个机制,原子操作实现了对在多个进程间共享的变量的互斥保护,确保任何一次对变量的操作的结果的确定性。
2023-02-11 16:44:38
612
原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 6 - 利用共享存储单元优化应用
共享存储单元更进一步、Bank Conflict、利用共享存储单元优化矩阵相乘
2023-02-11 16:27:39
531
原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 5 - 多种CUDA存储单元详解
寄存器、shared memory、local memory、constant memory、texture memory、unified memory、global memory、基于ARM平台的Jetson Nano存储单元调用
2023-02-11 15:59:22
895
原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 4 - 矩阵乘法
GPU存储单元概述、GPU存储单元的分配与释放、数据传输、GPU实现矩阵乘法、错误检测与事件
2023-02-11 15:23:04
318
原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 3- 初识CUDA
在异构计算系统上进行的并行计算通常称为异构计算(Heterogeneous Computing)。它能够经济有效地实现高计算能力,可扩展性强,能够非常高效地利用计算资源。典型的例子就是Apple Inc.的异构芯片M1。CUDA是一种实现异构计算的编程模型,开发过程中基本是围绕Host和Device展开的。在编程变量命令中常用‘h’和‘d’来区分内存(主存)和显存。
2023-02-11 14:47:13
453
原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 2 - L4T Ubuntu使用介绍
简单介绍L4T Ubuntu上的基本操作,为后续进行CUDA编程做准备。
2023-02-11 14:04:03
920
原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 1 - GPU硬件架构
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的通用并行计算平台和程序模型,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA架构编写程序,所编写出的程序可以在支持CUDA的处理器上以超高性能运行。CUDA官方文档CUDA的软件环境允许开发者使用C++等高级编程语言开发程序。
2023-02-11 13:43:08
735
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅