- 博客(12)
- 收藏
- 关注
原创 计算机组成与设计学习——GPU篇(五):并行存储子系统
除GPU本身外,内存子系统是决定图形系统性能的最重要因素。图形处理工作负载要求极高的内存读写传输速率。像素写入和混合(读取-修改-写入)操作、深度缓冲区的读写以及纹理贴图读取,再加上命令与对象顶点及属性数据的读取,构成了内存访问流量的大部分。
2024-02-16 12:49:08
1176
1
原创 计算机组成与设计学习——GPU篇(四):多线程多处理器架构_续
本节继续介绍多线程处理器的相关内容,聚焦多线程多处理器的指令集架构的设计与实例,最后比较SIMT与其他多处理器的不同,并作最后的总结。
2024-02-15 16:14:07
1258
1
原创 计算机组成与设计学习——GPU篇(四):多线程多处理器架构
为满足不同市场细分的需求,GPU 实现了可扩展数量的多处理器结构——实际上,GPU 本身就是由多个多处理器组成的多处理器。此外,每个多处理器都高度支持多线程,能够高效地执行大量细粒度的顶点着色器线程和像素着色器线程。一款基础质量优良的 GPU 拥有两到四个多处理器,而专为游戏发烧友或计算平台设计的 GPU 则拥有几十个这样的多处理器。本节将关注其中一个多线程多处理器架构,即 NVIDIA Tesla 流式多处理器(SM)的一个简化版本。
2024-02-13 19:37:41
2139
1
原创 计算机组成与设计学习——GPU篇(三):GPU编程_续
CUDA、Brook 和 CAL 是专为 GPU 设计的编程接口,它们关注的是数据并行计算而非图形处理。CAL(Compute Abstraction Layer)是 AMD GPU 的低级汇编语言接口。Brook 是一种由 Buck 等人[2004]针对 GPU 改进的流式编程语言。CUDA 由 NVIDIA 公司[2007]开发,是对 C 和 C++ 语言的扩展,旨在实现多核 GPU 和多核 CPU 的可扩展并行编程。本节内容根据 Nickolls 等人[2008]的文章,描述了 CUDA 编程模型。
2024-02-08 21:09:56
1416
原创 计算机组成与设计学习——GPU篇(二):GPU系统架构
在本节中,我们将概述当前普遍使用的GPU系统架构。我们将讨论系统配置、GPU功能和服务、标准编程接口以及基本的GPU内部架构。
2024-01-21 23:30:22
2063
原创 git submodule update --init --recursive或使用脚本更新git仓库时出错
git submodule update --init --recursive或使用脚本更新git仓库时出错最近用git clone的时候出现了fatal: unable to access ‘https://github.com/boostorg/accumulators.git/’: Failed to connect to github.com port 443: Connection refused这种问题,搜了一下发现最有用的就是把git clone的时候的https换成git。参考来源
2021-10-20 14:46:30
5631
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人