CUDA学习笔记之Tesla图形与计算架构和通用计算模型

本文详细介绍了CUDA的Tesla图形与计算架构,包括流处理器阵列SPA、存储器系统、SPA的组成和工作原理。重点阐述了SM(Streaming Multiprocessor)的结构,如线程处理器群TPC、线程处理器SP,以及CUDA编程模型中的Grid、Block和Thread的关系。还讨论了Tesla通用计算模型中的CTA和shared memory,以及计算调度和内存流水线的工作方式,强调了带宽在计算性能中的关键作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Tesla图形与计算架构:流处理器阵列(scalable streaming processor arraySPA+存储器系统,由片上互联网络连接;

存储器系统:存储器控制器(MMC)、固定功能的光栅操作单元(raster operation processorsROP),二级纹理缓存;

            MMC:负责控制片外的DRAM显存,每个存储器可以提供64bit位宽;

            ROP:对存储器内的数据进行颜色和深度操作;

            SPA可以将计算得到的深度与颜色信息发送给ROP,也可以直接读写DRAM或者通过纹理缓存以制度方式访问DRAM

SPA:若干个TPC(Thread Processing Cluster,线程处理器群)构成;

2~3SMStreaming Multiprocessor)组成一个TPC

G20010TPC,每个TPC中有3SM

SM:大致相当于一个具有8SIMD的处理器,指令宽度不是是32(即warp size;

每个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值