CUDA 学习(十三)、全局内存

本文介绍了GPU全局内存的特点及其与CPU的交互方式。包括通过PCI-E总线实现的GPU间直接数据传输,以及CPU通过三种不同方式访问GPU内存的方法。同时探讨了在实际应用中常见的执行模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、概述

       GPU的全局内存之所以是全局的,主要是因为GPU与CPU都可以对它进行写操作。任何设备都可以通过PCI-E总线对其进行访问。GPU之间不通过CPU,直接将数据从一块GPU卡上的数据传输到另一个GPU卡上。

        CPU主机端处理器可以通过以下三种方式对GPU上的内存进行访问:

       (1)显式地阻塞传输

       (2)显式地非阻塞传输

       (3)隐式的使用零内存复制。

       GPU 的内存位于PCI-E 总线的另一端。PCI-E 总线是双向总线,理论上,每个方向的带宽最高可达8GB/s,但实际上通常只有4GB/s~5GB/s。

      通常的执行模型是CPU将一个数据块传输到GPU,GPU内核对其进行处理,然后再由CPU将数据块传输回主机端内存中。














评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值