21、CUDA纹理与流式工作负载全解析

CUDA纹理与流式工作负载全解析

1. 2D纹理:避免复制

早期CUDA引入时,CUDA内核只能通过纹理从CUDA数组读取数据,应用程序只能通过内存复制写入CUDA数组。为了让CUDA内核写入后续通过纹理读取的数据,必须先写入设备内存,再进行设备 - 数组的内存复制。现在,针对2D纹理有两种机制可避免这一步骤:
- 2D纹理可绑定到按间距分配的线性设备内存范围。
- 表面加载/存储内建函数使CUDA内核能直接写入CUDA数组。

不过,不支持从设备内存进行3D纹理操作以及3D表面加载/存储。对于以规则访问模式读取大部分或全部纹理内容的应用(如视频编解码器),或者必须在Tesla级硬件上工作的应用,将数据保留在设备内存中是最佳选择。而对于在纹理操作时进行随机(但局部化)访问的应用,将数据保留在CUDA数组中并使用表面读写内建函数可能更好。

1.1 从设备内存进行2D纹理操作

从2D设备内存进行纹理操作不具备“块线性”寻址的优势,即纹理缓存的缓存行填充只会拉入水平方向的纹理元素,而非2D或3D块。但除非应用对纹理进行随机访问,否则避免从设备内存复制到CUDA数组的好处可能超过失去块线性寻址的损失。

要将2D纹理引用绑定到设备内存范围,可调用 cudaBindTexture2D()

cudaBindTexture2D(
    NULL,
    &tex,
    texDevice,
    &channelDesc,
    inWidth,
    inHeight,
    texPitch )
【顶刊TAC复现】事件触发模型参考自适应控制(ETC+MRAC):针对非线性参数不确定性线性部分时变连续系统研究(Matlab代码实现)内容概要:本文档介绍了“事件触发模型参考自适应控制(ETC+MRAC)”的研究Matlab代码实现,聚焦于存在非线性参数不确定性且具有时变线性部分的连续系统。该研究复现了顶刊IEEE Transactions on Automatic Control(TAC)的相关成果,重点在于通过事件触发机制减少控制器更新频率,提升系统资源利用效率,同时结合模型参考自适应控制策略增强系统对参数不确定性和外部扰动的鲁棒性。文档还展示了大量相关科研方向的技术服务内容,涵盖智能优化算法、机器学习、路径规划、电力系统、信号处理等多个领域,并提供了Matlab仿真辅导服务及相关资源下载链接。; 适合人群:具备自动控制理论基础、非线性系统分析背景以及Matlab编程能力的研究生、博士生及科研人员,尤其适合从事控制理论工程应用研究的专业人士。; 使用场景及目标:① 复现顶刊TAC关于ETC+MRAC的先进控制方法,用于非线性时变系统的稳定性性能优化研究;② 学习事件触发机制在节约通信计算资源方面的优势;③ 掌握模型参考自适应控制的设计思路及其在不确定系统中的应用;④ 借助提供的丰富案例代码资源开展科研项目、论文撰写或算法验证。; 阅读建议:建议读者结合控制理论基础知识,重点理解事件触发条件的设计原理自适应律的构建过程,运行并调试所提供的Matlab代码以加深对算法实现细节的理解,同时可参考文中列举的其他研究方向拓展应用场景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值