oneAPI GPU 优化指南 - OpenMP 部署调优指南 - 术语

本文介绍了OpenMP和SYCL在描述GPU并行循环迭代分区时的互换性,详细解释了work-group、sub-group和work-item的概念,以及它们在SYCL和CUDA中的对应关系。

本章节翻译by chenchensmail@163.com  原文:Terminology (intel.com)

在本章中, OpenMP 和 SYCL 术语可以互换使用, 以描述部署并行循环的迭代分区。

如 “ SYCL 线程层次结构和映射” 一章所述, 部署到 GPU 上的并行循环(执行范围) 的迭代被划分为 work-group、sub-group 和 work-item。ND-range 表示总执行范围,它被划分为大小相等的 work-group。 一个工 work-group 是一个 1、2 或 3 维的 work-item 集合。 每个 work-group 可以划分为 sub-group。 sub-group 表示一小段连续的 work-item, 它们被一起作为 SIMD 向量处理。

下表显示了 SYCL 概念如何映射到 OpenMP 和 CUDA 概念。

SYCL

OpenMP

CUDA

Work-item

OpenMP thread or SIMD lane

CUDA thread

Work-group

Team

Thread block

Work-group size

Team size

Thread block size

Number of work-groups

Number of teams

Number of thread blocks

Sub-group

SIMD chunk (simdlen = 8, 16, 32)

Warp (size = 32)

Maximum number of work-items per work-group

Thread limit

Maximum number of of CUDA threads per thread block

上一章                                    主目录​​    上级目录                                                               下一章

提供了基于BP(Back Propagation)神经网络结合PID(比例-积分-微分)控制策略的Simulink仿真模型。该模型旨在实现对杨艺所著论文《基于S函数的BP神经网络PID控制器及Simulink仿真》中的理论进行实践验证。在Matlab 2016b环境下开发,经过测试,确保能够正常运行,适合学习和研究神经网络在控制系统中的应用。 特点 集成BP神经网络:模型中集成了BP神经网络用于提升PID控制器的性能,使之能更好地适应复杂控制环境。 PID控制优化:利用神经网络的自学习能力,对传统的PID控制算法进行了智能整,提高控制精度和稳定性。 S函数应用:展示了如何在Simulink中通过S函数嵌入MATLAB代码,实现BP神经网络的定制化逻辑。 兼容性说明:虽然开发于Matlab 2016b,但理论上兼容后续版本,可能会需要整少量配置以适配不同版本的Matlab。 使用指南 环境要求:确保你的电脑上安装有Matlab 2016b或更高版本。 模型加载: 下载本仓库到本地。 在Matlab中打开.slx文件。 运行仿真: 整模型参数前,请先熟悉各模块功能和输入输出设置。 运行整个模型,观察控制效果。 参数整: 用户可以自由节神经网络的层数、节点数以及PID控制器的参数,探索不同的控制性能。 学习和修改: 通过阅读模型中的注释和查阅相关文献,加深对BP神经网络与PID控制结合的理解。 如需修改S函数内的MATLAB代码,建议有一定的MATLAB编程基础。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值