68、高效并行化遗留顺序软件及测试用例优先级排序方法

高效并行化遗留顺序软件及测试用例优先级排序方法

一、遗留顺序软件并行化
  1. 系统环境与前期准备
    • 目标系统配备 512 个 CUDA 核心,频率在 993 - 1072 MHz 之间,拥有 4GB GDDR5 内存,频率为 5000 MHz,总线宽度 128 位。
    • 现有代码基于 C++11 开发,使用 Visual Studio 2015(v140 平台工具集)和 Microsoft 的 VC++ 编译器,编译时使用‘-O2’优化标志。
    • 为实现任务和数据并行,分别使用 C++11 线程库和 OpenMP 在 CPU 上表达并发;因目标系统有支持 CUDA 的 GPU,所以使用 NVIDIA 的 CUDA 在 GPU 上表达并发,此阶段花费 8 小时。
  2. 分析阶段
    • 定位可并行部分 :根据应用程序的控制流和操作间的依赖关系,发现两个可并行的位置。一是模型环境过程中,机器人移动和将图像点云添加到环境点云这两个操作无依赖,可并行;二是拍摄放置区域图片并计算放置位置后,规划到拾取区域的无碰撞路径,这两个操作也可并行。
    • 识别热点函数 :使用 Visual Studio 分析工具对代码进行自动(动态)分析,确定 13 个频繁访问且消耗大量计算资源的函数,经手动分析,确定 4 个可并行函数:模型环境、提取环境、对齐对象和边缘检测。
    • 可行性分析 <
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值