Multicore Programming OpenMP: Part 2

本文探讨了CPU未能达到峰值性能的原因,并通过矩阵乘法的实例介绍了多种代码优化技巧,包括存储器层次设计的影响、流水线设计的缺陷、存储操作的实际成本等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载请注明出处:http://blog.youkuaiyun.com/c602273091/article/details/54851077

上一节说到的是OpenMP的写法,这一次主要是介绍代码优化。

CPU无法达到peak performance的原因

这里写图片描述
本来CPU的性能应该如上图所示的,但是实际使用的时候并没有达到这个效果。

主要是因为:

  • 存储器的层次设计。发生cache、TLB miss的时候,就需要等待很多个周期;

  • 流水线、ILP等等并行设计有缺陷,使得吞吐量无法达到预期;

  • 有的操作比如存储操作看似不需要浪费周期,其实数据传输等等会浪费不少周期。

矩阵乘法的讨论

介绍

这里写图片描述
原始的矩阵乘法就如上图的实现。

但是使用加速之后效果怎么样呢?ATLAS做加速的效果远远超过了三个循环的矩阵计算。
这里写图片描述

理论基础

在这里需要介绍一些存储器方面的知识。

这里写图片描述
矩阵存储分为行优先和列优先的。行列优先的不同使得每次存入cache的一行是列方向或者是行方向。

现在解构一下取数据的关系:
这里写图片描述

对存储数组A、B、C计算读取次数。
这里写图片描述

块状矩阵计算

使用块状计算矩阵,如下图。那么之前计算矩阵就改成了四个循环。
这里写图片描述

想对这块更了解,可以看我之前写的18-600里cache的介绍。
想直观看这个算法,可以看:
这里写图片描述

优化技巧

代价模型

计算代价的部分如下图:(左边是具体每部分、右边是具体例子)
这里写图片描述

计算一开始的代价:19n
这里写图片描述

去掉结构体,去掉了索引这个步骤:6n
这里写图片描述

改变循环体内部可以移出的操作:5n
这里写图片描述

使用循环展开:3.5n
这里写图片描述

strength reduction

减少需要浪费很多资源的操作,比如去掉除法、log等等或者替换成别的操作。
这里写图片描述

内联函数(inline f)

这里写图片描述
减少函数调用,把简单函数改成内联函数。

循环展开(loop unrolling)

这里写图片描述
这里主要是涉及CPU在取内存中数据到寄存器的时候,循环展开可以减少CPU周期。

去掉下标计算(sub-expression eliminate)

这里写图片描述
有时候计算循环中的下表很浪费CPU周期,一部分放到循环外就可以加快速度。

查表(look up table)

这里写图片描述
提前计算好要用到的一些数据,尤其减少循环多次计算的浪费。这个做法和暴力破解很像。

合并循环

这里写图片描述
减少循环次数,可以减少不少计数器的操作。

减少条件判断

减少循环中的条件判断,如果你提前知道哪个是需要跳过的。
这里写图片描述

资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在当今的软件开发领域,自动化构建与发布是提升开发效率和项目质量的关键环节。Jenkins Pipeline作为一种强大的自动化工具,能够有效助力Java项目的快速构建、测试及部署。本文将详细介绍如何利用Jenkins Pipeline实现Java项目的自动化构建与发布。 Jenkins Pipeline简介 Jenkins Pipeline是运行在Jenkins上的一套工作流框架,它将原本分散在单个或多个节点上独立运行的任务串联起来,实现复杂流程的编排与可视化。它是Jenkins 2.X的核心特性之一,推动了Jenkins从持续集成(CI)向持续交付(CD)及DevOps的转变。 创建Pipeline项目 要使用Jenkins Pipeline自动化构建发布Java项目,首先需要创建Pipeline项目。具体步骤如下: 登录Jenkins,点击“新建项”,选择“Pipeline”。 输入项目名称和描述,点击“确定”。 在Pipeline脚本中定义项目字典、发版脚本和预发布脚本。 编写Pipeline脚本 Pipeline脚本是Jenkins Pipeline的核心,用于定义自动化构建和发布的流程。以下是一个简单的Pipeline脚本示例: 在上述脚本中,定义了四个阶段:Checkout、Build、Push package和Deploy/Rollback。每个阶段都可以根据实际需求进行配置和调整。 通过Jenkins Pipeline自动化构建发布Java项目,可以显著提升开发效率和项目质量。借助Pipeline,我们能够轻松实现自动化构建、测试和部署,从而提高项目的整体质量和可靠性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值