24、英特尔处理器性能优化与多处理器技术解析

英特尔处理器性能优化与多处理器技术解析

1. 代码优化策略

在 C++ 语言开发环境中,应用程序员若想利用 VTune 提供的详细指令执行性能信息,有以下三种选择:
- 让编译器为奔腾处理器生成优化代码 :这是最简单的方法。我们首先尝试使用 P5 优化开关重新编译程序,再次运行 VTune 后,发现该例程生成的指令序列有一些变化,但程序逻辑并未进行大规模重构,性能提升不明显。与之前相比,每指令周期数(CPI)略有下降,不过成对指令执行的百分比实际上有所下降。但 CPI 仍是更重要的性能指标。
- 用内联汇编语言例程替换编译器生成的代码 :我们进行了相关实验,尽管增加一个工作寄存器使代码变长且更复杂,但性能提升显著。对于 RISC 机器来说,这种反直觉的结果并不罕见,因为它通常能更快地执行较长的代码序列。
- 重新编写原始 C 语言例程 :我们认为在这种情况下,此方法可解决辅助函数的调用次数问题。我们将在后续开发周期中处理冗长的代码重构项目,并继续依靠 Rational Visual Quantify 和 Intel VTune 来衡量这些改进的影响。

2. 英特尔 P6 微架构

英特尔的 P6 系列(奔腾 Pro、奔腾 II、奔腾 III 和奔腾 IV)硬件比 P5 更复杂。P6 采用了复杂的微架构,从全新方向解决 x86 指令执行问题,尝试在指令执行期间自动进行指令编码优化,减少了手动(或编译器代码生成期间自动)进行奔腾式指令排序的需求。这表明 VTune 对指令进行微调的应用范围和效果未达英特尔预期。

英特尔

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值