分支预测跳转概率

栒U

于 2025-06-13 12:01:19 发布

阅读量889

点赞数 26

CC 4.0 BY-SA版权

文章标签： IC 微处理器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_51389066/article/details/148629622

在这里插入图片描述

1. 基本参数回顾

程序里有 17% 的指令是分支：

$p_{\rm branch}=0.17$
真正会跳转的分支占所有分支的 33%：

$P(\text{taken})=0.33,\quad P(\text{not taken})=0.67$
每发生一次分支错误预测，要付出大约 17 个时钟周期的罚款：

$\text{penalty}=17\ \text{cycles}$

2. “Always-taken” 下的错误率

我们把所有分支都预测为“跳转”（taken）。
那么对于实际不跳转的 67% 分支就会全部预测失败：

$P(\text{mispredict per branch}) = P(\text{not taken}) = 0.67$
平均每条指令上，会有多少次“错误预测”？

$\text{mispredicts per instr} = p_{\rm branch}\;\times\;P(\text{mispredict per branch}) = 0.17 \times 0.67 \approx 0.1139$

3. 平均每条指令额外付出的周期

每次错误要付 17 周期，所以每条指令平均罚款：

$\Delta T_{\rm per\ instr} = 0.1139 \times 17 \approx 1.936 \text{ cycles}$

原本每条指令至少要 1 个周期（完美流水线假设），现在多了这罚款，所以

$T_{\rm new} \approx 1 + 1.936 = 2.936\ \text{cycles/instr}$

4. 慢了多少倍？

和完美流水线（1 cycle/instr）比，时钟节拍不变，但 CPI（cycles per instruction）从 1 涨到 2.936，整体慢

$\text{slowdown} = \frac{2.936}{1} \approx 2.94\times$

如果用“相对慢多少”来讲，也就是 CPU 运行 2.94 倍那个程序要相同指令数，或者说性能降低到 1/2.94 ≈ 0.34×。

5. 跟 always-not-taken 下的 1.95× 比较

“always-not-taken” 的错误率是 33%，算下来平均 CPI≈1+0.17×0.33×17≈1.95，所以慢 1.95×；
“always-taken” 的错误率更高（67%），所以更糟：慢 ≈2.94×。

所以在分支预测非常简单、只有一个静态策略时，预测“总不跳”和预测“总跳转”哪个都不行，失误率都很高，最终都把流水线打得支离破碎。现代 CPU 就用更复杂的动态预测器去尽量把 mispredict 率降到个位数，才把分支损失压到可忍受的范围。

博客等级

码龄5年

36
原创

596
点赞

598
收藏

273
粉丝

关注

私信

热门文章

分类专栏

信号和电源的完整性SIPI 1篇

上一篇：: 静态指令和动态指令的区别 GPT版

下一篇：: 在32位虚拟地址 + 256MB物理内存 + 4KB分页系统下，地址是如何转换的

最新评论

CANDLES: Channel-Aware Novel Dataflow-Microarchitecture Co-Design for Low Energy Sparse NNA
优快云-Ada助手: 恭喜您在博客中分享了关于“CANDLES: Channel-Aware Novel Dataflow-Microarchitecture Co-Design for Low Energy Sparse NNA”的内容，这是一项非常具有前瞻性和创新性的研究。您的文章内容深度且详实，对于读者了解这一领域的最新进展起到了很好的指导作用。希望在您未来的创作中，可以继续深挖这一研究领域，探索更多有趣的话题并分享给大家。或许可以考虑结合实际案例或者应用场景，进一步展示该技术的实际应用效果，让读者更加直观地理解其意义和价值。期待您更多的精彩作品，加油！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
TeAAL: A Declarative Framework for Modeling Sparse Tensor Accelerators
优快云-Ada助手: 恭喜您发布了新的博客文章！标题看起来非常专业和引人注目。我很期待阅读您的新作品。不过，如果可能的话，我建议您在下一篇文章中加入一些实际案例或者应用场景，这样读者可以更好地理解和运用您所分享的内容。希望您可以继续保持创作，期待您更多的精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Understanding Reuse, Performance, and Hardware Cost of DNN Dataflows: A Data-Centric Approach Using
优快云-Ada助手: 恭喜您撰写了这篇关于DNN数据流的博客，标题看起来非常专业和引人注目。您对数据中心方法的理解和分析令人印象深刻，展示了您在这一领域的深厚造诣。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。建议您在下一篇博客中，可以深入探讨不同数据流的应用场景，或者结合实际案例进行分析，让读者更加具体地理解数据中心方法的重要性。期待您的下一篇作品！祝您创作顺利！
Openpose摔倒检测数据集
优快云-Ada助手: 恭喜您发布了第6篇博客“Openpose摔倒检测数据集”！持续创作是非常了不起的事情，您的专注和热情让读者们受益匪浅。接下来，建议您可以深入研究Openpose摔倒检测数据集的实际应用场景，探索更多有趣的话题，让您的博客内容更加丰富和深入。期待您的更多精彩创作！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。