1.3 让指令飞

最新推荐文章于 2024-03-20 17:05:11 发布

原创

最新推荐文章于 2024-03-20 17:05:11 发布 · 516 阅读

1 ·

CC 4.0 BY-SA版权

本文探讨了在Superscalar和OOO微架构中，存储器读写指令的执行过程。虽然处理器通常使用乱序执行以提高效率，但最终确保In-Order Commitment以保持程序员预期的顺序。存储器读写指令执行涉及复杂步骤，如Renaming、调度、Speculation机制等。现代处理器使用特定机制处理存储器读写，如LSQ、ROB和RS，以处理乱序执行带来的挑战，同时保证内存一致性。存储器写操作通常在Commit之后才真正向Cache发送数据，这可能导致延迟，而存储器读可能在写操作之前进行，增加了错误推测的风险。文章通过实例展示了Load/Store Speculation可能引发的问题，并提出了解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Superscalar与OOO(Out-of-order)的引入极大促进了现代处理器微架构的发展。已知的高性能处理器，如Nehalem，Sandy Bridge，Opteron，Power甚至是ARM Cortex系列处理器都使用了这种构架。这类方法在有效提高了ILP(instruction level parallelism)的同时，加大了整个Cache Memory层次结构的实现难度。

在此我们只讨论存储器读写指令在Superscalar与OOO环境下的执行过程。存储器读写指令的执行过程似乎非常简单。即使是只写过几行汇编代码的程序员亦可对此娓娓道来。许多人认为存储器读不过是将数据从主存储器中将数据读入寄存器，存储器写是将寄存器中的数据写入到主存储器中。

这个执行过程很难用一句话回答，即便是将使用的处理器模型进行大规模的约束。在一个支持Superscalar和OOO的处理器中，一条指令的执行被分解为若干步骤。指令首先进入Pipeline的Front-End，包括Fetch与Decode，之后经过Dispatch和Scheduler后进入执行单元，最后Commit执行结果。

假设在一个微架构中，所有指令使用In-Order方式通过Front-End，并采用Out-of-Order方式进行Issue，之后使用Out-of-Order Execution和Completion方式，在最后进行Commitment时使用In-order的方式。其中指令Commitment的定义是在其执行完毕，并将最后结果更新至ROB(re-order buffer)和LSQ(Load-Store Queue)的过程。