内存屏障（Memory Barrier）

原创已于 2023-10-20 00:33:59 修改 · 2.3k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#c语言

于 2023-10-20 00:17:44 首次发布

CSAPP 专栏收录该内容

26 篇文章

订阅专栏

基本概念

内存屏障（Memory Barrier），也被称为内存栅栏（Memory Fence）或内存围栏（Memory Fence），是一种硬件或软件的同步机制，用于在并发系统中保持内存操作的顺序性。这是多核和多线程环境中至关重要的，因为现代处理器会对指令进行重排序以提高执行效率。下面我们详细介绍内存屏障：

1. 为什么需要内存屏障？

在现代处理器中，为了最大化性能，执行单元会在可能的情况下乱序执行指令（Out-of-Order Execution）。这意味着即使程序代码以特定的顺序编写，但实际执行的顺序可能会不同。此外，处理器、编译器或其他系统级优化也可能重排指令。

在单线程程序中，这种优化是透明的，程序的行为不受影响。但在并发环境中，这种重排序可能会导致非预期的结果，因为一个线程的操作可能与另一个线程的操作发生冲突。

2. 内存屏障的类型

读屏障（Load Barrier）：确保对屏障之前的所有读操作的结果在继续执行屏障之后的任何指令前都是可见的。
写屏障（Store Barrier）：确保对屏障之前的所有写操作的结果在继续执行屏障之后的任何指令前都是可见的。
全屏障（Full Barrier）：是读屏障和写屏障的组合，确保屏障之前的所有操作在屏障之后的所有操作之前完成。

3. 软件和硬件内存屏障

硬件内存屏障：这些是由处理器提供的特定指令，例如 x86 架构的 MFENCE, LFENCE 和 SFENCE。
软件内存屏障：这些是由编程语言或库提供的，例如 C11 和 C++11 提供的原子操作和顺序点。

4. 使用时机

内存屏障常用于低级同步原语的实现，例如自旋锁、信号量和其他锁机制。大多数高级语言和库为开发者提供了这些同步原语，因此他们不必直接与内存屏障打交道。然而，在特定的并发编程场景，或在开发这些低级原语时，了解并正确使用内存屏障是非常重要的。

5. 注意事项

虽然内存屏障在并发控制中是非常有用的，但过度使用它们会导致性能下降，因为它们限制了处理器执行指令的自由度。因此，开发者需要在性能和正确性之间做出权衡。

总之，内存屏障是保持并发系统中内存操作顺序性的关键工具。在多核和多线程环境中，正确地使用它们可以避免很多潜在的并发问题。

读屏障（Load Barrier）

读屏障（Load Barrier），也常被称为读内存栅栏（Load Memory Fence）或读内存屏障（Load Memory Barrier），是一种确保内存读取操作顺序性的同步机制。它主要用于多核和多线程环境，特别是在那些涉及到共享数据并需要确保数据一致性的场景中。

1. 目的

读屏障确保在屏障之前发出的所有读操作在执行屏障之后的任何指令之前都完成并且结果是可见的。换句话说，处理器或编译器不会将屏障之后的读操作重排到屏障之前。

2. 为什么需要读屏障？

处理器为了性能优化可能会重新排序指令。在单线程环境中，由于这种重排序不会改变程序的单线程语义，所以通常不会引起问题。但在多线程环境中，如果没有适当的同步机制，这种重排序可能会导致一些意想不到的行为和竞争条件。

具体到读屏障，它用于确保在读取某些关键数据（例如，共享数据的版本号或状态标志）后，对这些数据的其他依赖操作不会在读取完成之前开始。

3. 示例

读屏障 (Load Barrier 或 Read Barrier) 主要确保在屏障之前的读操作完成并且读取的结果变得可见，而在屏障之后的读操作没有被重排到屏障之前。

假设我们有两个处理器和以下的共享变量：

int data_ready = 0;
int data = 0;

我们希望在一个处理器上生产数据并设置 data_ready 标志，而在另一个处理器上检查这个标志，并在数据准备好时读取它。不使用读屏障可能会导致不一致的数据读取。

处理器 1:

data = 42;           // 生产数据
// 这里可能是一个写屏障，以确保`data`的写操作发生在`data_ready`之前
data_ready = 1;      // 设置数据已经准备好的标志

处理器 2:

if (data_ready) {
    // 读屏障，确保在检查`data_ready`后并在读取`data`之前，任何读取都没有被重排
    // Read Barrier here
    int value = data;  // 读取数据
    printf("Data: %d\n", value);
}

在这个例子中，读屏障在处理器 2 上确保了在检查 data_ready 标志后并在读取 data 之前，不会有任何重排的读取操作。这是为了确保当 data_ready 标志为 true 时，我们读取到的 data 值是处理器 1 上最新写入的值。

注意，这只是一个简化的示例。在实际多处理器环境中，为了确保完整的同步，我们可能还需要处理器 1 上的写屏障，以及处理器 2 上可能的其他同步机制。

4. 与其他类型的屏障的区别

读屏障专注于读操作的顺序性，而写屏障（Store Barrier）则确保写操作的顺序性。全屏障（Full Barrier）结合了读屏障和写屏障的功能，确保读写操作的顺序性。

5. 使用和注意事项

在编写并发代码时，不恰当地使用内存屏障可能会导致性能下降。因此，除非明确需要，否则不应随意插入屏障。通常，高级同步原语（如互斥体或原子操作）会在需要的地方隐式地使用内存屏障，从而为开发者隐藏了这些复杂性。

总之，读屏障是并发编程中的一个重要工具，特别是在涉及到共享数据的场景中，它确保了读取操作的顺序性，从而避免了由于指令重排导致的数据不一致问题。

写屏障（Store Barrier）

写屏障（Store Barrier），也常被称为写内存栅栏（Store Memory Fence）或写内存屏障（Store Memory Barrier），是一种确保内存写入操作顺序性的同步机制。它被设计用于多处理器和多线程环境中，尤其是在那些涉及共享数据并需要确保数据一致性和正确的写操作顺序的场景中。

1. 目的

写屏障确保在屏障之前发出的所有写入操作在执行屏障之后的任何指令之前都完成并且结果是可见的。这意味着处理器或编译器不会将屏障之后的写操作重排到屏障之前。

2. 为什么需要写屏障？

与读屏障相似，写屏障的主要目的是防止由于处理器和编译器的优化重排而导致的并发问题。在单线程环境中，这种指令的重排序不会对程序的语义产生影响。但在多线程环境中，不当的写入顺序可能会导致数据不一致性或其他难以预测的行为。

3. 示例

写屏障（或 Store Barrier）确保屏障之前的所有存储（写）操作在内存中完成并对其他处理器变得可见，而屏障之后的写操作不会被重新排序到屏障之前。它是为了保证对一系列变量的写入顺序被正确地遵守。

我们来考虑一个简单的场景，其中一个处理器负责初始化并发布数据，另一个处理器在数据被标记为“已发布”后读取它。我们不希望第二个处理器看到已发布标志，但未看到正确初始化的数据。

int data = 0;
int data_ready = 0;

处理器 1 (Producer):

data = 42;          // 将数据初始化为某个值
// 写屏障，确保`data`的写操作发生在`data_ready`之前
// Write Barrier here
data_ready = 1;     // 标记数据已经准备好

处理器 2 (Consumer):

if (data_ready) {
    int value = data;   // 当data_ready为1时，我们希望data已经被正确地初始化
    printf("Data: %d\n", value);
}

在此示例中，写屏障确保处理器 1 中 data 的写操作发生在 data_ready 被设置之前。这样，当处理器 2 检查 data_ready 并发现其已设置时，它可以确信 data 已经被正确初始化。

这里要注意的关键是，即使在单线程代码中，写屏障也确保了写操作的正确顺序。在多处理器或多线程环境中，没有适当的屏障，处理器和编译器可能会重新排序这些操作以优化性能，从而可能导致不一致的结果。

4. 与其他类型的屏障的区别

写屏障主要关注确保写操作的顺序。与之相对，读屏障关注读操作的顺序。全屏障（Full Barrier）结合了读屏障和写屏障的功能，确保了整体的读写操作顺序。

5. 使用和注意事项

过度或不恰当地使用写屏障可能会对性能产生负面影响。因此，除非我们明确知道需要它，否则不应随意插入写屏障。许多高级的同步原语，如互斥锁或特定的原子操作，已经隐式地为我们处理了这些细节。

总之，写屏障是多处理器和多线程编程中的一个关键工具，确保了写入操作的正确顺序，从而防止了由于指令重排可能引发的不一致性和其他问题。

全屏障（Full Barrier）

全屏障（Full Barrier），也被称为全内存栅栏（Full Memory Fence）或双向内存屏障（Bidirectional Memory Barrier），是确保内存操作顺序性的同步机制。它结合了读屏障和写屏障的功能，确保读和写操作的正确顺序。全屏障在多处理器和多线程环境中至关重要，尤其是在涉及共享数据并需要保证数据一致性和内存操作的正确顺序的场景中。

1. 目的

全屏障确保：

在屏障之前的所有内存操作（读取或写入）在执行屏障之后的任何操作之前都已完成并且结果是可见的。
屏障后的所有内存操作不会被重排到屏障之前执行。

这意味着处理器或编译器不能将屏障后的内存操作重排到屏障之前，也不能将屏障前的内存操作重排到屏障之后。

2. 为什么需要全屏障？

在多线程环境中，编译器和处理器为了优化执行性能可能会重新排序指令。这种优化在单线程环境中通常是无害的，但在多线程环境中可能会导致数据不一致性或其他难以预测的行为。全屏障确保了内存操作的正确顺序，从而为开发人员提供了在复杂并发场景中预测和控制程序行为的能力。

3. 示例

全屏障（Full Barrier）确保所有在屏障之前的读取和写入操作在内存中完成，而屏障之后的所有读取和写入操作则被阻止，直到屏障被满足。全屏障通常用于最严格的同步场景，其中任何操作的重新排序都可能导致问题。

下面，我们来考虑一个场景，其中一个线程初始化并发布数据结构，而另一个线程在该结构标记为“已发布”后尝试访问它。我们不希望第二个线程在数据结构标记为已发布之前对其进行任何操作，也不希望第二个线程在数据结构被标记为已发布之后对其进行操作。

以下是使用全屏障的示例：

int data = 0;
int control_flag_1 = 0;
int control_flag_2 = 0;

线程 1 (Producer):

data = 42;                  // 初始化数据
control_flag_1 = 1;         // 设置第一个控制标志

// Full Memory Barrier here

control_flag_2 = 1;         // 设置第二个控制标志

线程 2 (Consumer):

if (control_flag_2) {
    // Full Memory Barrier here

    int value = data;           // 访问数据
    printf("Data: %d\n", value);
    
    // 为了保证当我们读取data时，control_flag_1已经被设置，我们再检查一次
    if (!control_flag_1) {
        printf("Unexpected sequence!\n");
    }
}

在这个示例中，全屏障确保了线程 1 中对 data 和 control_flag_1 的操作发生在 control_flag_2 被设置之前。同时，当线程 2 检查到 control_flag_2 时，全屏障确保了对 data 和 control_flag_1 的读取在读取 control_flag_2 之后发生。

使用全屏障可以防止在这种情况下可能出现的所有操作的重新排序，从而确保数据的一致性和正确性。