mfence, lfence, sfence什么作用?

本文深入解析内存屏障的概念,包括mfence, lfence, sfence的作用及其在多处理器环境下的必要性。探讨了它们如何防止指令重排序,确保数据一致性,以及在Java中如何通过synchronized关键字和volatile变量体现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

mfence, lfence, sfence什么作用?

// src/backend/utils/rac/lock_free_queu.array_spsc_queue.c
#define mb() 	asm volatile("mfence":::"memory")
#define rmb()	asm volatile("lfence":::"memory")
#define wmb()	asm volatile("sfence" ::: "memory")

就是保证内存访问的串行化,内部操作就是在一系列内存访问中添加若干延迟,保证此指令之后的内存访问发生在此指令之前的内存访问完成之后(不出现重叠)。
lfence 读串行化
sfence 写串行化
mfence 读写都串行化

参考

内存屏障

为什么需要内存屏障?

由于现代的操作系统都是多处理器.而每一个处理器都有自己的缓存,并且这些缓存并不是实时都与内存发生信息交换.这样就可能出现一个cpu上的缓存数据与另一个cpu上的缓存数据不一致的问题.而这样在多线程开发中,就有可能导致出现一些异常行为. 而操作系统底层为了这些问题,提供了一些内存屏障用以解决这样的问题

内存屏障的作用
  1. 阻止屏障两边的指令重排序

2. 强制把写缓冲区/高速缓存中的脏数据等写回主内存,让缓存中相应的数据失效(意思就是确保读到的数据都是内存中的最新的数据,确保数据的有效性)

内存屏障的分类

硬件层提供了一系列的内存屏障 memory barrier / memory fence(Intel的提法)来提供一致性的能力。拿X86平台来说,有几种主要的内存屏障

1. lfence,是一种Load Barrier 读屏障。在读指令前插入读屏障,可以让高速缓存中的数据失效,重新从主内存加载数据

2. sfence, 是一种Store Barrier 写屏障。在写指令之后插入写屏障,能让写入缓存的最新数据写回到主内存

3. mfence, 是一种全能型的屏障,具备ifence和sfence的能力

4. Lock前缀,Lock不是一种内存屏障,但是它能完成类似内存屏障的功能。Lock会对CPU总线和高速缓存加锁,可以理解为CPU指令级的一种锁。它后面可以跟ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, and XCHG等指令。

Lock前缀实现了类似的能力.

1. 它先对总线/缓存加锁,然后执行后面的指令,最后释放锁后会把高速缓存中的脏数据全部刷新回主内存。

2. 在Lock锁住总线的时候,其他CPU的读写请求都会被阻塞,直到锁释放。Lock后的写操作会让其他CPU相关的cache line失效,从而从新从内存加载最新的数据。这个是通过缓存一致性协议做的。

内存屏障使用例子

LoadLoad屏障(读读屏障):对于这样的语句Load1; LoadLoad; Load2,在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。
StoreStore屏障(写写屏障):对于这样的语句Store1; StoreStore; Store2,在Store2及后续写入操作执行前,保证Store1的写入操作对其它处理器可见。
LoadStore屏障(读写屏障):对于这样的语句Load1; LoadStore; Store2,在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。
StoreLoad屏障(写读屏障):对于这样的语句Store1; StoreLoad; Load2,在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的。在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能。

java中内存屏障的常见例子

通过 Synchronized关键字包住的代码区域,当线程进入到该区域读取变量信息时,保证读到的是最新的值.这是因为在同步区内对变量的写入操作,在离开同步区时就将当前线程内的数据刷新到内存中,而对数据的读取也不能从缓存读取,只能从内存中读取,保证了数据的读有效性.这就是插入了StoreStore屏障
使用了volatile修饰变量,则对变量的写操作,会插入StoreLoad屏障.
其余的操作,则需要通过Unsafe这个类来执行.

<think>嗯,用户问的是内存屏障,这应该和计算机体系结构或者并发编程有关。首先,我得回忆一下内存屏障的基本概念。内存屏障,也叫内存栅栏,是一种同步机制,用来保证内存操作的顺序性。对吧? 那用户可能是在学习多线程编程的时候遇到了问题,比如指令重排导致的数据不一致。这时候需要内存屏障来防止编译器和处理器进行某些优化,确保操作顺序正确。比如在Java中的volatile变量,或者C++中的原子操作,背后可能都用到了内存屏障。 接下来,用户可能需要了解内存屏障作用原理。比如,处理器为了优化性能,可能会乱序执行指令,或者缓存不一致导致不同线程看到不同的数据顺序。内存屏障可以强制在屏障之前的所有操作完成后,才能执行屏障之后的操作。 还要考虑内存屏障的类型。不同的架构可能有不同的屏障类型,比如读屏障、写屏障、全屏障。比如,读屏障确保所有之前的读操作完成,写屏障确保所有之前的写操作完成,全屏障则是读写都保证。 用户可能还想知道实际应用中的例子。比如,在实现锁或者信号量时,内存屏障用来确保临界区的操作不会被重排到锁外,从而避免数据竞争。或者在内核开发中,设备驱动需要确保内存访问的顺序正确,防止硬件读取到错误的数据。 另外,需要解释内存屏障和缓存一致性的关系。缓存一致性协议(如MESI)保证了多核之间的缓存同步,但内存屏障更多是关于指令顺序,两者虽然相关但解决的问题不同。 可能还要提到不同的编程语言中的内存屏障实现,比如C++11中的std::atomic_thread_fence,或者Java中的Unsafe类中的相关方法。不过用户可能更关心概念层面的理解,而不是具体语言的实现。 最后,要确保回答结构清晰,分点说明内存屏障作用、类型、应用场景,以及和缓存一致性的区别。避免使用过于专业的术语,用通俗的中文解释,帮助用户逐步理解。</think>内存屏障(Memory Barrier)是计算机系统中用于控制内存操作顺序的底层同步机制。它在并发编程、操作系统内核和硬件交互中发挥重要作用,主要解决由编译器优化和处理器乱序执行引发的内存可见性问题。 ### 一、核心作用 1. **禁止指令重排** - 编译器优化可能调整指令顺序 - CPU乱序执行会改变实际执行顺序 - 内存屏障强制屏障前后的操作保持相对顺序 2. **保证内存可见性** - 确保一个CPU核心的写入对其他核心可见 - 强制刷新CPU缓存(如L1/L2缓存)到主内存 3. **实现顺序一致性** - 不同线程观察到的内存操作顺序符合程序逻辑 ### 二、主要类型(以x86架构为例) | 屏障类型 | 作用范围 | 典型指令 | |-------------------|---------------------------|----------------| | **写屏障** | 保证屏障前所有写操作完成 | `sfence` | | **读屏障** | 保证屏障前所有读操作完成 | `lfence` | | **全屏障** | 读写操作均需完成 | `mfence` | ### 三、典型应用场景 1. **锁机制实现** - 加锁时插入读屏障:`lock.lock()` ```c // 伪代码示例 while (test_and_set(&lock)) ; __asm__ volatile ("lfence" ::: "memory"); // 读屏障 ``` - 解锁时插入写屏障:`lock.unlock()` ```c __asm__ volatile ("sfence" ::: "memory"); // 写屏障 clear(&lock); ``` 2. **无锁数据结构** 在多生产者/消费者队列中保证指针更新的原子性: ```c // 写入数据 buffer[head] = data; __asm__ volatile ("sfence" ::: "memory"); // 确保数据写入完成 head = new_head; // 读取数据 __asm__ volatile ("lfence" ::: "memory"); // 确保读取最新值 data = buffer[tail]; ``` 3. **设备驱动开发** 当与硬件设备交互时,确保IO操作的严格顺序: ```c write_to_device(REG_CMD, command); __asm__ volatile ("mfence" ::: "memory"); // 全屏障 check_device_status(); ``` ### 四、与缓存一致性的关系 - **缓存一致性协议**(如MESI)解决多核数据同步问题 - **内存屏障**解决操作顺序问题 - 两者协同工作但解决不同维度的问题 ### 五、不同编程语言的实现 | 语言 | 实现方式 | 示例 | |----------|-----------------------------|-------------------------------| | **C/C++**| 编译器内置指令 | `__sync_synchronize()` | | **Java** | `volatile`变量 | `volatile int flag;` | | **Rust** | `std::sync::atomic` | `fence(Ordering::SeqCst)` | ### 六、性能注意事项 1. 过度使用会导致性能下降 2. 需要根据具体架构选择最小必要屏障类型 3. 现代CPU(如x86)具有较强内存模型,实际需要的显式屏障比弱内存模型架构(如ARM)更少 通过合理使用内存屏障,开发者可以在保证正确性的同时,最大限度地发挥现代处理器的并行计算能力。理解这一机制对开发高性能并发系统、操作系统内核和硬件驱动至关重要。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值