原子类如何保证操作的原子性?

本文深入探讨了原子操作的概念,解释了为何普通i++操作并非原子性,并详细剖析了原子类如何通过底层CPU指令cmpxchg和lock前缀保证原子性的实现机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、什么是原子性?
所谓原子操作,就是"不可中断的一个或一系列操作" 。

硬件级的原子操作:
在单处理器系统中,能够在单条指令中完成的操作都可以认为是" 原子操作",因为中断只能发生于指令之间。即硬件上已经保证了单CPU上单条指令的原子性。

在对称多处理器结构中就不同了,由于系统中有多个处理器在独立地运行,即使能在单条指令中完成的操作也有可能受到干扰。

二、为什么普通的i++不是原子性操作?
1.i++分为三个阶段:

1、内存到寄存器(高速缓冲区L1,L2,L3)
2、寄存器自增
3、写回内存

这三个阶段中间都可以被中断分离开.

2.i++首先要看编译器是怎么编译的:

    __asm
    {
        movl x, %eax
        addl $1, %eax
        movl %eax, x
    }

这种情况下,必定不是原子操作,因其步骤包括了从内存中取x值放入寄存器,加寄存器,把值写入内存三个指令。不加锁互斥是不行的。

三、为什么原子类能保证原子性?
1、追寻源码:

    public final int getAndSet(int newValue) {
            for (;; ) {
                int current = get();
                if (compareAndSet(current, newValue))
                    return current;
            }
        }

    public final boolean compareAndSet(int expect, int update) {
            return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
        }

    public final native boolean compareAndSwapInt(Object o, long offset, int expected,int x);

查看本地方法compareAndSwapInt底层实现代码,位置在hotspot\src\share\vm\prims\unsafe.cpp:

    UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
      UnsafeWrapper("Unsafe_CompareAndSwapInt");
      oop p = JNIHandles::resolve(obj);
      jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);
      return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
    UNSAFE_END

这个类的实现是跟操作系统有关, 跟CPU架构也有关, 如果是windows下x86的架构实现在hotspot\src\os_cpu\windows_x86\vm\atomic_windows_x86.inline.hpp文件里

    inline jint     Atomic::cmpxchg    (jint     exchange_value, volatile jint*     dest, jint     compare_value) {
      // alternative for InterlockedCompareExchange
      int mp = os::is_MP();
      __asm {
        mov edx, dest
        mov ecx, exchange_value
        mov eax, compare_value
        LOCK_IF_MP(mp)
        cmpxchg dword ptr [edx], ecx
      }
    }

如果是Linux的x86,路径为hotspot\src\os_cpu\linux_x86\vm\atomic_linux_x86.inline.hpp
__asm__表示汇编的开始 volatile表示禁止编译器优化 LOCK_IF_MP是个内联函数:

    #define LOCK_IF_MP(mp) __asm cmp mp, 0  \
                           __asm je L0      \
                           __asm _emit 0xF0 \
                           __asm L0:

LOCK_IF_MP根据当前系统是否为多核处理器决定是否为cmpxchg指令添加lock前缀。
1、如果是多处理器,为cmpxchg指令添加lock前缀。
2、反之,就省略lock前缀。(单处理器会不需要lock前缀提供的内存屏障效果)

intel手册对lock前缀的说明如下:
1、确保后续指令执行的原子性。在Pentium及之前的处理器中,带有lock前缀的指令在执行期间会锁住总线,使得其它处理器暂时无法通过总线访问内存,很显然,这个开销很大。在新的处理器中,Intel使用缓存锁定来保证指令执行的原子性,缓存锁定将大大降低lock前缀指令的执行开销。
2、禁止该指令与前面和后面的读写指令重排序。
3、把写缓冲区的所有数据刷新到内存中。
上面的第2点和第3点所具有的内存屏障效果,保证了CAS同时具有volatile读和volatile写的内存语义。

    cmpxchg:
    	if(accumulator == Destination) {
    		ZF = 1;
    		Destination = Source;
    	}else {
    		ZF = 0;
    		accumulator = Destination;
    	}

目标值和寄存器里的值相等的话,就设置一个跳转标志,并且把原始数据设到目标里面去。如果不等的话,就不设置跳转标志了。
在这里可以看到是用嵌入的汇编实现的, 关键CPU指令是 cmpxchg。
也就是说CAS的原子性实际上是CPU实现的. 其实在这一点上还是有排他锁的. 只是比起用synchronized, 这里的排他时间要短的多. 所以在多线程情况下性能会比较好。

如上面源代码所示,程序会根据当前处理器的类型来决定是否为cmpxchg指令添加lock前缀。如果程序是在多处理器上运行,就为cmpxchg指令加上lock前缀(lock cmpxchg)。反之,如果程序是在单处理器上运行,就省略lock前缀(单处理器自身会维护单处理器内的顺序一致性,不需要lock前缀提供的内存屏障效果

<think>我们讨论原子性原子性是指一个操作或多个操作要么全部执行并且执行过程不会被任何因素打断,要么就都不执行。原子性是并发编程中的重要概念,用于确保数据的一致性和正确性。在编程中,原子操作通常通过硬件指令(如CAS)或锁机制来实现。下面我们将从不同层面(语言、操作系统、硬件)探讨原子性,并给出代码示例。###1.硬件层面的原子性现代处理器提供了一些原子指令,例如:- **CAS(Compare-And-Swap)**:比较并交换,如果当前值等于预期值,则更新为新值。- **XCHG**:交换指令,用于交换两个操作数的值。这些指令在硬件级别保证原子性。###2.操作系统层面的原子性操作系统提供原子操作的原语,如:- **自旋锁 (Spinlock)**:通过忙等待实现的锁,适用于短时间持有锁的情况。 -**信号量 (Semaphore)**:用于控制多个线程对共享资源的访问。###3.编程语言层面的原子性高级语言通常提供原子操作的支持:- **C++**: `std::atomic`型和原子操作函数。 -**Java**: `java.util.concurrent.atomic`包中的原子(如 `AtomicInteger`)。- **Python**:虽然GIL(全局解释器锁)保证了字节码级别的原子性,但复杂操作仍需使用锁或`multiprocessing`模块。###代码示例####C++使用`std::atomic````cpp#include<iostream> #include<atomic> #include<thread> std::atomic<int>counter(0);void increment(intn){for (int i=0;i <n;i++){counter.fetch_add(1,std::memory_order_relaxed);}} intmain(){const intn =100000;std::threadt1(increment, n);std::thread t2(increment,n);t1.join();t2.join();std::cout<< "Counter =" <<counter <<std::endl;return0; }``` **解释**: -`std::atomic<int>`保证了 `counter`的自增操作原子的。 -`fetch_add`是原子操作,即使多个线程同时执行,结果也是正确的(200000)。 ####Java使用 `AtomicInteger` ```javaimport java.util.concurrent.atomic.AtomicInteger;public classAtomicExample{private staticAtomicIntegercounter =new AtomicInteger(0);publicstatic voidmain(String[] args) throwsInterruptedException{Thread t1 =new Thread(() ->{for (int i=0;i <100000;i++){counter.incrementAndGet();}});Threadt2= newThread(()-> {for(inti =0; i<100000; i++) {counter.incrementAndGet();}});t1.start();t2.start();t1.join();t2.join();System.out.println("Counter =" +counter.get());} }``` **解释**: -`AtomicInteger`的`incrementAndGet`方法保证原子性递增。 ####Python使用锁保证原子性在Python中,虽然简单操作(如整数自增)在GIL下可能是原子的,但复杂操作仍需显式同步。```pythonimportthreadingcounter =0lock =threading.Lock()def increment(n):global counterfor _in range(n):withlock:counter+=1n=100000t1 =threading.Thread(target=increment, args=(n,))t2= threading.Thread(target=increment,args=(n,)) t1.start() t2.start() t1.join() t2.join() print(f"Counter ={counter}") ```**解释**:-使用 `threading.Lock`确保 `counter +=1`操作原子性。注意:在Python中,由于GIL的存在,单个字节码操作原子的,但`counter+=1`实际上是多个字节码操作(读取、增加、写回),因此需要锁。###原子性与内存顺序在C++中,`std::atomic`允许指定内存顺序(如`std::memory_order_relaxed`),以控制操作的内存可见性和顺序。不同的内存顺序提供了不同的性能与同步强度权衡。###总结原子性是并发编程的基础,通过硬件指令操作系统原语或高级语言提供的原子型来实现。正确使用原子操作可以避免数据竞争,确保程序正确性。 §§相关问题§§: 1.什么是ABA问题?如何解决? 2.比较并交换(CAS)操作在哪些场景下适用? 3.在无锁编程中,原子操作的作用是什么?4.解释内存顺序(MemoryOrder)在原子操作中的重要性。</think>### 原子性详解 原子性(Atomicity)是并发编程中的核心概念,指一个操作或多个操作要么**全部执行且不被中断**,要么**完全不执行**,不会出现部分执行的状态。原子操作是构建线程安全程序的基础。 #### 原子性的关键特征 1. **不可分割性**:操作一旦开始,就会运行到结束,不会被线程调度打断 2. **全有或全无**:操作要么完全成功,要么完全失败(不会出现中间状态) 3. **状态一致性**:操作前后系统状态保持一致 #### 原子性的实现层次 ##### 1. 硬件级原子性(CPU指令级) 现代CPU提供原子指令: - **LOCK前缀**:锁定内存总线 - **CAS(Compare-and-Swap)**:比较并交换 - **XCHG**:原子交换 - **LL/SC(Load-Link/Store-Conditional)**:MIPS/ARM架构的原子原语 ```cpp // x86汇编实现原子递增 lock inc dword ptr [counter] ; LOCK前缀保证操作原子性 ``` ##### 2. 编程语言级原子性 现代语言提供原子型和操作: ###### C++示例(std::atomic) ```cpp #include <atomic> #include <iostream> #include <thread> std::atomic<int> counter(0); // 原子整型 void increment(int n) { for (int i = 0; i < n; i++) { counter.fetch_add(1, std::memory_order_relaxed); // 原子递增 } } int main() { const int n = 100000; std::thread t1(increment, n); std::thread t2(increment, n); t1.join(); t2.join(); std::cout << "Counter = " << counter << "\n"; // 总是200000 return 0; } ``` **关键点**: - `std::atomic` 保证操作原子性 - `memory_order_relaxed` 指定内存顺序(最宽松的约束) - 无锁实现,直接使用CPU原子指令 ###### Java示例(AtomicInteger) ```java import java.util.concurrent.atomic.AtomicInteger; public class AtomicExample { private static AtomicInteger counter = new AtomicInteger(0); public static void main(String[] args) throws InterruptedException { Thread t1 = new Thread(() -> { for (int i = 0; i < 100000; i++) { counter.incrementAndGet(); // 原子递增 } }); Thread t2 = new Thread(() -> { for (int i = 0; i < 100000; i++) { counter.incrementAndGet(); } }); t1.start(); t2.start(); t1.join(); t2.join(); System.out.println("Counter = " + counter.get()); // 总是200000 } } ``` ##### 3. 操作系统级原子性 操作系统提供原子原语: - **自旋锁(Spinlock)**:忙等待锁 - **信号量(Semaphore)**:计数锁 - **互斥锁(Mutex)**:互斥访问 ```c // Linux内核自旋锁实现原子操作 spinlock_t my_lock = SPIN_LOCK_UNLOCKED; void critical_section() { spin_lock(&my_lock); // 临界区代码(原子执行) spin_unlock(&my_lock); } ``` #### 原子性应用场景 1. **计数器操作**:如访问计数、库存管理 2. **标志位更新**:状态切换(如从运行到停止) 3. **指针交换**:无锁数据结构中的指针更新 4. **ID生成**:生成唯一序列号 #### 非原子操作的风险示例 ```python # Python中的非原子操作(因GIL的存在,简单操作在CPython中是原子的,但复杂操作不是) import threading counter = 0 def increment(): global counter for _ in range(100000): counter += 1 # 非原子操作(读取-修改-写入三步) threads = [] for i in range(5): t = threading.Thread(target=increment) threads.append(t) t.start() for t in threads: t.join() print(counter) # 结果通常小于500000(因竞争条件) ``` #### 保证原子性的方法 1. **使用原子型**:`std::atomic` (C++), `AtomicInteger` (Java) 2. **互斥锁**:`mutex` (C++), `synchronized` (Java) 3. **事务内存**:实验性技术(如C++ TM TS) 4. **无锁编程**:CAS-based数据结构 #### 内存顺序与原子性 原子操作需要配合正确的内存顺序: - **Sequential consistency** (`memory_order_seq_cst`): 最强保证 - **Acquire-release** (`memory_order_acquire`/`release`) - **Relaxed** (`memory_order_relaxed`): 仅保证原子性,不保证顺序 ```cpp // C++内存顺序示例 std::atomic<bool> ready(false); int data = 0; void producer() { data = 42; // 非原子写 ready.store(true, std::memory_order_release); // 释放操作 } void consumer() { while (!ready.load(std::memory_order_acquire)) { // 获取操作 // 忙等待 } std::cout << data << "\n"; // 总是42(保证可见性) } ``` ### 总结 原子性是多线程编程的基石,可通过: 1. 硬件支持的原子指令 2. 语言级原子型 3. 操作系统同步原语 来实现。正确使用原子操作可以避免竞争条件,保证数据一致性,同时提供比锁更高效的并发控制。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值