【第15期】临界区(Critical Section)与原子操作

为什么有时候看似正确的 C 语言代码,在加上中断后,运行结果会偶尔出错?

在上一期中,我们讨论了中断优先级的“抢占”。今天我们要讨论一种更隐蔽、更危险的情况:当主程序和中断(或两个中断)同时修改同一个变量时,会发生什么?

这不是逻辑错误,而是时序错误。这种错误可能让你的设备运行一个月都很正常,然后在某个特定的时刻突然死机或数据错乱。


1. 看似原子,实则三步:RMW 陷阱

很多初学者认为,C 语言里的一行代码就是一步操作,是不可分割的(原子的)。 比如:count++;

但在 CPU 的眼中,这行简单的代码会被翻译成三条汇编指令:

  1. Read (读):把 count 变量的值从内存读到 CPU 寄存器。

  2. Modify (改):在寄存器中把这个值加 1。

  3. Write (写):把寄存器里的新值写回内存中的 count 地址。

这就是著名的 读-改-写 (Read-Modify-Write, RMW) 流程。

事故现场推演: 假设全局变量 count 当前是 100。

  1. 主程序想执行 count++。它刚执行完 Read,把 100 读到了寄存器里,还没来得及加。

  2. 就在这一瞬间,一个中断来了!

  3. 中断服务程序里也有一句 count++。因为中断打断了主程序,它完整地执行了读(100)、改(101)、写(101)的全过程。此时内存里的 count 变成了 101。

  4. 中断结束,回到主程序。

  5. 主程序继续执行。注意!主程序之前读到的值是 100,它并不知道内存已经被改过了。它继续执行 Modify (100+1=101) 和 Write (写入 101)。

结果:主程序加了一次,中断加了一次,理论上 count 应该是 102。但实际上,内存里是 101。一次累加就这样凭空消失了


2. 什么是“临界区”?

为了防止上面的情况发生,我们需要引入一个概念:临界区 (Critical Section)

临界区是指访问共享资源(如全局变量、硬件外设寄存器)的那段代码。 在上面的例子中,count++ 就是临界区。

核心规则: 临界区内的代码,必须一次性执行完,中间绝对不能被其他修改同一资源的任务打断。这就好比上厕所,进去之后必须锁门,不论外面谁在敲门,都得等你出来。


3. 方法一:简单粗暴的“关中断”

这是最传统、最通用的保护方法。既然怕中断打扰,那我在操作变量前,先把所有中断都关掉,操作完再打开。

// 进入临界区
__disable_irq();  // 关总中断 (PRIMASK 寄存器)

count++;          // 安全地进行读改写

// 退出临界区
__enable_irq();   // 开总中断

优点

  • 逻辑简单,绝对安全。

  • 适用于任何架构的单片机。

缺点与风险

  • 实时性受损:你关中断的这段时间,外面的世界发生了什么 CPU 完全不知道。如果关的时间太长(比如你在临界区里算了个浮点除法,或者更糟糕,加了个延时),可能会导致串口丢数据、定时器计时不准。

  • “开”过头了:如果你在一个子函数里关了中断,还没退出时又调用了另一个子函数,那个子函数里也有一对开关中断。结果内层子函数一退出,把中断打开了,外层函数还没执行完——保护失效。

工程中建议:关中断的时间要极短。只包住那几行赋值代码,千万别包住复杂的逻辑运算。

4. 方法二:硬件级的优雅——原子操作 (LDREX/STREX)

为了解决“关中断”太暴力的问题,ARM Cortex-M3/M4/M7 等内核提供了一套特殊的硬件指令:LDREX (Load Exclusive) 和 STREX (Store Exclusive)。

这是一套“带监控的读写”机制。

工作流程

  1. LDREX:CPU 读取变量 count,并且在硬件上给这个内存地址打一个“独占标记”。

  2. 修改:CPU 在寄存器里计算新值。

  3. STREX:CPU 尝试把新值写回内存。

    • 关键点:在写入前,硬件会检查:“从我刚才读走到现在写入,有没有其他东西(中断或DMA)改过这个地址的数据?”

    • 如果没被改过:写入成功,返回 0。

    • 如果被改过(标记丢失):写入失败,不修改内存,返回 1。

void Safe_Add(volatile int *ptr, int value) {
    int expected_value;
    do {
        // 1. 独占读取,并打上标记
        expected_value = __LDREXW(ptr); 
        
        // 2. 修改 (在寄存器中计算)
        int new_value = expected_value + value; 
        
        // 3. 尝试独占写入
        // 如果失败(返回非0),说明中间被插队了,循环重试
    } while (__STREXW(new_value, ptr) != 0);
}

优点

  • 不用关中断!即使中断来了,中断能正常响应。主程序只是发现“写入失败”,重做一次就行了。

  • 对系统的实时性影响最小。

局限

  • 稍微复杂一点(需要硬件支持)。

  • 适用于简单的逻辑运算(加减、赋值)。


5. 一个常见的误区:volatile

很多面试或工作中会问:“给变量加上 volatile 关键字,是不是就能解决数据竞争问题?”

答案是:绝对不能。

volatile 的作用是告诉编译器:“这个变量随时会变,不要去优化它,每次都要老老实实从内存读”。 它解决了“编译器优化”导致的问题,但它无法解决中断打断 RMW 时序的问题。 count++ 即使加了 volatile,依然是 读-改-写 三步,依然会被中断劈开。

所以:volatile 是必须的,但不是万能的。原子操作或关中断才是解决竞争的根本。


归纳本章

  1. RMW 竞争:任何涉及“读出旧值 -> 修改 -> 写入新值”的操作,如果会被中断打断,都可能导致数据丢失。

  2. 临界区:一段需要独占访问的代码。

  3. 关中断:最简单的保护手段,但要快进快出,避免影响系统实时性。

  4. 原子指令 (LDREX/STREX):利用硬件机制实现的无锁保护,不用关中断,适合高性能场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值