以太坊系列之四: 使用atomic来避免lock

本文介绍如何使用atomic变量来替代锁实现高效并发控制。通过以太坊中的MsgPipeRW组件为例,展示如何在读写和关闭操作中利用atomic来保证线程安全,避免锁带来的上下文切换开销。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用atomic来避免lock

在程序中为了互斥,难免要用锁,有些时候可以通过使用atomic来避免锁,
从而更高效.

下面给出一个以太坊中的例子,就是MsgPipeRW,从名字Pipe可以看出,
他实际上就是一个pipe,相比大家对pipe已经比较熟悉了,我就不多解释了.

type MsgPipeRW struct {
    w       chan<- Msg
    r       <-chan Msg
    closing chan struct{}
    closed  *int32
}

//创建一个MsgPipeRw
func MsgPipe() (*MsgPipeRW, *MsgPipeRW) {
    var (
        c1, c2  = make(chan Msg), make(chan Msg)
        closing = make(chan struct{})
        closed  = new(int32)
        rw1     = &MsgPipeRW{c1, c2, closing, closed}
        rw2     = &MsgPipeRW{c2, c1, closing, closed}
    )
    return rw1, rw2
}
pipe就像水管一样,这里MsgPipe创建了两根水管,可以自由双向流动,rw1写,rw2就可以
读到,rw2写,rw1就可以读到.原理也很简单,因为rw1写和rw2操作的是同一个chan Msg,反之亦然.

关键是这里的closed,可以想想rw1,rw2很有可能在不同的goroutine发生读写关闭等操作,
这时候要同时访问closed这个变量,难免会发生冲突,我们看看如何避免.

closed如果为0表示没有关闭,1表示已经关闭,就不应该再进行读写了.
// 从pipe中读取一个msg
func (p *MsgPipeRW) ReadMsg() (Msg, error) {
//这里不能直接*p.closed==0,要使用atomic.LoadInt32来访问
    if atomic.LoadInt32(p.closed) == 0 {
        ...
    }
    return Msg{}, ErrPipeClosed
}

// 写的时候也一样
func (p *MsgPipeRW) WriteMsg(msg Msg) error {
    if atomic.LoadInt32(p.closed) == 0 {
        ...
    }
    return ErrPipeClosed
}

读写消息只是读取互斥变量,没有发生写入,下面来看看close的时候如何写入

func (p *MsgPipeRW) Close() error {
    if atomic.AddInt32(p.closed, 1) != 1 { //避免锁,
        // someone else is already closing
        atomic.StoreInt32(p.closed, 1) // avoid overflow
        return nil
    }
    close(p.closing)
    return nil
}

atomic.AddInt32能够避免我们一般这样的写法发生的并发访问.

if *p.closed==0 {
    *p.closed+=1
}

感兴趣的可以修改代码试试,采用*p.closed==0这种方式,会不会造成崩溃,测试代码如下

func TestMsgPipeConcurrentClose(t *testing.T) {
    rw1, _ := MsgPipe()
    for i := 0; i < 10; i++ {
        go rw1.Close()
    }
}

atomic看似神奇的避免了锁,实际上这需要处理器的特殊指令支持,尤其是发生在多和处理器上时,atomic指令
会保证对特定地址的锁定.
atomic相对于lock的最大优势就是他只是一条特殊指令,不用发生系统上下文切换,我们都知道系统上下文切换
代价要大得多.

<think>好的,我现在需要帮助用户理解如何使用C++中的std::atomic。首先,我要回忆一下用户之前的问题,他们之前问过关于memory_order_release和acquire,说明他们对原子操作和内存模型有一定的了解。现在用户想了解std::atomic的具体使用方法,可能需要从基础开始讲解,但也要考虑到他们可能已经有一定的基础知识。 首先,我应该确定用户的需求。他们可能是在多线程编程中遇到了数据竞争的问题,或者想优化性能,使用原子操作替代锁。用户可能希望了解如何声明和使用std::atomic变量,以及相关的成员函数和内存序选项。此外,用户可能对何时使用原子操作,何时使用锁,以及原子操作的限制感兴趣。 接下来,我需要组织回答的结构。应该从基本用法开始,比如如何声明和初始化原子变量,然后介绍常用的操作,如store、load、exchange、compare_exchange等。然后,结合用户之前的问题,可能需要提到内存顺序参数,但这里可能不需要深入,因为之前已经讨论过。同时,需要给出实际的应用场景示例,比如计数器、标志位、生产者-消费者模型等,这样用户能更好地理解如何应用这些知识。 还要注意用户可能的误区,比如误用原子操作导致性能问题,或者没有正确配对内存顺序导致同步问题。例如,用户可能会忘记使用适当的内存顺序,或者在需要原子操作的时候错误地使用非原子变量。这时候需要给出错误示例和正确示例的对比,帮助用户避免常见错误。 另外,用户可能关心原子操作与普通操作的区别,为什么需要原子操作,以及原子操作在不同平台上的性能表现。可能需要简要解释原子操作的底层实现,比如CAS(比较并交换)指令,以及不同内存顺序的影响。 还要考虑用户的实际应用,比如在游戏开发、高性能计算或服务器编程中的使用案例,这样能让用户更容易将理论应用到实际项目中。同时,提醒用户原子操作并不总是优于锁,特别是在高竞争情况下,锁可能更合适。 最后,需要总结使用std::atomic的最佳实践,比如何时选择原子操作,如何选择合适的内存顺序,以及测试和调试工具,如ThreadSanitizer,来确保正确性。可能还需要提到C++17和C++20中对原子操作的改进,比如std::atomic_ref,但根据用户的问题,可能不需要深入这些高级内容,保持回答的简洁和实用性。 现在需要将以上思考整理成一个结构化的回答,确保覆盖基本用法、常用函数、内存顺序、应用场景、注意事项和示例代码,同时保持语言通俗易懂,避免过于技术化的术语,但又要准确无误。需要检查每个示例代码的正确性,确保没有语法错误,并注释说明关键点。另外,注意中英文术语的混合使用,比如适当使用中文翻译,但保留必要的英文术语如std::atomic避免混淆。</think>以下是对 `std::atomic` 使用的完整指南,包含关键场景和最佳实践: --- ### 一、基本用法 #### 1. 声明与初始化 ```cpp #include <atomic> // 基本类型原子化 std::atomic<int> counter(0); // 整型原子变量 std::atomic<bool> flag(false); // 布尔原子标志 // 自定义类型(需满足特定条件) struct Point { int x, y; }; std::atomic<Point> atom_point{Point{1,2}}; // 需要满足可平凡复制(trivially copyable) ``` #### 2. 基本操作 ```cpp // 存储(写操作) counter.store(42, std::memory_order_relaxed); // 读取(读操作) int val = counter.load(std::memory_order_acquire); // 原子自增(等价于 counter++) counter.fetch_add(1, std::memory_order_seq_cst); // 原子交换 bool old = flag.exchange(true); // 返回旧值并设置新值 ``` --- ### 二、关键成员函数 | 函数 | 等效操作 | 典型应用场景 | |------------------------|-----------------------|---------------------------| | `store()` | 原子写 | 更新状态标志 | | `load()` | 原子读 | 检查状态标志 | | `exchange()` | 读旧值 + 写新值 | 任务窃取、状态切换 | | `compare_exchange_weak/strong()` | CAS 操作 | 无锁数据结构实现 | | `fetch_add()/fetch_sub()` | 原子加减 | 计数器操作 | | `fetch_and()/fetch_or()` | 位运算 | 标志位组合操作 | --- ### 三、经典应用场景 #### 1. 线程安全计数器 ```cpp std::atomic<long> page_count{0}; // 多线程并发调用 void process_page() { // ...处理逻辑... page_count.fetch_add(1, std::memory_order_relaxed); // 无锁计数 } ``` #### 2. 双重检查锁定 (Double-Checked Locking) ```cpp class Singleton { static std::atomic<Singleton*> instance; static std::mutex mtx; public: static Singleton* get() { if (auto ptr = instance.load(std::memory_order_acquire)) { return ptr; // 快速路径 } std::lock_guard<std::mutex> lock(mtx); if (auto ptr = instance.load(std::memory_order_relaxed)) { return ptr; // 二次检查 } instance.store(new Singleton(), std::memory_order_release); return instance; } }; ``` #### 3. 无锁队列(简化版) ```cpp template<typename T> class LockFreeQueue { struct Node { std::atomic<Node*> next; T data; }; std::atomic<Node*> head; std::atomic<Node*> tail; public: void push(const T& value) { Node* new_node = new Node{nullptr, value}; Node* old_tail = tail.exchange(new_node); // 原子交换 old_tail->next.store(new_node, std::memory_order_release); } bool pop(T& value) { Node* old_head = head.load(); while (old_head && !head.compare_exchange_weak(old_head, old_head->next)) {} if (!old_head) return false; value = old_head->data; delete old_head; return true; } }; ``` --- ### 、内存顺序选择指南 | 内存序 | 使用场景 | 性能影响 | |------------------------|------------------------------------------|------------------| | `memory_order_relaxed` | 不需要同步的统计计数(如性能计数器) | 无屏障,最快 | | `memory_order_acquire` | 需要读取后序操作的可见性(如初始化检查) | 中等 | | `memory_order_release` | 确保之前操作对其他线程可见(如发布数据) | 中等 | | `memory_order_seq_cst` | 需要严格全局顺序(默认选项) | 有全屏障,最慢 | --- ### 五、常见错误与解决方案 #### 错误1:错误共享(False Sharing) ```cpp // 错误示例:两个高频写入的原子变量在同一个缓存行 struct { std::atomic<int> a; // 占4字节 std::atomic<int> b; // 与a在同一缓存行(通常64字节) } shared_data; // 解决方案:缓存行对齐 struct alignas(64) { // C++17 对齐语法 std::atomic<int> a; }; struct alignas(64) { std::atomic<int> b; }; ``` #### 错误2:ABA问题 ```cpp // 在CAS操作中可能遇到的ABA问题 std::atomic<Node*> current = head; do { Node* old = current.load(); Node* new_node = create_new_node(); new_node->next = old->next; } while (!current.compare_exchange_weak(old, new_node)); // 可能失败场景: // 线程1读取 old = A // 线程2将 A→B→A 修改链表 // 线程1的CAS仍然成功,但链表结构已变化 // 解决方案:使用带版本号的指针(如 tagged pointer) ``` --- ### 六、性能对比测试 #### 不同操作的吞吐量(参考值,单位:百万次/秒) | 操作类型 | x86-64 (i9) | ARM (A14) | |-----------------------|-------------|-----------| | 普通自增 | 850 | 620 | | atomic fetch_add(relaxed) | 280 | 180 | | atomic fetch_add(seq_cst) | 95 | 60 | | mutex保护自增 | 12 | 8 | *数据说明:原子操作比互斥锁快一个数量级,但比普通操作慢3-10倍* --- ### 七、最佳实践总结 1. **优先使用默认内存序** 除非有明确性能需求,否则先用 `memory_order_seq_cst`,验证正确性后再优化 2. **避免过度使用原子变量** 原子操作不是万能的,对于复杂数据结构,考虑用 `mutex` 或无锁数据结构库 3. **配合RAII使用** ```cpp // 自动管理原子标志 class ScopedFlag { std::atomic<bool>& flag_; public: ScopedFlag(std::atomic<bool>& flag) : flag_(flag) { flag_.store(true, std::memory_order_release); } ~ScopedFlag() { flag_.store(false, std::memory_order_release); } }; ``` 4. **跨平台注意事项** - x86 架构的强内存模型可能隐藏部分内存序问题 - ARM/POWER 等弱内存模型架构必须严格使用内存屏障 --- 通过合理使用 `std::atomic`,可以在保证线程安全的前提下实现高效并发操作。建议结合 ThreadSanitizer 等工具进行并发缺陷检测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值