RCU（Read-Copy Update）

最新推荐文章于 2025-09-06 22:38:56 发布

原创

最新推荐文章于 2025-09-06 22:38:56 发布 · 1k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#linux kernel #互斥技术

在Linux内核中，虽然已经有多种互斥机制（如mutex、spinlock、原子操作、rwlock等），但这些机制在某些场景下可能会成为性能瓶颈。RCU（Read-Copy-Update） 是一种特殊的同步机制，主要用于解决读多写少的场景下的性能问题。RCU对于读多写少场景，性能比rwsem、rwlock等都要高。它的设计目标是最大限度地减少读操作的开销，同时保证数据的一致性。

为什么需要RCU？

传统互斥机制的问题

锁的开销：传统的锁机制（如mutex、spinlock）在读写冲突时会导致性能下降，尤其是在读多写少的场景中。
- 读操作需要加锁，即使没有写操作，也会引入额外的开销。
- 写操作需要阻塞所有读操作，导致读操作的延迟增加。
- 即使是读写锁，读者也是有开销的。
扩展性问题：在高并发场景下，锁的争用会显著降低系统的可扩展性。

RCU的优势

无锁读操作：RCU允许读操作不加锁，因此读操作的开销非常低。
写操作延迟更新：写操作通过复制和延迟更新的方式，避免阻塞读操作。
高并发性：RCU特别适合读多写少的场景，能够显著提高系统的并发性能。

RCU的原理

RCU（Read-Copy-Update），读-复制-更新，它是根据原理命名的。写者修改对象的过程是：首先复制生成一个副本，然后更新这个副本，最后使用新的对象替换旧的对象。在写者执行复制更新的时候读者可以读数据。

它的核心思想是通过延迟回收和无锁读来实现高效的并发访问。其基本原理如下：

读操作

读操作不需要加锁，直接访问共享数据。
读操作可以并发执行，不会被写操作阻塞。

写操作

写操作首先创建一个数据的副本，并在副本上进行修改。
修改完成后，通过原子操作将指针指向新的副本，替换旧数据。
旧的数据不会立即删除，而是等待所有正在使用旧数据的读操作完成后，再回收旧数据。
如果有多个写者，多个写者直接需要使用互斥机制。

延迟回收

RCU通过宽限期（Grace Period）来确保所有读操作完成后再回收旧数据。
写者等待所有读者访问结束的时间称为宽限期（Grace Period）
宽限期的管理由RCU机制自动完成，开发者无需关心。

RCU的关键技术是怎么判断所有读者已经完成访问，机制比较复杂（使用per-cpu等），此处不进行展开。

RCU的约束

RCU对使用者的一些约束：

对共享资源的访问在大部分时间应该是只读的，写访问应该相对很少。
在RCU保护的代码范围内，内核不能进入睡眠状态。
受保护资源必须通过指针访问。

RCU的API

Linux内核提供了丰富的RCU API，以下是一些常用的函数：

读操作

rcu_read_lock()：标记读操作的开始。
rcu_read_unlock()：标记读操作的结束。

// 读者访问受保护数据
rcu_read_lock();
p = rcu_dereference(gp);
// 访问*p
rcu_read_unlock();

写操作

rcu_assign_pointer()：更新指针，指向新的数据。
synchronize_rcu()：阻塞等待宽限期结束，确保所有读操作完成，之后释放旧数据。
call_rcu()：非阻塞方式，注册回调，宽限期结束后回调释放旧数据。

// 写者更新数据
old = gp;
new = kmalloc(...);
rcu_assign_pointer(gp, new);
synchronize_rcu(); // 或者使用call_rcu的方式
kfree(old);

测试代码

使用`synchronize_rcu`

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/rcupdate.h>
#include <linux/slab.h>
#include <linux/delay.h>
#include <linux/kthread.h>
#include <linux/err.h>

MODULE_LICENSE("GPL");
MODULE_AUTHOR("congchp");
MODULE_DESCRIPTION("RCU Test Module with synchronize_rcu()");

// 受RCU保护的数据结构
struct rcu_test_data
{
   
   
    int value;
};

static struct rcu_test_data __rcu *global_data;
static struct task_struct *reader_thread;
static struct task_struct *writer_thread;
static int stop_threads;

// 读者线程函数