LWN:使用rseq()来帮助完成用户空间自旋锁!

AndréAlmeida在2023年欧洲开源峰会上提出了一种解决方案,利用Linux的可重启序列(rseq)功能来改进用户空间自旋锁,避免无谓的CPU浪费。通过检查线程在CPU上的状态,自适应性地决定是继续自旋还是切换到阻塞。尽管还有优化和测试的需求,这一方法显示出潜力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关注了就能看到更多这么棒的文章哦~

User-space spinlocks with help from rseq()

By Jonathan Corbet
September 22, 2023
OSSEU
ChatGPT translation
https://lwn.net/Articles/944895/

之前五月份的时候,André Almeida在使用自适应自旋方式(adaptive spinning)创建用户空间自旋锁(user-space spinlocks)的工作 进行了一些工作。当时,这项工作因为Linux中目前没有一种方法能快速确定指定线程是否实际在CPU上执行而停滞不前。此后在2023年欧洲开源峰会上,Almeida又回来继续讨论了如何克服这个困难。

070168825b4fc6ead46fc7560c99019b.png

他首先对锁相关的原语(locking primitives)以及自旋锁的工作原理进行了概述。简而言之,自旋锁之所以被命名为自旋锁,是因为如果尝试获取锁失败,代码将在一个循环中重新检查其状态(因此称为“自旋”),直到锁可用为止。在内核中相对容易实现自旋锁,因为根据自旋锁操作的规则,锁的持有者目前必定正在系统中的某个CPU上运行,应该很快释放锁;这确保了自旋导致的CPU时间损失会很小。

在用户空间,情况更加复杂。一个线程可能正在持续试图获取自旋锁,但是锁的当前持有者已被抢占,根本不在运行。在这种情况下,锁不会很快释放,自旋就只会浪费CPU时间。在最坏的情况下,正在自旋的线程可能正是阻止它所需的锁被释放的线程,这意味着自旋线程正在主动阻止其所需的锁被释放。在这种情况下,代码应该停止自旋,马上休眠,直到锁被释放。

然而,这样做需要有一种方式能让获取锁的这部分代码知道锁的所有者不在运行。可以为此添加一个系统调用,但系统调用开销很大;在这种情况下,系统调用开销可能很容易超过由锁保护的关键部分(critical section)中花费的时间。如果必须要调用进入内核,最好是等到锁被释放后再阻塞。真正需要的是一种不进行系统调用就能获取这些信息的方法。

在五月份的讨论中提到了使用可重启序列 (restartable sequences)功能来获取这些信息。这个子系统在scheduler调度器内有hook,用于跟踪任务抢占等事件;它还使用一个共享内存段(shared-memory segment)来将某些信息传递给用户空间。也许可重启序列也可以用来解决这个问题?

可重启序列代码的维护者Mathieu Desnoyers迅速回应并提供了一个实现这一功能的补丁。这个补丁在内核和用户空间之间共享的 rseq 结构中添加了一个新的成员:

struct rseq_sched_state {
/*
 * Version of this structure. Populated by the kernel, read by
 * user-space.
 */
__u32 version;
/*
 * The state is updated by the kernel. Read by user-space with
 * single-copy atomicity semantics. This field can be read by any
 * userspace thread. Aligned on 32-bit. Contains a bitmask of enum
 * rseq_sched_state_flags. This field is provided as a hint by the
 * scheduler, and requires that the page holding this state is
 * faulted-in for the state update to be performed by the scheduler.
 */
__u32 state;
/*
 * Thread ID associated with the thread registering this structure.
 * Initialized by user-space before registration.
 */
__u32 tid;
  };

state 字段包含一组描述了所关注进程的执行状态的flag,这是此方案的关键。这里只定义了一个flag, RSEQ_SCHED_STATE_FLAG_ON_CPU 。每当与该结构关联的线程被放置到CPU上执行时,都会设置这个flag;如果线程因任何原因停止运行,则该标志会再次被清0。

这些信息足以在用户空间实现自适应自旋。如果尝试获取自旋锁失败,第一步是检查持有锁的线程的 rseq_sched_state (这里隐含了一个要求就是这种通信发生在可以访问彼此的可重启序列状态的线程之间)。如果检查显示线程正在运行,那么自旋等待锁被释放就有意义的(当然,需要在循环内部进行检查,以检测随后持有者是否被抢占了)。否则,会进行系统调用,以简单地阻塞住,直到锁被释放。

不过,Almeida总结说他仍然不完全确定这个想法是否能够充分发挥其潜力。还有需要进行优化cache行为,并且将自适应自旋集成到POSIX线程锁定原语中,并进行大量的性能基准测试工作。但这种方法似乎很有可行性,剩下的只是具体工作量而已。
[感谢Linux基金会支持我们前往此活动。]

全文完
LWN 文章遵循 CC BY-SA 4.0 许可协议。

欢迎分享、转载及基于现有协议再创作~

长按下面二维码关注,关注 LWN 深度文章以及开源社区的各种新近言论~

format,png

MPU6050是一款广泛应用在惯性测量单元(IMU)中的微型传感器,由InvenSense公司生产。它集成了三轴加速度计和三轴陀螺仪,能够检测设备在三维空间中的线性加速度和角速度,进而计算出物体的姿态、运动和方向。在本项目中,MPU6050被用来获取设备的YAW、PITCH、ROLL这三个关键的姿态角,这些数据将通过OLED显示屏进行实时显示。 1. **MPU6050工作原理**: MPU6050内部包含两个主要传感器:加速度计用于测量重力加速度,提供X、Y、Z三个轴的线性加速度信息;陀螺仪则测量绕三个轴的旋转速率。通过融合这两个传感器的数据,可以计算出设备的动态运动状态。 2. **姿态角的定义**: - **YAW(偏航角)**:表示设备相对于一个参考方向的旋转角度,通常以水平面为基准。 - **PITCH(俯仰角)**:是设备沿垂直轴相对于水平面的倾斜角度,向上为正,向下为负。 - **ROLL(翻滚角)**:是设备围绕前向轴的旋转角度,向右为正,向左为负。 3. **数据处理与姿态解算**: 为了从原始的加速度和角速度数据中获取准确的姿态角,需要应用卡尔曼滤波、互补滤波或者Madgwick算法等高级数据融合方法。这些算法可以有效地消除噪声,提高姿态估计的稳定性和精度。 4. **OLED显示屏**: OLED(有机发光二极管)显示器是一种自发光技术,具有高对比度、快速响应时间以及广视角的优点。在该项目中,OLED用于实时显示YAW、PITCH、ROLL角,为用户提供了直观的视觉反馈。 5. **硬件连接与编程**: 实现这一功能需要将MPU6050通过I2C或SPI接口连接到微控制器(如Arduino、Raspberry Pi等)。编写相应的固件程序来读取传感器数据,并将其转换为姿态角,然后将结果显示在OLED屏幕上。 6. **软件实现**: 在编程过程中,通常会用到相关的库文件,如Arduino IDE中的Wire库来处理I2C通信,Adafruit的MPU6050库来与传感器交互,以及Adafruit_GFX和Adafruit_SSD1306库来驱动OLED屏幕。 7. **调试与优化**: 项目实施过程中可能遇到的问题包括传感器漂移、数据不准确等,可以通过调整滤波器参数、校准传感器以及优化算法来改善。 综上,"MPU6050(OLED显示姿态角)"项目涉及了传感器技术、微控制器编程、数据融合算法、嵌入式显示等多个领域的知识,对于学习和实践物联网、机器人、无人机等领域的开发者来说,是一个很好的动手实践项目。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值