LWN:中断感知自旋锁的新API!

关注了就能看到更多这么棒的文章哦~

A new API for interrupt-aware spinlocks

By Daroc Alden
October 15, 2025
Kangrejos
Gemini flash translation
https://lwn.net/Articles/1039374/

Boqun Feng 在 Kangrejos 2025 会议上讨论了为 Rust 驱动程序添加一个常用 API 的话题,该 API 旨在处理中断,也就是所谓的中断感知的自旋锁(interrupt-aware spinlocks)。大多数驱动程序需要将信息从中断处理程序(interrupt handlers)传递给主驱动代码,而这种数据交换通常通过使用自旋锁来同步。虽然他最初的尝试遇到了问题,但冯伯群最终的解决方案通过跟踪中断禁用嵌套作用域(nested scopes)的数量,也有助于防止 C 代码中的错误。该 补丁集(patch set)包含冯伯群和 Lyude Paul 的工作,目前仍在审核中。

获取自旋锁的代码需要禁用抢占(preemption):否则,如果它被抢占,其他所有争夺该锁的进程都将白白浪费 CPU 时间。冯伯群表示,同样的情况(几乎)也适用于在中断中使用自旋锁。如果内核代码在进程上下文(process context)中获取了自旋锁,然后一个中断到来,其处理程序试图获取相同的锁,系统就会发生死锁(deadlock)。内核中有一条简单的规则:如果一个锁在中断处理程序和进程上下文两者中都被使用,那么该锁必须是“irq-safe”的(意味着获取者在适当的时候会禁用中断)。内核的 lockdep 工具会检查是否遵循了这条规则。

冯伯群接着说,每个足够复杂的驱动程序都需要一个中断处理程序。为了用 Rust 编写驱动程序,内核程序员将需要一个抽象层来处理中断和 irq-safe 锁。C 语言中现有的 irq-safe 自旋锁使用 `spin_lock_irq()`/`spin_unlock_irq()` 或 `spin_lock_irqsave()`/`spin_lock_irqrestore()`,具体取决于代码是否期望在中断启用(interrupt-enabled)的上下文中运行。前一对函数在释放锁后无条件地启用中断,而后一对函数则保存当前中断状态并在之后恢复。此外,还有一些作用域守卫(scope guards)可以在函数结束时自动解锁这些自旋锁。

Rust API 的首次尝试实际上类似于内核的 作用域守卫。在 Rust 中,拥有一种特殊的守卫类型,在被丢弃(dropped)时释放锁,是一种常见的模式。冯伯群遇到的问题也是 C API 所面临的难题:如果两个锁以错误的顺序被释放会发生什么?考虑一段代码,它在中断启用状态下开始执行,使用 `spin_lock_irqsave()` 获取锁 A(导致中断暂时禁用),然后再次使用 `spin_lock_irqsave()` 获取锁 B。第二次调用将把“禁用”作为当前中断状态存储起来。先释放锁 A 再释放锁 B,最终会导致中断永久禁用,这“不理想”。

冯伯群研究了几种不同的方法来解决这个问题,包括使用令牌类型在编译时跟踪代码是否在可中断上下文(interruptible context)中调用,但这被证明过于复杂。最终,在九月初一次关于这个问题的 邮件列表讨论 中,Thomas Gleixner 评论 道:

更深入地思考。我认为这里存在一个更普遍的问题。

目前 Rust 的大部分工作都在试图模拟 C 语言现有实现的方式。

我认为这从根本上是错误的,因为内核中的许多编程模式在 C 语言中也是根本性的错误。它们仅仅是蔓延开来的技术债(technical debt)。

首先应该做的是从 Rust 的角度来看待它:这些东西应该如何正确实现?

这让冯伯群回到了最初的设计阶段;他最终确定了一种方法,即跟踪中断禁用嵌套作用域的数量。当该数量从零变为一或从一变为零时,代码可以适当地启用或禁用中断,而不再关心锁的释放顺序。这部分代码是用 C 语言编写的,因此也能让内核的其余部分受益。

Andreas Hindborg 询问 `spin_lock_irqsave()` 的所有现有 C 语言用户是否都会适应冯伯群的方法,或者这是否是一个新的 API。冯伯群澄清说,这是一个新的 API,但 Rust 代码应该只使用这一个。他说,在关于这项改变的邮件列表讨论中,调度维护者 Peter Zijlstra 反对 最终出现 三种 锁定和解锁中断感知自旋锁的方式,并且他在尝试机械地转换现有 C 语言用户时遇到了问题,但冯伯群乐观地认为 Zijlstra 会接受更慢的过渡。

Joel Fernandes 询问这个 API 如何与 CondVar::wait() 交互,后者在等待通知时会暂时释放自旋锁(并重新启用中断)。冯伯群说,`CondVar::wait()` 会保存当前中断禁用嵌套的深度,并在之后恢复它。Fernandes 指出这只在持有一个锁的情况下才有效,冯伯群对此表示同意。无论如何,在持有两个锁的情况下等待条件变量(conditional variable)是错误的,“并且 lockdep 会对此发出警告”。

冯伯群提出的方法很好地使 Rust 代码能够与中断感知自旋锁交互,但它还能实现另一个小的 API 更改:Rust 可以拥有一个单独的守卫类型,用于在非自旋锁原因下启用和禁用(per-CPU)中断。如果正在运行的代码已经拥有该类型的一个实例(表明它必须在某个时候禁用了中断),那么它可以在不增加计数的情况下锁定自旋锁。这“在一些不常见的场景中会很有用”,也利于性能优化。

Gary Guo、Benno Lossin 和冯伯群随后展开了一场详细讨论,探讨是否最好让现有中断感知自旋锁守卫(interrupt-aware-spinlock guards)来实现这个目的,而不是创建一个新类型。他们之间的来回讨论很快就超出了我的理解范围,但最终结论是冯伯群的 API 是正确的方向,尽管未来在更多情况下,可能还有一些方法可以避免热路径(hot path)中原子写入(atomic write)的性能开销。

此时,冯伯群深入探讨了新 API 的实现细节。通过 preempt_count() 函数访问一个 32 位的 per-CPU 字段,它比普通的 per-CPU 变量更快;冯伯群尝试看看是否可以“挪用”第 16 到 23 位用于中断禁用嵌套计数,但这会将可跟踪的不可屏蔽中断(non-maskable interrupt, NMI)嵌套级别从 16 位减少到 8 位。冯伯群不确定为什么内核需要 32,000 个 NMI 嵌套级别,但维护者坚持认为需要。由于大多数代码只需要关心是否有任何 NMI 嵌套发生,而不是精确的级别,冯伯群和 Fernandes 最终将 `preempt_count()` 中的 NMI 嵌套计数减少到一位,并使用一个普通的 per-CPU 变量来存储实际深度。

在许多情况下,中断感知自旋锁的现有 C 语言用户应该能够直接使用新的 API。只要函数中存在成对的禁用和启用操作,就可以安全地替换为调用新的 `local_interrupt_disable()` 和 `local_interrupt_enable()` 函数。“但存在一些‘创造性的’非成对使用。”

冯伯群编写了一个工具来查找非成对使用,以评估迁移的麻烦程度。在此过程中,他实际上在内核中发现了一个潜在的错误(latent bug),有人在回调(callback)中使用了无条件 API,而本应使用 `local_irq_save()`。然而,他认为 Rust API 不应该因为重写现有代码而被阻碍;这可以在之后逐步完成。“新的 API 更完善;所以也许人们会自愿切换。”

如果 Zijlstra 和其他维护者对这个答案不满意,冯伯群的备用方案是向 Rust 暴露 per-CPU 变量,然后完全用 Rust 编写新 API——这将使新 API 对 C 语言用户不可用。如果大多数现有 C 语言用户可以轻松地迁移到新的、更安全的 API,那么错过改进内核现有 C 代码的机会将是令人遗憾的。时间将证明冯伯群的提议是否会被采纳,但无论如何,Rust 驱动程序的 API 很快就会离其 C 驱动程序对应部分的同等水平更近一步。

全文完
LWN 文章遵循 CC BY-SA 4.0 许可协议。

欢迎分享、转载及基于现有协议再创作~

长按下面二维码关注,关注 LWN 深度文章以及开源社区的各种新近言论~

计及源荷不确定性的综合能源生产单元运行调度与容量配置优化研究(Matlab代码实现)内容概要:本文围绕“计及源荷不确定性的综合能源生产单元运行调度与容量配置优化”展开研究,利用Matlab代码实现相关模型的构建与仿真。研究重点在于综合能源系统中多能耦合特性以及风、光等可再生能源出力和负荷需求的不确定性,通过鲁棒优化、场景生成(如Copula方法)、两阶段优化等手段,实现对能源生产单元的运行调度与容量配置的协同优化,旨在提高系统经济性、可靠性和可再生能源消纳能力。文中提及多种优化算法(如BFO、CPO、PSO等)在调度与预测中的应用,并强调了模型在实际能源系统规划与运行中的参考价值。; 适合人群:具备一定电力系统、能源系统或优化理论基础的研究生、科研人员及工程技术人员,熟悉Matlab编程和基本优化工具(如Yalmip)。; 使用场景及目标:①用于学习和复现综合能源系统中考虑不确定性的优化调度与容量配置方法;②为含高比例可再生能源的微电网、区域能源系统规划设计提供模型参考和技术支持;③开展学术研究,如撰写论文、课题申报时的技术方案借鉴。; 阅读建议:建议结合文中提到的Matlab代码和网盘资料,先理解基础模型(如功率平衡、设备模型),再逐步深入不确定性建模与优化求解过程,注意区分鲁棒优化、随机优化与分布鲁棒优化的适用场景,并尝试复现关键案例以加深理解。
内容概要:本文系统分析了DesignData(设计数据)的存储结构,围绕其形态多元化、版本关联性强、读写特性差异化等核心特性,提出了灵活性、版本化、高效性、一致性和可扩展性五大设计原则。文章深入剖析了三类主流存储方案:关系型数据库适用于结构化元信息存储,具备强一致性与高效查询能力;文档型数据库适配半结构化数据,支持动态字段扩展与嵌套结构;对象存储结合元数据索引则有效应对非结构化大文件的存储需求,具备高扩展性与低成本优势。同时,文章从版本管理、性能优化和数据安全三个关键维度提出设计要点,建议采用全量与增量结合的版本策略、索引与缓存优化性能、并通过权限控制、MD5校验和备份机制保障数据安全。最后提出按数据形态分层存储的核心结论,并针对不同规模团队给出实践建议。; 适合人群:从事工业设计、UI/UX设计、工程设计等领域数字化系统开发的技术人员,以及负责设计数据管理系统架构设计的中高级工程师和系统架构师。; 使用场景及目标:①为设计数据管理系统选型提供依据,合理选择或组合使用关系型数据库、文档型数据库与对象存储;②构建支持版本追溯、高性能访问、安全可控的DesignData存储体系;③解决多用户协作、大文件存储、历史版本管理等实际业务挑战。; 阅读建议:此资源以实际应用场景为导向,结合具体数据库类型和表结构设计进行讲解,建议读者结合自身业务数据特征,对比分析不同存储方案的适用边界,并在系统设计中综合考虑成本、性能与可维护性之间的平衡。
先展示下效果 https://pan.quark.cn/s/6208c60fd188 以RFID技术为支撑的指纹与面部双重生物识别方案,已成为当代门禁系统安全性能提升的关键象征,该方案综合运用了指纹确认和面部确认两种生物识别手段,旨在构建更为严密的防护屏障。 射频识别(Radio Frequency Identification)技术在此过程中承担着数据交互与身份核实的重要辅助角色,促使门禁系统展现出更高的智能化水平与运行效能。 **一、指纹门禁系统**指纹门禁系统依托于个体指纹的特异性进行身份核实,其特征具有不可替代性和不可复制的属性。 系统运用了前沿的数字图像处理方法、生物识别运算逻辑以及数字信号处理(Digital Signal Processing)技术,从而保障了门禁操控的安全性。 使用者只需将手指放置于指纹感应装置上,系统便能迅速且精准地完成身份核实。 此类系统不仅强化了安全性,还规避了传统钥匙、IC卡或密码锁可能遭遇的遗失、盗用或被破解等问题,并且通过与屏幕汉字显示功能的结合,进一步强化了门禁系统的防护能力,实现了安全管理模式的现代化。 **二、面部门禁系统**面部识别,亦称作人脸识别,是一种通过剖析个体面部特征进行身份判定的技术。 该技术可分为常规视频捕捉分析与热成像技术两种实施路径。 常规视频捕捉分析借助摄像头获取并解析面部特征,而在光线不足或完全黑暗的环境中,热成像技术则通过探测面部血液散发的热能形成面部影像,即便在无光状态下亦可正常运作。 面部识别技术在企业、住宅安保以及公共安全等多个领域得到了普遍应用,为无需物理接触的身份核实提供了有效途径。 **指纹识别技术的长处与应用**1. **独特性**:个体指纹具有唯一性,为身份核实提供了坚实的依据。 2. **稳定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值