转自:http://blog.youkuaiyun.com/samantha_sun/article/details/6365770
为什么说在持有自旋锁时不能进入睡眠或阻塞
看LDD149页时,看到休眠的两条规则,其中之一是说,永远不要再原子上下文睡眠!
为什么说,驱动程序在持有自旋锁时绝对不能进入睡眠,而在拥有信号量时就可以?
看到网上有人这么提问,这也是我读书时候自己迷惑不解的地方。但是,通过仔细研读,我理解到了这个问题的答案。我在网上也看了大家对于这个问题的回答,大都没说到点上。根据我自己的理解,应该是:
自旋锁自旋锁禁止处理器抢占;而信号量不禁止处理器抢占。
基于这个原因,如果自旋锁在锁住以后进入睡眠,由于不能进行处理器抢占,其他系统进程将都不能获得CPU而运行,因此不能唤醒睡眠的自旋锁,因此系统将不响应任何操作(除了中断或多核的情况,下面会讨论)。而信号量在临界区睡眠后,其他进程可以用抢占的方式继续运行,从而可以实现内存拷贝等功能而使得睡眠的信号量程序由于获得了等待的资源而被唤醒,从而恢复了正常的代码运行。
当然,自旋锁的睡眠的情况包含考虑多核CPU和中断的因素。自旋锁睡眠时,只是当前CPU的睡眠以及当前CPU的禁止处理器抢占,所以,如果存在多个CPU,那么其他活动的CPU可以继续运行使操作系统功能正常,并有可能完成相应工作而唤醒睡眠了的自旋锁,从而没有造成系统死机;自旋锁睡眠时,如果允许中断处理,那么中断的代码是可以正常运行的,但是中断通常不会唤醒睡眠的自旋锁,因此系统仍然运行不正常。
以上是我对这个问题的理解。如果有说错的地方,非常希望高手给予指正!谢谢。
其实这个问题可以自己写个小程序测试一下,我现在也正在读书,还没有测试,其实测试很简单,写一个自旋锁,然后睡眠,看看在单CPU下系统是不是死机了,就可以清楚。估计死机时还应该可以响应键盘操作,因为键盘是中断处理,测试时把中断屏蔽了,也是一个不错的办法。
在单核cpu上,只需要关闭中断就可以保证原子操作。。。。。原子操作完成后打开中断即可。
但是在多核cpu上,关闭中断不能保证其他的cpu不进行资源的操作,但是多个cpu共享一条总线,所以只要锁住总线便能保证原子操作。自旋锁的原理便是如此。
自旋锁可分为用在单核处理器上和用在多核处理器上。
多线程和多处理器的关系:
1. 单核cpu: DPC/Dispatch级别的中断导致线程切换
2. 多核cpu:
1)某个cpu的中断导致线程的切换
2)多个cpu可以同时使得多个线程运行
在单核cpu上,只需要关闭中断就可以保证原子操作。。。。。原子操作完成后打开中断即可。
但是在多核cpu上,关闭中断不能保证其他的cpu不进行资源的操作,但是多个cpu共享一条总线,所以只要锁住总线便能保证原子操作。自旋锁的原理便是如此。
自旋锁和其他的同步对象event的区别:
线程使用其他的同步对象进行同步操作时,如果遇到等待,那么内核便会切换任务,让cpu运行其他的线程。。。。。。但是这个切换包括(原有线程上下文的保存,调度算法的执行,cache失效,cr3的修改。。。)如果同步操作仅仅有两条指令,那么这个代价是非常昂贵的,还不如让等待线程空转自旋。不断测试自旋锁的状态。。。
Q1:如何保证对自旋锁的状态操作是原子的?
A1:这个只能通过硬件来实现。因为多个cpu共享同一条总线,所以锁住总线便能保证对自旋锁的操作时原子的。
Q2:获得自旋锁时,为什么要提升中断请求级别(IRQL)到DISPATCH_LEVEL?
提升到Dispatch级别时为了能够禁止软中断,保证持有该锁的线程能够尽快使用完,然后释放。因为其他的cpu在空转。尽少的减少cpu资源的浪费。
多线程和多处理器的关系:
1. 单核cpu: DPC/Dispatch级别的中断导致线程切换
2. 多核cpu:
1)某个cpu的中断导致线程的切换
2)多个cpu可以同时使得多个线程运行
在单核cpu上,只需要关闭中断就可以保证原子操作。。。。。原子操作完成后打开中断即可。
但是在多核cpu上,关闭中断不能保证其他的cpu不进行资源的操作,但是多个cpu共享一条总线,所以只要锁住总线便能保证原子操作。自旋锁的原理便是如此。
自旋锁和其他的同步对象event的区别:
线程使用其他的同步对象进行同步操作时,如果遇到等待,那么内核便会切换任务,让cpu运行其他的线程。。。。。。但是这个切换包括(原有线程上下文的保存,调度算法的执行,cache失效,cr3的修改。。。)如果同步操作仅仅有两条指令,那么这个代价是非常昂贵的,还不如让等待线程空转自旋。不断测试自旋锁的状态。。。
Q1:如何保证对自旋锁的状态操作是原子的?
A1:这个只能通过硬件来实现。因为多个cpu共享同一条总线,所以锁住总线便能保证对自旋锁的操作时原子的。
Q2:获得自旋锁时,为什么要提升中断请求级别(IRQL)到DISPATCH_LEVEL?
提升到Dispatch级别时为了能够禁止软中断,保证持有该锁的线程能够尽快使用完,然后释放。因为其他的cpu在空转。尽少的减少cpu资源的浪费。
多线程和多处理器的关系:
1. 单核cpu: DPC/Dispatch级别的中断导致线程切换
2. 多核cpu:
1)某个cpu的中断导致线程的切换
2)多个cpu可以同时使得多个线程运行
在单核cpu上,只需要关闭中断就可以保证原子操作。。。。。原子操作完成后打开中断即可。
但是在多核cpu上,关闭中断不能保证其他的cpu不进行资源的操作,但是多个cpu共享一条总线,所以只要锁住总线便能保证原子操作。自旋锁的原理便是如此。
自旋锁和其他的同步对象event的区别:
线程使用其他的同步对象进行同步操作时,如果遇到等待,那么内核便会切换任务,让cpu运行其他的线程。。。。。。但是这个切换包括(原有线程上下文的保存,调度算法的执行,cache失效,cr3的修改。。。)如果同步操作仅仅有两条指令,那么这个代价是非常昂贵的,还不如让等待线程空转自旋。不断测试自旋锁的状态。。。
Q1:如何保证对自旋锁的状态操作是原子的?
A1:这个只能通过硬件来实现。因为多个cpu共享同一条总线,所以锁住总线便能保证对自旋锁的操作时原子的。
Q2:获得自旋锁时,为什么要提升中断请求级别(IRQL)到DISPATCH_LEVEL?
提升到Dispatch级别时为了能够禁止软中断,保证持有该锁的线程能够尽快使用完,然后释放。因为其他的cpu在空转。尽少的减少cpu资源的浪费。
-
3楼
huofen20052012-03-27 09:13发表 [回复]
-
-
所有的原则,都是为了保证单cpu上任务操作的原子性。
而睡眠,则内部破坏了这个原子性,系统没法阻止,只能报错提醒。
--
多cpu的时候,A核上拿到锁的时候,其他核会自旋等待(某硬件同步机制来保证)。
-
2楼
huofen20052012-03-27 09:09发表 [回复]
-
-
这个理解是不对的:
--
在单CPU系统里面,自旋锁被简化为关抢占,关中断,其余什么都不干(这时候,自旋锁的本质在于抓住cpu不放,而不是自旋等待资源了)!
--
A任务拿住自旋锁,然后进行睡眠/阻塞 -> 激发调度,然后B任务就拿到异常状态(A尚未释放)的自旋锁了! //锁失效!
这个时候,系统会报类似错误:
BUG: scheduling while atomic: processB/1750/0x00000100