Linux 2.4.x及以前的版本都是非抢占式内核方式,如果编译成单处理器系统,在同一时间只有一个进程在执行,除非它自己放弃,不然只有通过"中断"才能中断其 执行。因此,在单处理器非抢占式内核中,如果需要修改某个重要的数据结构,或者执行某些关键代码,只需要禁止中断。( 只有禁止中断)
在对称多处理器,仅仅禁止某个CPU的中断是不够的,当然我们也可以将所有CPU的中断都禁止,但这样做开销很 大,整个系统的性能会明显下降。此外,即使在单处理器上,如果内核是抢占式的,也可能出现不同进程上下文同时进入临界区的情况。为此,Linux内核中提 供了"自旋锁(spinlock)"的同步机制。 (只是禁止中断是不行的,引入spinlock)
自旋锁与互斥锁有点类似,只是自旋锁不会引起调用者睡眠,如果自旋锁已经被别的执行单元保持,调用者就一直循环在那里看是否该自旋锁的保持者已经释放了锁,"自旋"因此而得名. (自旋锁不会睡眠,只会在那里不停的循环等待)
因此,中断(或软中断)禁止用于防止同一CPU上中断(或软中断)对共享资源的非同步访问。而自旋锁则防止在不同CPU上的执行单元对共享资源的同时访问,以及不同进程上下文互相抢占导致的对共享资源的非同步访问。
自旋锁的代码在include/asm-i386 (spinlock.h spinlock_types.h)代码是以汇编的形式写的。如何才能在那里不停的循环等待呢。很简单,用code来实现。
do
{}while(0)
js/jmp等汇编跳转语句
Linux内核中的自旋锁
在Linux内核中,自旋锁的基本使用方式如下:
先声明一个spinlock_t类型的自旋锁变量,并初始化为"未加锁"状态。在进入临界区之前,调用加锁函数获得锁,在退出临界区之前,调用解锁函数释放锁。例如:
spinlock_t lock = SPIN_LOCK_UNLOCKED;
spin_lock(&lock);
/* 临界区 */
spin_unlock(&lock);
获得自旋锁和释放自旋锁的函数有多种变体。
spin_lock_irqsave/spin_unlock_irqrestore
spin_lock_irq/spin_unlock_irq
spin_lock_bh/spin_unlock_bh/spin_trylock_bh
上面各组函数最终都需要调用自旋锁操作函数。spin_lock函数用于获得自旋锁,如果能够立即获得锁,它就马 上返回,否则,它将自旋在那里,直到该自旋锁的保持者释放。spin_unlock函数则释放自旋锁。此外,还有一个spin_trylock函数。尽力 获得自旋锁lock,如果能立即获得锁,它获得锁并返回真,否则不能立即获得锁,立即返回假。它不会自旋等待lock被释放
code解释:
typedef struct {
volatile unsigned int lock;
} spinlock_t;
static inline void spin_lock(spinlock_t *lock)
{
__asm__ __volatile__(
spin_lock_string
:"=m" (lock->lock) : : "memory");
}
从上看到,spin_lock的主要内容是spin_lock_string宏,定义如下:
#define spin_lock_string \
"\n1:\t" \
"lock ; decb %0\n\t" \
"js 2f\n" \
LOCK_SECTION_START("") \
"2:\t" \
"cmpb $0,%0\n\t" \
"rep;nop\n\t" \
"jle 2b\n\t" \
"jmp 1b\n" \
LOCK_SECTION_END
在上面的汇编代码中,首先将lock递减,如果为负(表明锁已被持有),则进入自旋。每次自旋在执行一条空指令后,根据lock和0的比较结果进行跳转。如果lock小于或等于0,则继续自旋;否则(说明锁已被释放),则将lock递减后返回。
在这里,采取了一种优化手段,因为在大多数情况下,自旋锁是能成功获取的,而自旋部分代码,只是在锁被持有时才执行,因此利用 LOCK_SECTION_START和LOCK_SECTION_END将这些代码放到一个专门的区(.text.lock)中。如果把它跟别的常用指 令混在一起,会浪费指令缓存的空间。
理解这一点,我们也就能明白spin_lock是如何退出的了。事实上,由于不再同一个区(section),所以"js 2f"的下一条指令并不是"cmpb $0,%0"。
#define LOCK_SECTION_NAME \
".text.lock." __stringify(KBUILD_BASENAME)
#define LOCK_SECTION_START(extra) \
".subsection 1\n\t" \
extra \
".ifndef " LOCK_SECTION_NAME "\n\t" \
LOCK_SECTION_NAME ":\n\t" \
".endif\n\t"
#define LOCK_SECTION_END \
".previous\n\t"
如果用类C语言来描述上述过程,将是:
void spin_lock(int &lock)
{
int flag;
label1:
flag = lock--;
if (flag >= 0) {
return;
} else {
do {
nop;
} while(lock <= 0);
goto label1;
}
}
由于spin_trylock不需要自旋,实现中采用xchgb指令(该指令将自动锁总线,而不需要再使用lock前缀)。若lock原来的值为1,说明未上锁,因此返回为真,表明成功获得锁;否则返回为假。
static inline int spin_trylock(spinlock_t *lock)
{
char oldval;
__asm__ __volatile__(
"xchgb %b0,%1"
:"=q" (oldval), "=m" (lock->lock)
:"0" (0) : "memory");
return oldval > 0;
}