【linux内核分析与应用-陈莉君】内核同步概述

最新推荐文章于 2021-04-29 17:17:00 发布

原创最新推荐文章于 2021-04-29 17:17:00 发布 · 509 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#内核 #同步

操作系统专栏收录该内容

123 篇文章

订阅专栏

本文探讨了内核同步机制的重要性及其实现方式。介绍了并发执行的原因、竞争条件的概念、临界区的保护方法，并讨论了原子操作和锁机制的应用。

如果把内核看做不断地对各种请求进行响应的服务器的话,那么正在CPU上执行的进程发出中断请求
的外部设备等相当于客户,正如服务器一直要响应客户的请求一样,内核也随时响应进程中断系统调用
等的请求.我们之所以这么比喻是需要强调内核中的各个任务并不是严格按照顺序依次执行的,而是相互
交错执行的.对于所有的内核任务而言,内核中的很多数据都是共享资源,这就像高速公路供给有很多车辆
行驶一样,对这些共享资源的访问,必须遵守一定的访问规则,否则就会造成对共享资源的破坏,就如同
不遵守交替规则会造成撞车一样.

2.并发执行的原因

1.中断
  中断几乎可以在任何时刻异步发生,也可能随时打断正在执行的代码;
2.内核抢占
  当内核具有抢占性的时候,内核中的任务就可能被另一个任务抢占；
3.睡眠
  在内核中执行的进程可能会睡眠,这将唤醒调度程序导致调度一个新的进程执行；
4.对称多处理器
  两个或多个处理器可以同时执行代码,这时就可能造成并发,问题是系统中还有没有其他的并发源.

3.竞争条件

竞争条件：
Race Condition.
在并发执行的过程中,会产生竞争,在这里我们就给出竞争的条件.
当以下两个条件同时发生的时候,竞争就发生：
(1)至少两个可执行上下文并行执行:
   一种是真正的并行,比如说两个系统调用在不同的处理器上执行；
   另一种是其中一个上下文能够随意地抢占另一个,比如说一个中断抢占系统调用;
(2)可执行上下文对共享变量执行读写操作.

问题：
为什么这些竞争条件会导致各种难以调试的错误？


竞争条件导致的错误的示例(释放资源的示例):
在大多数情况下,释放资源的函数只释放一次资源,然而在上图所示,
counter的初值为2,A线程将counter的值改成1的时候,B线程抢占了A,
counter的值又被减了一次,减为0,然后B线程就调用释放资源的函数去释放资源,
然后线程A恢复执行,因为此时counter的值为0了,线程A也释放了资源,于是出现
一个资源被释放两次的情况.

问题：
如何解决这样的问题？

4.临界区

所谓临界区就是访问或操作共享的代码段,多个内核任务并发访问同一个资源通常是
不安全的,为了避免对临界区进行并发访问,编程者必须保证临界区代码被原子执行,
也就是说代码在执行期间不可以被打断,就如同整个临界区是一个不可分割的指令一样,
如图：
A进程进入临界区以后,B试图进入的时候就被阻塞,只有当A离开临界区以后,B才能
进入.

问题：
在释放资源的那个例子中,临界区是什么？


如何保护临界区？
1.使得临界区的操作能够原子地进行;
2.进入临界区以后禁止抢占,比如通过中断,禁止下半部分处理,或者禁止线程的抢占等;
3.串行地访问临界区,比如使用自旋锁,互斥锁,只允许一个内核访问临界区.

5.并发执行中共享变量V加操作

多个CPU和内存通过总线互联,在任一时刻,只能有一个总线设备.
比如说CPU或DM控制器访问该从设备,在这个场景中该从设备就是RAM芯片,因此
来自两个CPU上的读内存的操作被串行执行,分别获得同样的旧值,比如说0,
完成修改之后两个CPU都想进行写操作,把修改的值写到内存,但是硬件的(??争抢)限制
使得CPU的写回同样必须是串行化的,因此CPU首先获得了访问权,进行写回的动作,
随后CPU2完成写回动作,在这种情况下CPU1对内存的修改就被CPU2覆盖了,
此时执行结果就是错误的.本来加两次结果应该为2,但这里就成1了.


在多处理器的SM系统中,为了提供原子操作,不同的CPU体系结构提供了不同的技术.
例如在x86,当执行加有lock前置位的指令的时候,这个前置位就用于锁定系统总线,
使得前面的错误就不会发生.


问题：
在ARM平台上采用什么指令？

6.原子操作

推荐阅读1

推荐阅读2

对于由多个内核任务进行共享的变量,对变量的装载修改和存储必须原子地进行,不能分割.
于是内核提供了一个特殊的类型--原子类型atomic_t.
typedef struct{
    int counter;
}atomic;

7.共享队列和加锁

当共享资源是一个复杂的数据结构的时候,竞争状态往往会使得数据结构遭到破坏,对于这种情况怎么处理
呢？
锁机制是可以避免禁止状态的.
正如锁和门一样,门后的房间可以想象成一个临界区,在给定时间内,房间里只能有一个内核存在,当一个
任务进入房间以后,它会锁住房门,当它结束对共享数据的操作以后,就会走出房间,打开门锁.
如图A和B试图同时进入房间,当一个任务进去以后,就必须加锁,出来以后打开锁.


任何要访问队列的代码首先都要占着相应的锁,这样的话,该锁就能阻塞来自其他内核中的并发访问.
比如说任务1试图锁定队列,那么它成功获得锁之后才能访问队列,若此时也有任务2也要访问共享的
队列,那么可能的情况就如上图.