【linux内核分析与应用-陈莉君】内核同步概述

本文探讨了内核同步机制的重要性及其实现方式。介绍了并发执行的原因、竞争条件的概念、临界区的保护方法,并讨论了原子操作和锁机制的应用。

目录

 

1.内核同步机制的引入

2.并发执行的原因

3.竞争条件

4.临界区

5.并发执行中共享变量V加操作

6.原子操作

7.共享队列和加锁

8.确定保护对象

9.死锁与死锁的避免

10.参考资料与思考题


1.内核同步机制的引入

如果把内核看做不断地对各种请求进行响应的服务器的话,那么正在CPU上执行的进程发出中断请求
的外部设备等相当于客户,正如服务器一直要响应客户的请求一样,内核也随时响应进程中断系统调用
等的请求.我们之所以这么比喻是需要强调内核中的各个任务并不是严格按照顺序依次执行的,而是相互
交错执行的.对于所有的内核任务而言,内核中的很多数据都是共享资源,这就像高速公路供给有很多车辆
行驶一样,对这些共享资源的访问,必须遵守一定的访问规则,否则就会造成对共享资源的破坏,就如同
不遵守交替规则会造成撞车一样.

2.并发执行的原因

1.中断
  中断几乎可以在任何时刻异步发生,也可能随时打断正在执行的代码;
2.内核抢占
  当内核具有抢占性的时候,内核中的任务就可能被另一个任务抢占;
3.睡眠
  在内核中执行的进程可能会睡眠,这将唤醒调度程序导致调度一个新的进程执行;
4.对称多处理器
  两个或多个处理器可以同时执行代码,这时就可能造成并发,问题是系统中还有没有其他的并发源.

3.竞争条件

竞争条件:
Race Condition.
在并发执行的过程中,会产生竞争,在这里我们就给出竞争的条件.
当以下两个条件同时发生的时候,竞争就发生:
(1)至少两个可执行上下文并行执行:
   一种是真正的并行,比如说两个系统调用在不同的处理器上执行;
   另一种是其中一个上下文能够随意地抢占另一个,比如说一个中断抢占系统调用;
(2)可执行上下文对共享变量执行读写操作.

问题:
为什么这些竞争条件会导致各种难以调试的错误?


竞争条件导致的错误的示例(释放资源的示例):
在大多数情况下,释放资源的函数只释放一次资源,然而在上图所示,
counter的初值为2,A线程将counter的值改成1的时候,B线程抢占了A,
counter的值又被减了一次,减为0,然后B线程就调用释放资源的函数去释放资源,
然后线程A恢复执行,因为此时counter的值为0了,线程A也释放了资源,于是出现
一个资源被释放两次的情况.

问题:
如何解决这样的问题?

4.临界区

所谓临界区就是访问或操作共享的代码段,多个内核任务并发访问同一个资源通常是
不安全的,为了避免对临界区进行并发访问,编程者必须保证临界区代码被原子执行,
也就是说代码在执行期间不可以被打断,就如同整个临界区是一个不可分割的指令一样,
如图:
A进程进入临界区以后,B试图进入的时候就被阻塞,只有当A离开临界区以后,B才能
进入.

问题:
在释放资源的那个例子中,临界区是什么?


如何保护临界区?
1.使得临界区的操作能够原子地进行;
2.进入临界区以后禁止抢占,比如通过中断,禁止下半部分处理,或者禁止线程的抢占等;
3.串行地访问临界区,比如使用自旋锁,互斥锁,只允许一个内核访问临界区.

5.并发执行中共享变量V加操作

多个CPU和内存通过总线互联,在任一时刻,只能有一个总线设备.
比如说CPU或DM控制器访问该从设备,在这个场景中该从设备就是RAM芯片,因此
来自两个CPU上的读内存的操作被串行执行,分别获得同样的旧值,比如说0,
完成修改之后两个CPU都想进行写操作,把修改的值写到内存,但是硬件的(??争抢)限制
使得CPU的写回同样必须是串行化的,因此CPU首先获得了访问权,进行写回的动作,
随后CPU2完成写回动作,在这种情况下CPU1对内存的修改就被CPU2覆盖了,
此时执行结果就是错误的.本来加两次结果应该为2,但这里就成1了.


在多处理器的SM系统中,为了提供原子操作,不同的CPU体系结构提供了不同的技术.
例如在x86,当执行加有lock前置位的指令的时候,这个前置位就用于锁定系统总线,
使得前面的错误就不会发生.


问题:
在ARM平台上采用什么指令?

6.原子操作

推荐阅读1

推荐阅读2

对于由多个内核任务进行共享的变量,对变量的装载修改和存储必须原子地进行,不能分割.
于是内核提供了一个特殊的类型--原子类型atomic_t.
typedef struct{
    int counter;
}atomic;

7.共享队列和加锁

当共享资源是一个复杂的数据结构的时候,竞争状态往往会使得数据结构遭到破坏,对于这种情况怎么处理
呢?
锁机制是可以避免禁止状态的.
正如锁和门一样,门后的房间可以想象成一个临界区,在给定时间内,房间里只能有一个内核存在,当一个
任务进入房间以后,它会锁住房门,当它结束对共享数据的操作以后,就会走出房间,打开门锁.
如图A和B试图同时进入房间,当一个任务进去以后,就必须加锁,出来以后打开锁.


任何要访问队列的代码首先都要占着相应的锁,这样的话,该锁就能阻塞来自其他内核中的并发访问.
比如说任务1试图锁定队列,那么它成功获得锁之后才能访问队列,若此时也有任务2也要访问共享的
队列,那么可能的情况就如上图.

8.确定保护对象

9.死锁与死锁的避免

10.参考资料与思考题

在 IT 领域,“atomic”通常表示“原子的”,具有不可分割性和一致性的特点。 ### 含义 在计算机科学里,“atomic”描述的操作是不可中断的,即该操作在执行过程中不会被其他操作干扰,要么全部完成,要么完全不执行。以数据库为例,原子操作是事务的基本特性之一,保证了数据的一致性和完整性。 ### 应用 - **数据库事务**:数据库事务要求具备原子性,以确保一系列操作要么全部成功提交,要么全部失败回滚。例如,在银行转账操作中,从一个账户扣除金额和向另一个账户添加金额这两个操作必须作为一个原子事务执行,防止出现数据不一致的情况。 ```sql BEGIN TRANSACTION; UPDATE accounts SET balance = balance - 100 WHERE account_id = 1; UPDATE accounts SET balance = balance + 100 WHERE account_id = 2; COMMIT; ``` - **多线程编程**:在多线程环境下,为避免多个线程同时访问和修改共享资源导致的数据竞争问题,常使用原子操作。例如,在 Java 中可以使用 `AtomicInteger` 类进行原子计数: ```java import java.util.concurrent.atomic.AtomicInteger; public class AtomicExample { private static AtomicInteger counter = new AtomicInteger(0); public static void main(String[] args) { // 原子性地增加计数 counter.incrementAndGet(); } } ``` - **并发数据结构**:许多并发数据结构依赖原子操作来保证线程安全。例如,无锁队列和无锁栈等数据结构使用原子操作来实现高效的并发访问。 ### 相关知识 - **原子操作的实现方式**:原子操作通常通过硬件支持来实现,现代处理器提供了专门的指令来执行原子操作,如比较并交换(CAS)指令。在软件层面,编程语言和操作系统也提供了相应的库和机制来支持原子操作。 - **锁机制的对比**:传统的锁机制相比,原子操作具有更高的性能,因为它避免了锁的竞争和上下文切换开销。但原子操作通常适用于简单的操作,对于复杂的操作,锁机制可能更为合适。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值