什么是线程
- 线程(Thread),有时被称为轻量级线程(Lightweight Process,LWP),是程序执行流的最小单位。一个标准的线程由线程ID、当前指令指针(PC)、寄存器集合和堆栈组成。
- 一个进程由一个到多个线程组成,各个线程之间共享程序的内存空间(包括代码段、数据段、堆等)及一些进程级的资源(如打开文件和信号)。
- 大多数软件应用中,线程的数量都不止一个。多个线程可以互不干扰地并发执行,并共享进程的全局变量和堆的数据。多个线程与单线程的进程相比,有如下优势:
- 某个操作可能会陷入长时间的等待,等待的线程会进入睡眠状态,无法继续执行。多线程执行可以有效利用等待时间。典型的例子是等待网络响应,这可能要花费数秒甚至数十秒。
- 某个操作(常常是计算)会消耗大量的时间,如果只有一个线程,程序和用户之间的交互会中断。多线程可以让一个线程负责交互,另一个线程负责计算。
- 程序逻辑本身就要求并发操作。例如一个多端下载软件(例如Bitorent)。
- 多CPU或多核计算机(基本就是未来的主流计算机),本身具备同时执行多个线程的能力,因此单线程程序无法全面地发挥计算机的全部计算能力。
- 相对于多进程应用,多线程在数据共享方面效率要高很多。
线程的访问权限
线程的访问非常自由,它可以访问进程内存里的所有数据,甚至包括其他线程的堆栈(如果它知道其他线程的维钱地址,那么这就是很少见的情况),但实际运用中线程也拥有自己的私有存储空间,包括以下几方面:
- 栈(尽管并非完全无法被其他线程访问,但一般情况下仍然可以认为是私有的数据)。
- 线程局部存储(Thread Local Storage,TLS)。线程局部存储是某些操作系统为线程单独提供的私有空间,但通常只具有很有限的容量。
- 寄存器(包括PC寄存器),寄存器是执行流的基本数据,因此为线程私有。
从C程序员的角度来看,数据在线程之间是否私有如下表所示。
线程调度与优先级
不论是在多处理器的计算机上还是在单处理器的计算机上,线程总是“并发”执行的。当线程数量小于等于处理器数量时(并且操作系统支持多处理器),线程的并发是真正的并发,不同的线程运行在不同的处理器上,彼此之间互不相干。但对于线程数量大于处理器数量的情况,线程的并发会受到一些阻碍,因为此时至少有一个处理器会运行多个线程。
在单处理器对应多线程的情况下,并发是一种模拟出来的状态。操作系统会让这些多线程程序轮流执行,每次仅执行一小段时间(通常是几十到几百毫秒),这样每个线程就“看起来”在同时执行。这样的一个不断在处理器上切换不同的线程的行为称之为线程调度(Thread Schedule)。
在线程调度中,线程通常拥有至少三种状态,分别是:
- 运行:此时线程正在执行。
- 就绪:此时线程可以立刻运行,但CPU已经被占用。
- 等待:此时线程正在等待某一事件(通常是I/O或同步)发生,无法执行。
处于运行中线程拥有一段可以执行的时间,这段时间称为时间片(Time Slice),当时
间片用尽的时候,该进程将进入就绪状态。如果在时间片用尽之前进程就开始等待某事件,
那么它将进入等待状态。每当一个线程离开运行状态时,调度系统就会选择一个其他的就绪
线程继续执行。在一个处于等待状态的线程所等待的事件发生之后,该线程将进入就绪状态。
三个状态的转移如下图所示:
现在主流的调度方式各不相同,但都带有优先级调度(Priority Schedule)
和轮转法(Round Robin)
的痕迹。轮转法,就是是之前提到的让各个线程轮流执行一小段时间的方法。这决定了线程之间交错执行的特点。而优先级调度则决定了线程按照什么顺序轮流执行。在具有优先级调度的系统中,线程都拥有各自的线程优先级(Thread Priority)
。具有高优先级的线程会更早地执行,而低优先级的线程常常要等待到系统中已经没有高优先级的可执行的线程存在时才能够执行。
在优先级调度的环境下,线程的优先级改变一般有三种方式:
-
用户指定优先级。
在
Windows
中,可以通过使用:
BOOL WINAPI SetThreadPriority (HANDLE hThread,int neriority);
来设置线程的优先级,而Linux
下与线程相关的操作可以通过pthread库
来实现。
在Windows和Linux中,线程的优先级不仅可以由用户手动设置,系统还会根据不同 -
根据进入等待状态的频繁程度提升或降低优先级。
通常情况下,频繁地进入等待状态(进入等待状态,会放弃之后仍然可占用的时间份额)的线程(例如处理I/O的线程)比频繁进行大量计算,以至于每次都要把时间片全部用尽的线程要受欢迎得多。原因很简单,频繁等待的线程通常只占用很少的时间。我们一般把频繁等待的线程称之为
IO密集型线程(IO Bound Thread)
,把很少等待的线程称为CPU密集型线程(CPU Bound Thread)
。IO密集型线程总是比CPU密集型线程容易得到优先级的提升。 -
长时间得不到执行而被提升优先级。
在优先级调度下,存在一种
饿死(Starvation)
的现象,一个线程被饿死,是说它的优先级较低,在它执行之前,总是有较高优先级的线程要执行,因此这个低优先级始终无法执行。当一个CPU密集型的线程获得较高的优先级时,许多低优先级的进程就很可能饿死。而一个高优先级的IO密集型线程由于大部分时间都处于等待状态,因此相对不容易造成其他线程饿死。为了避免饿死现象,调度系统常常会逐步提开那些等待了过长时间的得不到执行的线程的优先级。在这样的手段下,一个线程只要等待足够长的时间,其优先级一定会提高到足够让它执行的程度。
可抢占线程和不可抢占线程
之前有说到,线程在用尽时间片之后会被强制剥夺继续执行的权利,而进入就绪状态,这个过程叫做抢占(Preemption),即之后执行的别的线程抢占了当前线程。在早期的一些系统里,线程是不可抢占的。线程必须手动发出一个放弃执行的命令,才能让其他的线程得到执行。在这样的调度模型下,线程必须主动进入就绪状态,而不是靠时间片用尽来被强制进入。如果线程始终拒绝进入就绪状态,并且也不进行任何的等待操作,那么其他的线程将永远无法执行。
在不可抢占线程中,线程主动放弃执行只有两种情况:
- 当线程试图等待某事件时(I/O等)。
- 线程主动放弃时间片。
显而易见,在不可抢占线程执行的时候,有一个显著的特点,那就是线程调度的时机是准确的,线程调度只会发生在线程主动放弃执行或线程等待某事件的时候。这样可以避免一些因为抢占式线程里调度时机不确定而产生的问题(见下部分学习内容:线程安全)。
非抢占式线程已经十分少见。
革命尚未成功,笑笑还需努力!文章还会持续完善!
如果有学习Java的小伙伴想了解Java中的多线程,可以参考以下博文,希望对你有所帮助:
Java_多线程(一)
Java_多线程(二)