前面的文章,我们讲了什么Python的许多基础知识,现在我们开始对Python并发编程进行学习。我们将探讨 Python 中线程和多线程的使用。帮助大家更好地理解如何使用这种技术。
目录
在编程中,并发编程允许程序同时执行多个独立的任务,这些任务可以在同一时间段内部分地重叠执行,从而提高程序的效率和响应性。在Python 中,并发编程可以通过多种方式实现,其中包括线程(Threads)和进程(Processes)。
1. 线程(Threads)
学过操作系统的同学都知道,线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。也即是说,一个进程可以拥有多个线程,这些线程共享进程的资源,但每个线程拥有自己的执行堆栈和局部变量。相对于进程而言,线程更加轻量级,创建和销毁的开销更小。
1.1 Python 中的线程工作原理
Python 的标准库提供了 threading
模块来进行多线程编程。线程是由操作系统的线程实现来管理的,这意味着 Python 的线程可以利用操作系统的多线程功能。
Python 的全局解释器锁(Global Interpreter Lock,GIL)是一个影响多线程执行的重要因素。GIL 实际上是一个互斥锁,它确保了在解释器级别上同一时刻只有一个线程在执行 Python 字节码。也就是说,在 CPU 密集型任务中,多线程并不能充分利用多核处理器。但在 I/O 密集型任务中,多线程可以提供更好的性能,因为线程在等待 I/O 操作完成时可以让出 GIL。
线程的优势和限制:
优势 | 限制 |
---|---|
简单易用 | GIL 的影响 |
共享内存 | 线程安全 |
适用于 I/O 密集型任务 | 不适用于 CPU 密集型任务 |
2. 创建和管理线程
threading
模块,可以轻松地创建和管理线程。学习线程的知识,包括:创建线程、启动和停止线程,以及线程的生命周期和状态。下面我们一一介绍。
2.1 创建线程
首先,让我们看一下如何使用 threading
模块创建线程。
import threading
import time
def task(name, delay):
print(f"Thread {name} is starting...")
time.sleep(delay)
print(f"Thread {name} is done.")
# 创建线程
thread1 = threading.Thread(target=task, args=("Thread 1", 2))
thread2 = threading.Thread(target=task, args=("Thread 2", 1))
# 启动线程
thread1.start()
thread2.start()
# 等待线程结束
thread1.join()
thread2.join()
print("All threads are done.")
这里,我们定义了一个 task
函数作为线程的执行函数,接受线程的名称和延迟时间作为参数。然后我们创建了两个线程 thread1
和 thread2
,分别执行 task
函数,并启动它们。最后,我们等待所有线程执行完毕,并输出 "All threads are done."。
输出如下:
Thread Thread 1 is starting...
Thread Thread 2 is starting...
Thread Thread 2 is done.
Thread Thread 1 is done.
All threads are done.
2.2 线程的生命周期和状态
线程的生命周期包括创建、就绪、运行、阻塞和终止几个阶段。如下所示:
上面的例子中,我们通过 start()
方法启动了线程,使其进入就绪状态,然后线程调度器负责将其转换为运行状态,执行 task
函数。当 task
函数中的 time.sleep(delay)
被调用时,线程将进入阻塞状态,等待一定时间后再次进入就绪状态,直到任务完成。最后,通过 join()
方法等待线程结束,线程进入终止状态。
线程的状态可以