可能是 Python 线程、进程和 GIL 的最简单教程

最新推荐文章于 2025-12-05 17:02:52 发布

原创最新推荐文章于 2025-12-05 17:02:52 发布 · 236 阅读

10 ·

CC 4.0 BY-SA版权

License CC BY-NC-SA 4.0 / 自豪地采用谷歌翻译

文章标签：

#python #linux #开发语言

榛樿鍒嗙被专栏收录该内容

804 篇文章

订阅专栏

原文：towardsdatascience.com/dont-know-what-is-python-gil-this-may-be-the-easiest-tutorial-3b99805d2225

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6d36d0199643bb6e6b317a417ec341d7.png

图片由 Regina 提供，来自 Pixabay

如果你是一名 Python 学习者，请不要害怕，因为这篇文章旨在用最简单的方式向你解释什么是 GIL。当然，我们必须从解释线程和进程开始。不用担心，我会尽力让每个人都能理解，尽管这可能会牺牲一些定义的准确性。

现在我们应该开始了。

1. Python 中的多线程

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/882227441de7b5d2a4ca287630d687e5.png

图片由 Steen Jepsen 提供，来自 Pixabay

一些概念

多线程是最常见的编程技术之一，Python 中也存在这种技术。

它允许我们同时运行多个操作。通常，多线程可以提高 CPU 的使用效率。此外，大多数 I/O 任务都可以从并发运行的线程中受益。

请不要对概念“进程”和“线程”感到困惑。进程将分配一定的内存，并且在操作系统中与其他进程完全隔离。因此，在我们的操作系统中，一个程序崩溃通常不会影响其他程序。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/7581ccd66d78547ddf5cf61e0c3b5d98.png

进程和线程之间的关系

一个进程可能在其下运行多个线程，共享许多相同的资源，如内存。因此，一个线程崩溃将导致整个进程崩溃。因为线程之间共享内存，这也可能在进程中引起麻烦。我稍后会演示。

代码示例

现在，让我们看看如何使用多线程技术编写 Python 代码。

首先，让我们导入 Python 内置的threading模块。

import threading

为了能够测试多线程，让我们定义一个足够简单但需要一些时间的函数。

def compute():
    for _ in range(100000000):
        pass

这个函数什么都不做，它只是执行一个循环 100 亿次，每次循环不进行任何计算。

然后，假设我们想要在两个不同的线程中运行compute()函数两次。我们可以在 Python 中使用threading.Thread()创建一个新的线程。之后，target=compute告诉线程执行compute()函数。

threading.Thread(target=compute)

现在，让我们创建两个线程t1和t2，然后要求它们执行compute()函数。

t1 = threading.Thread(target=compute)
t2 = threading.Thread(target=compute)
t1.start()
t2.start()
t1.join()
t2.join()

在上面的代码中，t1.start()将告诉线程开始执行分配给它的任何任务。在我们的例子中，它是执行compute()函数。同样，我们通过运行代码t2.start()立即让t2开始。

当你看到代码t1.join()时，这意味着我们希望进程等待线程t1完成。换句话说，我们希望在上面的代码中等待t1和t2都完成它们的工作。

2. Python 中的 GIL 是什么？

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/aa145ee21466aa2d9b781f2578647bfd.png

图片由Manfred Richter提供，来自Pixabay

GIL 代表全局解释器锁。这就是你需要了解的文本概念。要理解它，请查看下面的图示。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c8bcfc9f95ae00e63f3f6fd316b823fc.png

Python 中 GIL 的工作原理

如上图所示，GIL 只允许一次只有一个线程运行。当一个线程请求开始工作时，它会锁定其他线程。

因此，尽管我们让线程 1 和线程 2 同时运行，但它们根本无法利用多个 CPU 核心，因此对性能的提升几乎没有帮助。事实上，大多数情况下可能会更糟。

为什么 Python 有这样一个机制？以下是一些原因。

线程安全

由于多线程共享相同的内存和 I/O，可能会出现“线程竞态”问题。以下是一个典型的例子。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/25a3cdb9d2ac91693e4e25f7bd56e895.png

线程不安全的典型示例

在开始时，两种情况下x=1都是相同的，并且值已经在内存中。然后，由于两个线程是并行运行的，我们不知道哪个先运行。最终，x的结果将变得神秘。这是线程不安全的一个典型例子。

历史问题

在 Python 刚出现的时候，还没有出现多核 CPU 的通用 CPU。因此，拥有 GIL 的好处绝对超过了它的限制。

例如，CPython 中的内存管理将会简单得多，这使得垃圾回收过程变得直接。同时，它避免了由线程不安全引起的许多复杂错误，例如竞态条件。

展示了限制

现在，随着 CPU 技术的发展和 Python 在数据分析/科学/工程领域的广泛应用，GIL 已经成为 Python 性能和灵活性的主要瓶颈。

然而，一些学习者可能会争论说多进程可以是多线程的替代品。在下一节中，我将尝试解释什么是多进程以及为什么它不同。

3. 为什么多进程不同？

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0829b7c17c9ddfbd66847c2d568abdbd.png

图片由 Lucent_Designs_dinoson20 来自 Pixabay 提供

再次强调，我不喜欢写很多文字来讲述枯燥的知识。请参见以下图表。它展示了单线程、多线程和多进程之间的差异。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/650a30d5e2481b35b28aebdca676ee1f.png

多线程和多进程之间的差异

在广义上，使用 GIL 的多线程可以完成与单线程相似数量的任务。然而，多进程可以绕过多线程的限制。在同一时间段内，它可能能够完成比其他两种方法多一倍的任务量。

证明理论

让我们开始编码！

由于在交互式环境（如 Jupyter Notebook）中使用多进程并不容易，让我们编写一个最简单的 Python 脚本文件来比较这三种场景：

单线程
多线程
单线程的多进程

首先，我们需要导入相关模块。然后，让我们使用上面用过的相同函数 compute()。为了方便起见，我再次粘贴代码在这里。

from threading import Thread
from multiprocessing import Process
import time

def compute():
    for _ in range(100000000):
        pass

单线程的代码非常简单，只需运行函数两次即可，因为在其他两个例子中，我们需要将它们分别放入两个不同的线程和进程中。

# Single Threads
start = time.time()

compute()
compute()

end = time.time()
print("Time taken with single threads:", end - start)

多线程的代码与上一个例子相同。为了方便起见，我再次粘贴代码在这里。

# Multi-Threading
start = time.time()

t1 = Thread(target=compute)
t2 = Thread(target=compute)
t1.start()
t2.start()
t1.join()
t2.join()

end = time.time()
print("Time taken with multi-threads:", end - start)

多进程的代码与多线程的代码基本相同。唯一的区别是使用 Process 工厂类。

# Multi-Processing
start = time.time()

p1 = Process(target=compute)
p2 = Process(target=compute)
p1.start()
p2.start()
p1.join()
p2.join()

end = time.time()
print("Time taken with multi-process:", end - start)