【Python并发编程】多线程与多进程，提升程序性能！

最新推荐文章于 2025-05-27 11:16:59 发布

萧鼎

最新推荐文章于 2025-05-27 11:16:59 发布

阅读量1.2k

点赞数 9

CC 4.0 BY-SA版权

分类专栏： python基础到进阶教程文章标签： python java android

本文链接：https://blog.youkuaiyun.com/liaoqingjian/article/details/143034045

python基础到进阶教程专栏收录该内容

202 篇文章

订阅专栏

【Python并发编程】多线程与多进程，提升程序性能！

在现代计算中，程序的执行效率和性能是关键指标，特别是当程序需要处理大量数据或执行复杂的任务时。Python 提供了多线程和多进程编程的工具，允许我们编写并发代码，从而提升程序的执行效率。在这篇博客中，我们将探讨 Python 并发编程的概念，重点讨论多线程与多进程的使用场景和实现方式，并通过代码示例展示如何在实际项目中利用这些技术提升性能。

什么是并发编程？
Python 的 GIL 与并发编程的关系
多线程与多进程的区别
Python 中的线程池与进程池
使用 threading 模块实现多线程
使用 multiprocessing 模块实现多进程
I/O 密集型任务中的多线程应用
CPU 密集型任务中的多进程应用
多线程与多进程的同步与通信
并发编程中的常见问题与解决方案

1. 什么是并发编程？

并发编程是指通过让程序的多个部分同时执行，来提升效率和性能的技术。在传统的单线程程序中，任务按顺序执行，这意味着一个任务的执行会阻塞其他任务。而并发编程允许任务在同一时间段内“并行”或“交替”执行，以提高程序的响应速度。

在 Python 中，并发编程的实现主要通过两种方式：

多线程（multithreading）：在同一个进程中创建多个线程，线程共享相同的内存空间。
多进程（multiprocessing）：通过创建多个进程，每个进程有自己独立的内存空间。

2. Python 的 GIL 与并发编程的关系

Python 中有一个著名的概念叫做 GIL（Global Interpreter Lock，全局解释器锁）。GIL 是为了防止多个线程同时执行 Python 字节码，导致竞争条件问题。

由于 GIL 的存在，Python 多线程在 CPU 密集型任务中并不能真正利用多核 CPU 的性能。在这种情况下，多进程通常是更好的选择，因为每个进程都有独立的 GIL 锁，能够充分利用多核 CPU。

然而，在 I/O 密集型任务（如网络请求、文件操作等）中，多线程仍然能够有效地提高性能。
在这里插入图片描述

3. 多线程与多进程的区别

多线程：

线程是操作系统调度的最小单位。
多个线程共享同一进程的内存空间，切换开销较低。
适用于 I/O 密集型任务。
由于 GIL，Python 的多线程在 CPU 密集型任务中无法有效并行。

多进程：

进程是操作系统调度的独立单位，每个进程有自己独立的内存空间。
进程间的内存独立，因此通信和数据共享相对复杂。
适用于 CPU 密集型任务。
可以充分利用多核 CPU，提高程序的并行计算能力。

4. Python 中的线程池与进程池

线程池和进程池是为了避免频繁创建和销毁线程或进程带来的开销。通过池化技术，可以复用现有的线程或进程资源，从而提高性能。

Python 提供了 concurrent.futures 模块，用于简化线程池和进程池的创建和管理。

线程池示例：

from concurrent.futures import ThreadPoolExecutor

def task(n):
    print(f"Task {n} is running")
    return n * 2

# 创建线程池
with ThreadPoolExecutor(max_workers=5) as executor:
    results = executor.map(task, range(10))

print(list(results))

进程池示例：

from concurrent.futures import ProcessPoolExecutor

def task(n):
    print(f"Task {n} is running")
    return n * 2

# 创建进程池
with ProcessPoolExecutor(max_workers=5) as executor:
    results = executor.map(task, range(10))

print(list(results))

在这里插入图片描述

5. 使用 `threading` 模块实现多线程

Python 的 threading 模块是实现多线程的基础模块。使用它，我们可以轻松创建和管理线程。

基本多线程示例：

import threading

def print_numbers():
    for i in range(5):
        print(i)

# 创建线程
thread1 = threading.Thread(target=print_numbers)
thread2 = threading.Thread(target=print_numbers)

# 启动线程
thread1.start()
thread2.start()

# 等待线程结束
thread1.join()
thread2.join()

代码解析：

Thread(target=func)：创建一个线程，目标是 func 函数。
start()：启动线程。
join()：等待线程结束。

6. 使用 `multiprocessing` 模块实现多进程

multiprocessing 模块允许我们创建多个进程，适用于 CPU 密集型任务。

基本多进程示例：

import multiprocessing

def print_numbers():
    for i in range(5):
        print(i)

# 创建进程
process1 = multiprocessing.Process(target=print_numbers)
process2 = multiprocessing.Process(target=print_numbers)

# 启动进程
process1.start()
process2.start()

# 等待进程结束
process1.join()
process2.join()

代码解析：

Process(target=func)：创建一个新的进程，目标是 func 函数。
start()：启动进程。
join()：等待进程结束。

7. I/O 密集型任务中的多线程应用

I/O 密集型任务，如网络请求、文件操作、数据库查询等，花费的大部分时间是在等待 I/O 完成。在这些场景下，多线程可以有效提高性能，因为线程可以在等待 I/O 的时候切换执行其他任务。

示例：多线程处理多个网络请求

import threading
import requests

def fetch_url(url):
    response = requests.get(url)
    print(f"URL: {url}, Status Code: {response.status_code}")

urls = [
    'https://www.google.com',
    'https://www.yahoo.com',
    'https://www.github.com'
]

threads = []
for url in urls:
    thread = threading.Thread(target=fetch_url, args=(url,))
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

在上述代码中，多个网络请求通过多线程同时执行，大大减少了总的等待时间。
在这里插入图片描述

8. CPU 密集型任务中的多进程应用

对于 CPU 密集型任务，例如数学计算、数据处理等，多线程由于 GIL 的限制无法充分利用多核 CPU，因此多进程是更好的选择。

示例：多进程计算大数组的平方

import multiprocessing

def square_numbers(numbers):
    return [n * n for n in numbers]

if __name__ == '__main__':
    numbers = list(range(1000000))
    
    # 将数组分成两部分，分别交给两个进程处理
    p1 = multiprocessing.Process(target=square_numbers, args=(numbers[:500000],))
    p2 = multiprocessing.Process(target=square_numbers, args=(numbers[500000:],))
    
    p1.start()
    p2.start()
    
    p1.join()
    p2.join()

代码解析：

进程 p1 和 p2 分别处理数组的一部分，利用多核 CPU 的能力并行计算，提高了计算效率。

9. 多线程与多进程的同步与通信

在多线程或多进程环境中，当多个任务需要共享数据时，可能会发生竞争条件。这时需要使用同步机制来确保数据的正确性。常用的同步工具包括锁、信号量和条件变量。

多线程同步示例：

import threading

counter = 0
lock = threading.Lock()

def increment_counter():
    global counter
    with lock:
        counter += 1

threads = []
for _ in range(100):
    thread = threading.Thread(target=increment_counter)
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

print(f"Final counter value: {counter}")

多进程通信示例（使用队列）：

import multiprocessing

def worker(queue):
    queue.put("Message from process")

if __name__ == '__main__':
    queue = multiprocessing.Queue()

    process = multiprocessing.Process(target=worker, args=(queue,))
    process.start()
    process.join()

    print(queue.get())