python线程池ThreadPoolExecutor和进程池ProcessPoolExecutor使用

Python线程池与进程池介绍
博客主要介绍了Python编程中的线程池ThreadPoolExecutor和进程池ProcessPoolExecutor,聚焦于信息技术领域中Python多线程和多进程的相关内容。

1、线程池ThreadPoolExecutor

"""
    线程池,使用单核CPU
"""
from concurrent.futures import ThreadPoolExecutor
import random
import time
import threading
from datetime import datetime
import multiprocessing
import numpy as np


def print_func(x):
    sleep_time = random.randint(1, 10)
    sleep_time = 2
    time.sleep(sleep_time)
    # 线程中进行大计算量,观察CPU使用情况,使用单核CPU
    x1 = np.random.rand(1000, 1000)
    x2 = np.random.rand(1000, 1000)
    y = np.matmul(x1, x2)
    print("current time: {}, process id: {}, thread id: {}, get: {}, sleep time: {}s".format(
        datetime.now().strftime("%Y-%m-%d %H:%M:%S"), multiprocessing.current_process().ident,
        threading.currentThread().ident,
        x, sleep_time))
    return x


print("strart time: {}".format(datetime.now().strftime("%Y-%m-%d %H:%M:%S")))
pool = ThreadPoolExecutor(max_workers=4)
task_list = []
for i in range(50):
    # 默认异步提交任务到线程池
    task = pool.submit(print_func, i)
    task_list.append(task)
    """
    status = task.done()
    # 同步等待线程返回结果
    while not status:
        status = task.done()
    # 线程执行完成后,done()返回为True,获取线程返回结果
    result = task.result()
    # print("result: {}".format(result))
    """
for task in task_list:
    while not task.done():
        continue
    print(task.result())
end_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
print("end time: {}".format(end_time))

2、进程池ProcessPoolExecutor

"""
    进程池,使用多核CPU
"""
from concurrent.futures import ProcessPoolExecutor
import random
import time
import threading
from datetime import datetime
import multiprocessing
import numpy as np


def print_func(x):
    sleep_time = random.randint(1, 10)
    sleep_time = 2
    time.sleep(sleep_time)
    x1 = np.random.rand(1000, 1000)
    x2 = np.random.rand(1000, 1000)
    y = np.matmul(x1, x2)

    print("current time: {}, process id: {}, thread id: {}, get: {}, sleep time: {}s".format(
        datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
        multiprocessing.current_process().ident,
        threading.currentThread().ident,
        x, sleep_time))
    return x


if __name__ == '__main__':
    print("strart time: {}".format(datetime.now().strftime("%Y-%m-%d %H:%M:%S")))
    pool = ProcessPoolExecutor(max_workers=4)
    task_list = []
    for i in range(50):
        # 默认异步提交任务到进程池
        task = pool.submit(print_func, i)
        task_list.append(task)
        """
        status = task.done()
        # 同步等待进程返回结果
        while not status:
            status = task.done()
        # 进程执行完成后,done()返回为True,获取进程返回结果
        result = task.result()
        print("result: {}".format(result))
        """
    for task in task_list:
        while not task.done():
            continue
        print(task.result())
    end_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print("end time: {}".format(end_time))

 

 

### Python线程池进程池的概念 在 Python 的 `concurrent.futures` 模块中,线程池进程池分别通过 `ThreadPoolExecutor` `ProcessPoolExecutor` 实现。两者都允许开发者异步执行任务集合,但其底层机制不同。 #### 线程池概念 线程池是一种管理调度多个线程的方式,它可以通过重用一组预先初始化的工作线程来减少频繁创建销毁线程带来的开销。Python 提供了 `ThreadPoolExecutor` 来简化这一过程[^3]。线程池适合处理 I/O 密集型的任务,因为在这种情况下,线程可以在等待 I/O 完成的同时被其他任务使用。 #### 进程池概念 进程池则是另一种并发模型,允许多个独立的进程并行运行。由于 Python 的全局解释器锁 (GIL),单一线程无法充分利用多核 CPU 资源。因此,在需要进行大量计算的情况下,通常会选择使用进程池而不是线程池[^5]。`ProcessPoolExecutor` 是实现进程池的核心类[^4]。 --- ### 线程池进程池的区别 | 特性 | 线程池 | 进程池 | |-------------------|-----------------------------------------|---------------------------------------| | **适用场景** | 主要用于I/O密集型操作 | 更适合于CPU密集型任务 | | **性能特点** | 开销较小 | 启动成本较高 | | **资源共享方式** | 多个线程共享同一内存空间 | 每个进程拥有自己的独立地址空间 | | **通信复杂度** | 较低 | 需要额外设计跨进程间的数据交换方案 | 上述表格总结了两种模式的主要差异。值得注意的是,尽管二者功能相似——即都能提高程序效率并通过分配子单元完成工作负载平衡——但由于其实现原理上的根本区别决定了它们各自的最佳应用场景并不相同[^1][^5]。 --- ### 是否存在冲突? 理论上讲,如果合理配置参数,则不会发生直接意义上的“冲突”。然而需要注意一点:当同时启用大量的线程与进程时可能会导致操作系统层面资源耗尽问题;另外一方面来说就是对于某些特定类型的作业而言可能只适配其中一种方法而完全不适合采用另一方形式来进行优化处理[^2]。 实际上,在大多数实际开发环境中,可以根据具体需求选择合适的工具而不必担心相互干扰的情况出现。例如,在 Web 应用服务器端接收请求后转交给后台做进一步数据加工分析这样的业务流程里头就可以既利用到前者快速响应前端交互的优势又能借助后者强大的数值运算能力达成整体效能最大化的目的。 --- ### 示例代码对比 以下是两个简单的例子展示如何在线程池进程池之间切换: #### 使用线程池的例子: ```python from concurrent.futures import ThreadPoolExecutor import time def io_bound_task(seconds): print(f"Sleeping for {seconds} seconds...") time.sleep(seconds) with ThreadPoolExecutor(max_workers=3) as executor: futures = [executor.submit(io_bound_task, sec) for sec in range(1, 6)] ``` #### 使用进程池的例子: ```python from concurrent.futures import ProcessPoolExecutor import math def cpu_bound_task(x): return sum(math.sqrt(i * i + j * j) for i in range(x) for j in range(x)) if __name__ == '__main__': with ProcessPoolExecutor(max_workers=4) as executor: results = list(executor.map(cpu_bound_task, [1000]*8)) print(results) ``` 这两个脚本展示了不同类型的操作应选用不同的执行策略以获得最佳效果。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值