实例讲解Python中的多线程、多进程如何应对IO密集型任务、计算密集型任务

本文通过实际案例对比分析了Python中多线程与多进程在处理IO密集型任务及计算密集型任务上的表现,揭示了多线程与多进程在不同场景下的适用性和效率差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言:多线程就是,你一边吃饭一边看电视还一边说话。而Python的多线程为了线程安全,整了个GIL(GIL:又叫全局解释器锁,每个线程在执行的过程中都需要先获取GIL,保证同一时刻只有一个线程在运行,目的是解决多线程同时竞争程序中的全局变量而出现的线程安全问题。),在计算密集方面一次只做一件事,只有I/O密集方面才能真正实现多线程。即,你不能一边吃饭一边看电视一边说话,但是可以做到先烧水然后去洗漱,洗漱完水已经开了可以喝水了。在这里,烧水就是一种I/O密集的工作。Python中的多线程是假的多线程

在Python中,多线程常常被用于爬虫,因为HTTP请求和响应是个I/O密集的工作。而计算密集的工作往往会使用多进程来实现。

一、IO密集型任务:

import multiprocessing
import time
import threading 
# 定义全局变量Queue
g_queue = multiprocessing.Queue()
 
# 首先定义一个队列,并定义初始化队列的函数:
def init_queue():
    print("init g_queue start")
    while not g_queue.empty():
        g_queue.get()
    for _index in range(10):
        g_queue.put(_index)
    print("init g_queue end")
    return

# 定义一个IO密集型任务:利用time.sleep(),分别从队列中获取任务数据
def task_io(task_id):
    print("IOTask[%s] start" % task_id)
    while not g_queue.empty():
        time.sleep(1)
        try:
            data = g_queue.get(block=True, timeout=1)
            print("IOTask[%s] get data: %s" % (task_id, data))
        except Exception as excep:
            print("IOTask[%s] error: %s" % (task_id, str(excep)))
    print("IOTask[%s] end" % task_id)
    return
 
if __name__ == '__main__':
    print("cpu count:", multiprocessing.cpu_count(), "\n")
 
    print("========== 直接执行IO密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    task_io(0)
    print("结束:", time.time() - time_0, "\n")
 
    print("========== 多线程执行IO密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    thread_list = [threading.Thread(target=task_io, args=(i,)) for i in range(5)]
    for t in thread_list:
        t.start()
    for t in thread_list:
        if t.is_alive():
            t.join()
    print("结束:", time.time() - time_0, "\n")
 
    print("========== 多进程执行IO密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    process_list = [multiprocessing.Process(target=task_io, args=(i,)) for i in range(multiprocessing.cpu_count())]
    for p in process_list:
        p.start()
    for p in process_list:
        if p.is_alive():
            p.join()
    print("结束:", time.time() - time_0, "\n")

打印:

[root@localhost demo01]# python3 text1109.py 
cpu count: 4 

========== 直接执行IO密集型任务 ==========
init g_queue start
init g_queue end
IOTask[0] start
IOTask[0] get data: 0
IOTask[0] get data: 1
IOTask[0] get data: 2
IOTask[0] get data: 3
IOTask[0] get data: 4
IOTask[0] get data: 5
IOTask[0] get data: 6
IOTask[0] get data: 7
IOTask[0] get data: 8
IOTask[0] get data: 9
IOTask[0] end
结束: 10.016204833984375 

========== 多线程执行IO密集型任务 ==========
init g_queue start
init g_queue end
IOTask[0] start
IOTask[0] end
IOTask[1] start
IOTask[3] start
IOTask[2] start
IOTask[4] start
IOTask[1] get data: 0
IOTask[2] get data: 1
IOTask[3] get data: 2
IOTask[4] get data: 3
IOTask[1] get data: 4
IOTask[2] get data: 5
IOTask[4] get data: 6
IOTask[3] get data: 7
IOTask[1] get data: 8
IOTask[2] get data: 9
IOTask[2] end
IOTask[3] error: 
IOTask[3] end
IOTask[4] error: 
IOTask[4] end
IOTask[1] error: 
IOTask[1] end
结束: 5.012259006500244 

========== 多进程执行IO密集型任务 ==========
init g_queue start
init g_queue end
IOTask[0] start
IOTask[1] start
IOTask[2] start
IOTask[3] start
IOTask[0] get data: 0
IOTask[1] get data: 1
IOTask[2] get data: 2
IOTask[3] get data: 3
IOTask[0] get data: 4
IOTask[1] get data: 5
IOTask[2] get data: 6
IOTask[3] get data: 7
IOTask[0] get data: 8
IOTask[1] get data: 9
IOTask[1] end
IOTask[3] error: 
IOTask[3] end
IOTask[2] error: 
IOTask[2] end
IOTask[0] error: 
IOTask[0] end
结束: 5.0164711475372314 

结果说明:

对于IO密集型任务

  • 直接执行用时:10.016204833984375秒
  • 多线程执行用时:5.012259006500244秒
  • 多进程执行用时:5.0164711475372314秒

说明多线程适合IO密集型任务

二、计算密集型任务:

import multiprocessing
import time
import threading 
# 定义全局变量Queue
g_queue = multiprocessing.Queue()
 
def init_queue():
    print("init g_queue start")
    while not g_queue.empty():
        g_queue.get()
    for _index in range(10):
        g_queue.put(_index)
    print("init g_queue end")
    return

g_search_list = list(range(10000))
# 定义一个计算密集型任务:利用一些复杂加减乘除、列表查找等
def task_cpu(task_id):
    print("CPUTask[%s] start" % task_id)
    while not g_queue.empty():
        count = 0
        for i in range(10000):
            count += pow(3*2, 3*2) if i in g_search_list else 0
        try:
            data = g_queue.get(block=True, timeout=1)
            print("CPUTask[%s] get data: %s" % (task_id, data))
        except Exception as excep:
            print("CPUTask[%s] error: %s" % (task_id, str(excep)))
    print("CPUTask[%s] end" % task_id)
    return task_id

if __name__ == '__main__':
    print("cpu count:", multiprocessing.cpu_count(), "\n")
 
    print("========== 直接执行CPU密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    task_cpu(0)
    print("结束:", time.time() - time_0, "\n")
 
    print("========== 多线程执行CPU密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    thread_list = [threading.Thread(target=task_cpu, args=(i,)) for i in range(5)]
    for t in thread_list:
        t.start()
    for t in thread_list:
        if t.is_alive():
            t.join()
    print("结束:", time.time() - time_0, "\n")
 
    print("========== 多进程执行cpu密集型任务 ==========")
    init_queue()
    time_0 = time.time()
    process_list = [multiprocessing.Process(target=task_cpu, args=(i,)) for i in range(multiprocessing.cpu_count())]
    for p in process_list:
        p.start()
    for p in process_list:
        if p.is_alive():
            p.join()
    print("结束:", time.time() - time_0, "\n")

打印:

[root@localhost demo01]# python3 text1109.py 
cpu count: 4 

========== 直接执行CPU密集型任务 ==========
init g_queue start
init g_queue end
CPUTask[0] start
CPUTask[0] get data: 0
CPUTask[0] get data: 1
CPUTask[0] get data: 2
CPUTask[0] get data: 3
CPUTask[0] get data: 4
CPUTask[0] get data: 5
CPUTask[0] get data: 6
CPUTask[0] get data: 7
CPUTask[0] get data: 8
CPUTask[0] get data: 9
CPUTask[0] end
结束: 5.545855522155762 

========== 多线程执行CPU密集型任务 ==========
init g_queue start
init g_queue end
CPUTask[0] start
CPUTask[1] start
CPUTask[2] start
CPUTask[4] start
CPUTask[3] start
CPUTask[0] get data: 0
CPUTask[2] get data: 1
CPUTask[1] get data: 2
CPUTask[4] get data: 3
CPUTask[3] get data: 4
CPUTask[0] get data: 5
CPUTask[2] get data: 6
CPUTask[1] get data: 7
CPUTask[3] get data: 8
CPUTask[4] get data: 9
CPUTask[4] end
CPUTask[2] error: 
CPUTask[2] end
CPUTask[1] error: 
CPUTask[1] end
CPUTask[0] error: 
CPUTask[0] end
CPUTask[3] error: 
CPUTask[3] end
结束: 9.969066858291626 

========== 多进程执行cpu密集型任务 ==========
init g_queue start
init g_queue end
CPUTask[0] start
CPUTask[1] start
CPUTask[3] start
CPUTask[2] start
CPUTask[0] get data: 0
CPUTask[1] get data: 1
CPUTask[3] get data: 2
CPUTask[2] get data: 3
CPUTask[0] get data: 4
CPUTask[1] get data: 5
CPUTask[3] get data: 6
CPUTask[2] get data: 7
CPUTask[0] get data: 8
CPUTask[1] get data: 9
CPUTask[1] end
CPUTask[3] error: 
CPUTask[3] end
CPUTask[2] error: 
CPUTask[2] end
CPUTask[0] error: 
CPUTask[0] end
结束: 3.3789467811584473 

结果说明:

对于计算密集型任务

  • 直接执行用时:5.545855522155762秒
  • 多线程执行用时:9.969066858291626秒
  • 多进程执行用时:3.3789467811584473秒

说明多进程适合计算密集型任务

参考链接:
Python进阶:聊聊IO密集型任务、计算密集型任务,以及多线程、多进程
进程通信(multiprocessing.Queue)

React Hooks 是 React 16.8 中新增的特性,它可以让你在函数组件中使用 state、生命周期钩子等 React 特性。使用 Hooks 可以让你写出更简洁、可复用且易于测试的代码。 React Hooks 提供了一系列的 Hook 函数,包括 useState、useEffect、useContext、useReducer、useCallback、useMemo、useRef、useImperativeHandle、useLayoutEffect 和 useDebugValue。每个 Hook 都有特定的用途,可以帮助你处理不同的问题。 下面是 React Hooks 的一些常用 Hook 函数: 1. useState useState 是最常用的 Hook 之一,它可以让你在函数组件中使用 state。useState 接受一个初始状态值,并返回一个数组,数组的第一个值是当前 state 值,第二个值是更新 state 值的函数。 ``` const [count, setCount] = useState(0); ``` 2. useEffect useEffect 可以让你在组件渲染后执行一些副作用操作,比如订阅事件、异步请求数据等。useEffect 接受两个参数,第一个参数是一个回调函数,第二个参数是一个数组,用于控制 useEffect 的执行时机。 ``` useEffect(() => { // 这里可以执行副作用操作 }, [dependencies]); ``` 3. useContext useContext 可以让你在组件树中获取 context 的值。它接受一个 context 对象,并返回该 context 的当前值。 ``` const value = useContext(MyContext); ``` 4. useRef useRef 可以让你在组件之间共享一个可变的引用。它返回一个对象,该对象的 current 属性可以存储任何值,并在组件的生命周期中保持不变。 ``` const ref = useRef(initialValue); ref.current = value; ``` 5. useCallback useCallback 可以让你缓存一个函数,以避免在每次渲染时都创建一个新的函数实例。它接受一个回调函数和一个依赖数组,并返回一个 memoized 的回调函数。 ``` const memoizedCallback = useCallback(() => { // 这里是回调函数的逻辑 }, [dependencies]); ``` 6. useMemo useMemo 可以让你缓存一个计算结果,以避免在每次渲染时都重新计算。它接受一个计算函数和一个依赖数组,并返回一个 memoized 的计算结果。 ``` const memoizedValue = useMemo(() => computeExpensiveValue(a, b), [a, b]); ``` 以上就是 React Hooks 的一些常用 Hook 函数,它们可以帮助你更好地处理组件状态、副作用、上下文和性能优化等问题。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值