Python 中 concurrent.futures 模块使用说明
转载请注明出处:https://blog.youkuaiyun.com/jpch89/article/details/87643972
文章目录
0. 参考资料
1. 概述
concurrent.futures
是 3.2
中引入的新模块,它为异步执行可调用对象提供了高层接口。
可以使用 ThreadPoolExecutor
来进行多线程编程,ProcessPoolExecutor
进行多进程编程,两者实现了同样的接口,这些接口由抽象类 Executor
定义。
这个模块提供了两大类型,一个是执行器类 Executor
,另一个是 Future
类。
执行器用来管理工作池,future
用来管理工作计算出来的结果,通常不用直接操作 future
对象,因为有丰富的 API
。
2. Executor Object 执行器对象
concurrent.futures.Executor
类
这个抽象类提供了一系列方法,可以用于异步执行调用。
它不能直接使用,只能通过子类化出来的具体类来使用。
它定义的方法有:
submit(fn, *args, **kwargs)
安排可调用对象 fn
以 fn(*args, **kwargs)
的形式执行,并返回 Future
对象来表示它的执行。
with ThreadPoolExecutor(max_workers=1) as executor:
future = executor.submit(pow, 323, 1235)
print(future.result())
map(func, *iterables, timeout=None, chunksize=1)
类似内置函数 map(func, *iterables)
,但是有两点不同:
- 立即获取
iterables
而不会惰性获取; - 异步执行
func
,并支持多次并发调用。
它返回一个迭代器。
从调用 Executor.map()
开始的 timeout
秒之后,如果在迭代器上调用了 __next__()
并且无可用结果的话,迭代器会抛出 concurrent.futures.TimeoutError
异常。
timeout
秒数可以是浮点数或者整数,如果设置为 None
或者不指定,则不限制等待时间。
如果 func
调用抛出了异常,那么该异常会在从迭代器获取值的时候抛出。
当使用 ProcessPoolExecutor
的时候,这个方法会把 iterables
划分成多个块,作为独立的任务提交到进程池。这些块的近似大小可以通过给 chunksize
指定一个正整数。对于很长的 iterables
,使用较大的 chunksize
而不是采用默认值 1
,可以显著提高性能。对于 ThreadPoolExecutor
,chunksize
不起作用。
chunksize
是3.5
加入的新参数。
注意:不管并发任务的执行次序如何,map
总是基于输入顺序来返回值。map
返回的迭代器,在主程序迭代的时候,会等待每一项的响应。
shutdown(wait=True)
告诉执行器 executor
在当前所有等待的 future
对象运行完毕后,应该释放执行器用到的所有资源。
在 shutdown
之后再调用 Executor.submit()
和 Executor.map()
会报运行时错误 RuntimeError
。
如果 wait
为 True
,那么这个方法会在所有等待的 future
都执行完毕,并且属于执行器 executor
的资源都释放完之后才会返回。
如果 wait
为 False
,本方法会立即返回。属于执行器的资源会在所有等待的 future
执行完毕之后释放。
不管 wait
取值如何,整个 Python
程序在等待的 future
执行完毕之前不会退出。
你可以通过 with
语句来避免显式调用本方法。with
语句会用 wait=True
的默认参数调用 Executor.shutdown()
方法。
import shutil
with ThreadPoolExecutor(max_workers=4) as e:
e.submit(shutil.copy, 'src1.txt', 'dest1.txt')
e.submit(shutil.copy, 'src2.txt', 'dest2.txt')
e.submit(shutil