一般情况下,我们只有当一个脚本在单进程的情况下测试通过后,才会利用多进程对其进行加速,这样避免了在多进程的情况下代码触发异常;但是我们总是无法保证脚本不会出现预期之外的bug,所以有时候在多进程中出现了bug,对其有效的debug是很有必要的。
在python多进程编程pool中,如果我们没有做特别的处理,那么当子进程报错了,是不会主动显示出来的,除非我们调用多进程结果的get函数,那么如果子进程运行失败的话,是会返回具体的异常的。问题在于,这个异常返回的信息还不够,因为get函数返回的异常信息是很有限的,只有异常的类型,我们并无法得知是哪行代码触发了该异常,所以如果仅仅靠get函数返回的信息来debug是很累的。
python多进程下的debug思路是用traceback这个标准模块追踪详细的异常信息,然后把获取的异常信息保存下来并作为结构返回,这样当我们利用get函数获取结果的时候,就可以得到详细的报错信息,从而可以进行异常追踪,快速准确的定位异常。如下所示,我们只需要在目标函数中加入异常捕捉,然后在捕捉到异常后利用traceback.format_exc函数获取异常的堆栈追踪的详细信息,这个信息是字符串,将其保存在error变量中并返回,这样当我们调用这个进程结果的get函数时就可以得到这个具体的异常信息,然后只要将其print出来就可以显示规范缩进后的异常堆栈追踪的内容。
import traceback
# func为子进程的目标函数
def func():
try:
do something
except:
error=traceback.fromat_exc()
print(error)
return error
对于python的multiprocessing模块的Pool对象,在python3.x版本中,其apply_async函数中还有一个error_callback参数,我们可以给该参数赋予一个函数,表示当子进程触发异常时,就会执行该函数,该函数应该以异常信息的字符串为参数,子进程会自动的把异常信息作为参数传给该回调函数。这个参数的好处在于,只要子进程一触发异常,就会自动的立马执行该函数,即时处理异常,而且也具有明确的意义,即处理异常。如下所示,可以定义一个handle_error函数,并传给error_callback参数,这样如果子进程触发异常,便可以即时的在终端打印出来详细的异常信息。
import traceback
import sys
# func为子进程的目标函数
def func():
try:
do something
except:
error=traceback.fromat_exc()
raise Exception(error) # 触发一个异常,为了把信息error传给handle_error函数
def handle_error(error):
print(error)
sys.stdout.flush()