项目中使用Python的multiprocess模块,构造了一个进程池来执行并行任务。子进程的任务中使用了commands模块来调用C++程序执行实际的计算任务(相当于又fork出了一个进程)。在使用过程中发现会出现子进程卡死的问题。
网上查找资料发现,首先logging模块本身是不支持多进程的,即在multiprocess中不能直接使用logging,可以参考官方文档。更严重的问题是,由于Python内置模块的bug,混用multiprocess、logging和fork的问题会导致进程hang死,可以参考这里,或者google上搜索获取更多的讨论。
为了解决这个问题,我考虑有两个方式:(1)将python脚本封装成独立的子任务,在shell(或者其他语言)中使用进程池,来调起python任务;(2)将Python调起multiprocess前的模块尽可能简单化,目的是尽量避免使用logging模块。
实际试验中方法(2)几乎无效,因为很难完全避免Logging模块。我最终采用的方案1来解决问题。
在使用Python的multiprocess模块时遇到子进程卡死的问题,探究原因在于logging模块与fork的冲突导致进程hang死。本文介绍了两种解决方案:一是通过Shell或其他语言调用独立的Python脚本;二是简化multiprocess前的模块,避免使用logging。最终采用第一种方案成功解决了问题。

被折叠的 条评论
为什么被折叠?



