简介
最近使用了 python 多进程中的共享列表和字典,发现在某些情况下出现:子进程中对共享列表/字典进行修改,但最终并没有起效
总结
在 python 多进程中,对共享列表/字典中的元素进行操作是不会起效的。
先举一个起效的正常用法:
import multiprocessing
def func(input_list, input_dict, i, k):
input_list.append(i)
input_dict[k] = i
if __name__ == '__main__':
a_list = multiprocessing.Manager().list()
a_dict = multiprocessing.Manager().dict()
pool = multiprocessing.Pool(processes=3)
pool.apply_async(func, (a_list, a_dict, 0, 'a'))
pool.apply_async(func, (a_list, a_dict, 1, 'b'))
pool.apply_async(func, (a_list, a_dict, 2, 'c'))
pool.close()
pool.join()
print(a_list)
print(a_dict)
# 输出
[0, 2, 1]
{'a': 0, 'c': 2, 'b': 1}
如果我们对列表/字典中的元素进行操作:
import multiprocessing
def func(input_list, input_dict, i, k):
input_list[i].append(i)
input_dict[k].append(i)
if __name__ == '__main__':
a_list = multiprocessing.Manager().list([[], [], []])
a_dict = multiprocessing.Manager().dict({'a': [], 'b': [], 'c': []})
pool = multiprocessing.Pool(processes=3)
pool.apply_async(func, (a_list, a_dict, 0, 'a'))
pool.apply_async(func, (a_list, a_dict, 1, 'b'))
pool.apply_async(func, (a_list, a_dict, 2, 'c'))
pool.close()
pool.join()
print(a_list)
print(a_dict)
# 输出
[[], [], []]
{'a': [], 'b': [], 'c': []}
可以看到,在子进程中对共享列表/字典的操作是无效的。事实上,即使在主进程这样操作也是无效的:
import multiprocessing
if __name__ == '__main__':
a_list = multiprocessing.Manager().list([[], [], []])
a_dict = multiprocessing.Manager().dict({'a': [], 'b': [], 'c': []})
a_list[0].append(1)
a_dict['a'].append(1)
print(a_list)
print(a_dict)
# 输出
[[], [], []]
{'a': [], 'b': [], 'c': []}
在Python多进程中,直接修改共享列表和字典的元素通常不会生效。通过`multiprocessing.Manager()`创建的共享数据结构,如列表和字典,其内部操作需要特殊处理。例如,直接对列表元素调用`append()`或字典元素调用`append()`将不会更新主进程中的数据。正确的做法是通过`Manager()`确保所有操作都是对共享对象的引用,而非其副本。文章通过实例展示了正确和错误的使用方式,强调了在多进程环境下对共享数据结构进行修改的注意事项。
3767

被折叠的 条评论
为什么被折叠?



