python多进程卡死_Python 多进程中使用logging导致死锁

最新推荐文章于 2024-06-06 22:13:02 发布

log边缘

最新推荐文章于 2024-06-06 22:13:02 发布

阅读量1.2k

点赞数

文章标签： python多进程卡死

本文链接：https://blog.youkuaiyun.com/weixin_42112685/article/details/113975001

版权

当Python多进程中一个线程在logging时，若通过其他线程fork子进程，可能导致子进程因无法获取logging.lock而卡死。问题源于线程锁不跨进程。解决方案包括使用spawn或forkserver启动新进程，避免资源继承。在确定无多线程锁情况下，可谨慎使用fork。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这个问题算是个很老问题了，09年的issue一直到现在还是open的状态：https://bugs.python.org/issue6721

原因

简单的说，如果主进程A中有多个线程A.t1,A.t2...，而其中有一个线程A.t1刚好在logging，此时线程锁是获取状态(对，logging是通过线程锁实现线程安全的)，同时通过另一个线程A.t2 又fork出一个子进程B的话，那么B进程初始化之后，logging.lock会是未释放的状态，此时在B里面尝试logging，B就会卡死，就算A.t1 logging完毕释放了logging.lock，B一样获取不到这个lock，因为这个线程锁不会跨进程，是不同的对象。

代码

import os

import sys

import threading

import time

import multiprocessing

class ThreadWorker(threading.Thread):

def __init__(self):

print('ThreadWorker: init')

super().__init__()

def run(self):

print('ThreadWorker: running (rlock = {0})'.format(global_rlock))

global_rlock.acquire()

print('ThreadWorker: i got lock {0}'.format(global_rlock))

time.sleep(5)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

log边缘

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用PM2运行node.js服务

yhc166188的博客

10-14

1471

为什么需要使用PM2 因为node.js 是单进程，进程被杀死后整个服务就跪了，所以需要进程管理工具，但是pm2 远远不止这些。介绍 PM2 是一个带有负载均衡功能的 Node 应用的进程管理器。当你要把你的独立代码利用全部的服务器上的所有 CPU，并保证进程永远都活着，0 秒的重载， PM2 是完美的。特性内建负载均衡（使用Node cluster 集群模块）后台运行 ...

python中多线程+多进程+logging出现子进程死锁的问题

深海微澜

04-08

3943

参考文档： https://www.ctolib.com/topics/85107.html https://twiki.cern.ch/twiki/bin/view/Main/PythonLoggingThreadingMultiprocessingIntermixedStudy https://github.com/google/python-atfork 服务采用多线程+ 多进程+ ...

参与评论您还未登录，请先登录后发表或查看评论

第二十一天Python之进程

Sunshine________的博客

09-21

762

多任务电脑中的多任务思考：为什么在下载的时候要多个任务同时下载多任务的优势多任务的最大好处是充分利用CPU资源，提高程序的执行效率 1. 多任务的概念多任务是指在同一时间内执行多个任务 2. 多任务的两种表现形式并发并行 3. 并发在一段时间内交替去执行多个任务例子：对于单核cpu处理多任务，操作系统轮流让各个任务交替执行 4. 并行在一段时间内真正的同时一起执行多个任务例子：对于多核cpu处理多任务，操作系统会给cpu的每个内核安排一个执行的任务，多个

qq_42991839的博客

09-16

2629

第一步：查看当前版本：node -v 第二步：安装n这个版本管理工具，命令n stable 第三步：通过nvm 安装 nvm install 14.17.1，注意：在执行了安装n模块：npm install -g n 后发现当前生效版本还是原来版本，原因是node默认的安装目录与使用管理工具n安装的目录不一致第四步：查看当前版本：node -v发现已经更改。 ...

node 生产的env文件怎么注入_全栈之路：使用pm2自动化部署node项目

weixin_39792472的博客

11-21

339

下载了新版本node 老版本nodejs还在问题

addction的博客

07-07

1106

因为自己是多端开发，还下着了个快应用开发工具和许多其他的工具，就没有想到是因为下载的这些工具里面自带一个node版本，最后通过使用命令行的不断查找。我这只是久久找不到问题的解决办法其中之一，可能也就少数能遇到，其他的正常去搜索别人博客就可以解决了。使用命令行查看node -v 还是当前老版本的node，这个问题浪费了我许多时间。卸载了node老版本v14，并且安装了新的node版本。有时候没反应，我最初就是因为没有反应，路径也不弹出；耐心等待就会有相关的文件了。然后查看当前版本的路径。

PYthon-multithreading-Test.rar_python_python 多线程_python多线程_多线程

09-19

此时，可以考虑使用多进程（`multiprocessing`模块）或者异步IO（`asyncio`模块）来实现并发。在测试多线程程序时，我们需要关注线程安全、死锁、资源竞争等问题。可以使用`threading.Thread.join()`等待线程结束...

马哥Linux运维 | 深入理解Python多进程：从基础到实战

csdn_xmj的博客

06-06

809

在Python中，多线程受到全局解释器锁的限制，多进程能更好地利用多核处理器，选择合适的并发编程方式可以提高程序的运行效率。通过合理的错误处理策略、使用logging和traceback记录错误信息，以及灵活运用调试工具与技术，可以更好地处理进程间的错误和调试工作，提高程序的稳定性和可靠性。总之，选择多进程可以让我们更好地利用计算资源，提高程序的运行效率，同时避免了一些多线程并发编程中的问题，是一种值得掌握的并发编程方式。通过合理设计进程之间的通信和同步机制，可以实现多进程之间的协同工作。

node和npm升级排坑（升级成功提示，但是查看版本却没有变化）

赵成默

03-03

5286

前言虽然简单，但是还是记录一下吧，怕以后还有这样子的问题 node升级简单粗暴：把原来的node文件夹删掉，去官网下载一个新的版本升级就OK了 npm 升级 npm install npm@latest -g 就可以了升级问题原来npm版本过低，想升级npm的版本，升级成功了，但是npm -v 发现版本号还是没有变化原因：存在两个npm的文件：一个是node自带的（node的npm并不是最新的）一个是 -g 全局下载的（最新）解决方法将C:\Users{你的Windo

解决Python logging模块无法正常输出日志的问题

09-17

今天小编就为大家分享一篇解决Python logging模块无法正常输出日志的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

升级npm后版本依然没有变原来是全局npm设置的锅

weixin_30611509的博客

07-31

2440

最近准备给家里的老爷机打一个 react 的环境 win7系统还不算老~ 不过！由于很多年以前装的node了版本很低，所以赶紧去官网下了一个最新的稳定版本的。卸载和安装都费了老大力了。以为光明在前面的时候，发现 npm 版本过低。更新了以后也没有用赶紧百度网上最常见的就是复制AppData\Roaming\npm\node_modules\npm下的文件到你的NodeJS...

关于安装最新版本的node后还是旧版本的解决方法

qq_64234202的博客

09-30

3092

②输入where node查询所有node的位置（有多个默认都是用第一个，所以根据提供的目录删除旧的）楼主是因为之前安装过某个软件，里面内置旧版node，卸载完就行了。③最后输入node -v查看版本，发现已经是最新版。①首先WIN + R 然后输入cmd点击确认。希望能给你提供帮助！

nodejs安装了最新版还是显示旧版问题

偷得浮生半日闲

08-13

7298

前言今天安装Angular CLI 但是由于nodejs版本太低，安装不了最版，所以，安装了最新版的nodejs，安装一路顺利，BUT，使用命令行时，显示的还是旧版问题解决既然安装涉及目录配置问题，干脆我们在原有基础上让他自动升级升级前解决 cmd输入 npm install -g npm 升级后祝你幸福送你一首歌：附图： ...

PM2服务器启动nodejs项目

LizequaNNN的博客

08-31

3015

pm2管理nodejs项目一、什么是pm2 1.1 什么是pm2？ PM2（Process Manager 2 ）是具有内置负载均衡器的Node.js应用程序的生产运行时和进程管理器。它允许您永久保持应用程序活跃，无需停机即可重新加载它们，并促进常见的Devops任务。 1.2 pm2的特性。 1.2.1 日志管理：应用程序日志保存在服务器的硬盘中~/.pm2/logs/；命令行输入：pm2 logs 1.2.2 集群模式（负载均衡）：具体取决于可用 CPU 的数量，它使用 Node.js集群模块

python logging模块一次疑似死锁的解决（其实不是）

qq_39597358的博客

03-11

2154

一直知道python在线程进程混用的时候会因为因为子进程复制父进程的锁状态而导致死锁，下面是引自https://stackoverflow.com/questions/24509650/deadlock-with-logging-multiprocess-multithread-python-script的复现代码： import multiprocessing import threading import logging import time SLEEP_TIME = 0.000001 log

利用pm2 启动node项目

wangjie33589的博客

03-19

1514

PM2 is a production process manager for Node.js applications with a built-in load balancer. It allows you to keep applications alive forever, to reload them without downtime and to facilitate common system admin tasks. PM2是一个用于Node.js应用的进程管理器，带有内置的负载均衡器。它

升级node后还是原来版本问题

weixin_30826095的博客

03-01

2700

Python 多进程与多线程混合情况下logging模块死锁问题

bingfeiqiji的博客

07-03

1773

Python 多进程与多线程混合情况下logging模块死锁问题死锁问题复现原因详解解决办法：绕过这个问题注意死锁问题复现在使用多线程与多进程混杂使用的情况下，有时启动多进程不成功，如下所示： from multiprocessing import Pool import threading import logging import os logging.basicConfig(filename='./info.log', level=logging.INFO) _logger = logging.

Python多进程，不重复

最新发布

04-23

<think>嗯，用户现在想了解如何在Python多进程编程中确保进程不重复运行。首先，我需要回顾一下之前关于锁机制的讨论。用户之前询问的是Python 3.14的锁机制，虽然3.14还未发布，但根据现有知识，线程锁如Lock和RLock是用来管理多线程中的资源竞争的。然而，多进程的情况不同，因为每个进程有独立的内存空间，线程锁在这种情况下可能不适用。接下来，用户提到了三个引用，都是关于Python多进程编程的。这些引用指出多进程适合CPU密集型任务，避免了GIL的限制，但需要处理进程间通信和同步。用户现在的问题是避免进程重复执行，也就是确保某个任务只被一个进程执行一次，或者在多进程环境中防止多个进程同时执行同一段代码。首先，我需要区分多线程和多进程的锁机制。线程锁在同一个进程内有效，而多进程情况下，每个进程有自己的内存空间，所以普通的线程锁无法跨进程工作。这时候需要使用进程间同步机制，比如multiprocessing模块提供的Lock、RLock，或者Semaphore。然后，用户的问题可能涉及到单例模式，或者确保某个初始化操作只执行一次。例如，可能需要确保一个文件只被一个进程写入，或者某个配置只加载一次。这时候，可能需要使用跨进程的锁，或者利用文件锁等其他机制。另外，用户可能想防止同一个脚本被多次启动，这时候可能需要使用进程间通信或者系统级的锁，比如使用文件锁或端口绑定来检测是否已有实例在运行。我需要考虑几种情况：一种是多进程程序中，某个任务需要只执行一次；另一种是防止同一脚本被多个进程同时运行。针对第一种情况，可以使用multiprocessing.Lock来同步不同进程，确保只有一个进程执行关键代码。对于第二种情况，可能需要系统级的锁，比如使用fcntl模块在Unix系统上创建文件锁，或者在Windows上使用msvcrt.locking。此外，还需要考虑进程间的通信机制，如共享内存、管道、队列等，但这些可能不是用户当前问题的重点。用户的核心是避免重复执行，所以重点在同步机制。可能还需要提到使用Singleton模式，但要注意在多进程中，每个进程会有自己的实例，所以需要跨进程的单例管理，可能需要借助Manager模块中的共享对象。另外，用户可能对进程池中的任务去重感兴趣，比如在进程池中提交多个任务，但希望相同的任务只执行一次。这可能需要任务队列的管理，比如使用队列去重，或者在任务分发前进行检查。总结可能的解决方案： 1. 使用multiprocessing.Lock来同步进程，确保关键代码段只被一个进程执行。 2. 使用系统级文件锁防止脚本重复运行。 3. 使用Manager模块创建共享变量来标记任务是否已执行。 4. 在进程间使用信号量（Semaphore）控制并发访问。 5. 利用数据库或外部存储来记录任务状态，实现跨进程的幂等性。需要验证这些方法的正确性。例如，multiprocessing.Lock是否真的能在不同进程间同步。查阅资料可知，multiprocessing模块提供的锁是基于操作系统原语的，确实可以跨进程同步。而线程锁threading.Lock只能在同一个进程内有效，不能跨进程。接下来，应该给出具体的代码示例，比如使用multiprocessing.Lock来保护关键代码，确保只有一个进程执行。同时，可以演示如何使用文件锁防止多实例运行。还需要注意，使用锁时要避免死锁，确保锁的获取和释放。此外，文件锁的实现可能因操作系统而异，需要处理不同平台的兼容性问题。用户可能存在的误区是认为多进程的锁和多线程的锁一样，所以需要明确说明两者的区别，强调multiprocessing模块的锁是必要的。最后，需要总结最佳实践，比如推荐使用with语句自动管理锁，或者结合超时机制防止死锁，以及在多进程环境中如何有效地避免重复执行任务。</think>### Python多进程避免重复执行的实现方法 #### 一、跨进程同步锁机制使用`multiprocessing.Lock`实现多进程间的同步控制，确保关键代码段只能被一个进程执行： ```python from multiprocessing import Process, Lock import time shared_resource = [] process_lock = Lock() # 创建跨进程锁对象 def task_process(lock, item): with lock: # 自动获取/释放锁（推荐方式） if item not in shared_resource: time.sleep(0.1) # 模拟处理延迟 shared_resource.append(item) print(f"Added {item} by PID: {os.getpid()}") if __name__ == "__main__": items = [1,2,3,2,1,4,5] processes = [] for item in items: p = Process(target=task_process, args=(process_lock, item)) processes.append(p) p.start() for p in processes: p.join() print(f"Final list: {shared_resource}") # 输出结果保证元素唯一性，如[1,2,3,4,5] ``` *该方案通过进程级锁确保资源修改的原子性[^1][^3]* #### 二、单实例进程控制使用文件锁防止程序重复启动（跨平台方案）： ```python import fcntl import sys class SingleInstance: def __init__(self, lockfile): self.lock_file = open(lockfile, 'w') try: # 非阻塞模式获取排他锁 fcntl.flock(self.lock_file, fcntl.LOCK_EX | fcntl.LOCK_NB) except IOError: print("Another instance is running") sys.exit(1) if __name__ == "__main__": lock = SingleInstance("/tmp/myapp.lock") # 主程序逻辑... ``` *该方案通过文件系统锁确保系统级单实例运行[^2]* #### 三、共享内存标记法使用`multiprocessing.Manager`创建跨进程共享数据结构： ```python from multiprocessing import Process, Manager def worker(shared_dict, key): if key not in shared_dict: # 模拟耗时操作 result = key.upper() shared_dict[key] = result print(f"Processed {key}") if __name__ == "__main__": with Manager() as manager: shared_data = manager.dict() # 进程安全字典 tasks = ['a','b','a','c','b'] processes = [] for task in tasks: p = Process(target=worker, args=(shared_data, task)) processes.append(p) p.start() for p in processes: p.join() print("Final results:", dict(shared_data)) # 输出结果保证每个键唯一处理 ``` #### 四、进程级信号量控制限制特定操作的并发数量（如数据库连接池）： ```python from multiprocessing import Semaphore, Process import random db_semaphore = Semaphore(3) # 允许3个进程同时访问 def db_operation(sem, query): with sem: print(f"Start processing {query}") time.sleep(random.uniform(1,3)) print(f"Finished {query}") if __name__ == "__main__": queries = [f"Q{i}" for i in range(10)] processes = [] for q in queries: p = Process(target=db_operation, args=(db_semaphore, q)) processes.append(p) p.start() for p in processes: p.join() ``` ### 技术选型对比表 | 方法 | 适用场景 | 优点 | 缺点 | |--------------------|--------------------------------|------------------------------|------------------------------| | 跨进程锁 | 资源访问同步 | 精确控制临界区 | 需要显式管理锁对象 | | 文件锁 | 系统级单实例运行 | 跨进程/跨程序有效 | 依赖文件系统权限 | | 共享内存结构 | 状态标记/缓存共享 | 数据结构丰富 | 需要序列化/性能损耗 | | 信号量 | 资源池管理 | 灵活控制并发量 | 需要预估资源容量 | ### 最佳实践建议 1. **优先使用上下文管理器**：`with lock`语句可自动处理锁的获取/释放，避免忘记释放锁导致死锁[^3] 2. **设置超时机制**：`lock.acquire(timeout=5)`防止无限期等待 3. **结合日志监控**：使用`logging`模块记录锁操作，便于调试 4. **压力测试验证**：通过`multiprocessing.Pool`模拟高并发场景 ```python from multiprocessing import Pool def stress_test(key): with process_lock: # 执行关键操作 return key**2 if __name__ == "__main__": with Pool(8) as p: print(p.map(stress_test, range(1000))) ```