使用Supervisor进行监控进程并实现自动重启

本文介绍了进程守护系统的作用,特别是在服务器软件遇到难以重现的严重bug时的应用。重点讲解了Supervisor,一个基于Python的进程监控工具,如何通过心跳机制监控和重启进程,以及如何在Ubuntu上安装配置Supervisor,包括编辑配置文件、设置web管理界面和守护进程的实战应用。

1.什么是进程守护系统?  

  进程守护系统,用于监控指定的进程,当发现目标进程不再正常工作时,就关闭该进程,并重启它。

  在什么情况下使用进程守护系统了?比如说,我们的某个服务器软件,在上线后出现一个严重的bug,该bug虽然很难出现,但是只要一出现,整个服务都会停掉(进程没有崩溃,只是不再提供服务)。此时,重启服务软件,又会开始正常工作。

  对于这样严重的bug,必须要查清楚并解决掉的。但是,基于以下两个原因:

  • 系统已经对用户开放,服务不能停。不可能说系统先下线,直到bug被解决掉后再重新上线。
  • bug很难重现,可能需要加日志,不断地跟踪排查,这很可能是一场持久战。

   为了让系统继续线上运行,在bug解决之前,必须要保证系统停止服务之后,能迅速重新启动恢复服务。此时,使用进程守护系统是最恰当不过的了。

   Supervisor就是为达到这一目的,实现了一个进程守护系统。一个守护者程序,可以守护同一台机器上的多个进程。Supervisor是一个基于Python开发的Linux系统上的进程监控工具。可以很方便的监听、启动、停止和重启一个或多个进程。通过 Supervisor 管理的进程,当进程意外被 Kill 时,Supervisor 会自动将它重启,可以很方便地做到进程自动恢复的目的,而无需自己编写 shell 脚本来管理进程。

 2.进程守护系统的实现及使用

   Supervisor守护者对被守护进程的管理使用的是心跳机制,其原理描述如下:

  1. 被守护进程定时向守护者报告(发送心跳),以表明自己是在正常提供服务。
  2. 如果守护者发现某个被守护进程连续一段时间都没有心跳过来,就关闭对应的进程,然后再启动对应的程序。

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值