在大并发环境下,需要对业务进程的安全性,稳定性,以及高可用性进行保护,简言之,能快速发现业务进程的 问题,并通过重启的方式完成业务的连续性。
本文所提供的方法有如下几种:
一、看门狗的方式,这一点在硬件设计中得到充分的应用,其实软件中也可以进行实现,相关的流程为:
(1) 设定一个全局变量,置值为60(可变)
(2) 启动一个看门狗线程,每隔一秒钟将该变量减1,当减至为0时,则退出程序,或触发安全检查
(3) 在其他线程里,对该变量进行自加
当然利用这个原理是也可以快速发现业务线程出现阻塞的情况,进而想法清理之。
二、建立进程同步以及共享数据机制,外部进程通过与业务进程进行周期性的通信,来证明业务进程是良好的,本部分可以采用的方法则很多,
可以利用KEEPALIVE机制,或者利用UDP的方式进行业务交互来精确识别。
三、通过外层进程对业务进层的指标采集,来发现问题,能过CPU,内存,以及线程,会话数来识别是否存在问题,另外也可以通过本方法,判断
业务进程是否非法退出,若退出,则重启。
各个方法的实现代码如下链接所示:
本文介绍在大并发环境下保障业务进程稳定性的方法,包括使用看门狗机制检测线程阻塞、进程间通信保持存活状态及外部进程监控等手段确保业务连续运行。
776

被折叠的 条评论
为什么被折叠?



