这里写目录标题
一、脑裂原因
二、防脑裂方案
三、常见脑裂解决方案
一、脑裂原因
1、高可用服务器之间心跳线链路发生故障,导致无法正常通信。
2、心跳线坏了,包括但不限于断了,老化
3、网卡及相关驱动坏了,IP 配置及冲突问题(网卡直连)
4、心跳线之间的设备故障(网卡及交换机)
5、仲裁的机器出现问题
6、高可用服务器开启了iptables防火墙,阻止了心跳传输信息
7、高可用服务器上心跳网卡地址等信息配置不正确,导致发送心跳失败
8、心跳方式不同,心跳广播冲突,keepalive配置里同一vrrp实例如果virtual_router_id两端参数不一致,会导致脑裂
二、防脑裂方案
1、同时使用串行电缆和以太网电缆连接,同时使用两条心跳线路,一条线路断了,另外一条还是好的,依旧可以传送心跳信息
2、检查脑裂时强行关闭一个心跳节点(stonith,fence)相当于备节点接收不到心跳信息,通过单独的线路发送关机命令关闭主节点电源
3、做好脑裂监控报警
三、常见脑裂解决方案
1、如果开启防火墙,一定要让心跳信息通过,一般通过允许IP段形式解决
2、可以拉一条以太网网线和串口线作为主备节点心跳线路的冗余
3、开发检测程序通过监控软件检测脑裂
问:假如生产中发生了脑裂现象,有什么解决的办法,说一下思路