心跳长时间missing,导致2节点被驱逐

本文描述了当Oracle RAC集群中出现节点宕机情况时,如何进行故障排查和处理。通过停止并重启集群、检查进程、分析日志,特别是关注到CSSD日志中的网络通信警告,发现由于心跳网络问题导致节点被驱逐。最终,问题解决在于修复心跳网络故障。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

当发现一个集群其中一个节点宕机,比如+ASM2在集群里offline,immediate,要重新拉起来所要做的步骤
一、停干净当前宕机节点集群/oragrid/app/11.2.0/grid/bin/crsctl stop crs -f 
二、ps -ef |grep d.bin ----查看集群是否停干净,grep d.bin是因为有很多集群资源都是这个结尾的,例如 ohasd.bin,mdnsd.bin,gpnpd.bin等
    一直要停到只剩下grep --color=auto d.bin为止,如果发现有资源停不掉的,就kill -9 杀掉
三、试着重新启动集群,/oragrid/app/11.2.0/grid/bin/crsctl start crs
四、如果启动了,ASM起来了,把库拉起来了,需要去排除问题,是什么问题导致的
五、对于11g集群日志首先关注的是cd $ORACLE_HOME目录下的log/节点主机名/alert :/oragrid/app/11.2.0/grid/log/1618db02/alert1618db02.log
2018-11-07 15:01:09.297
[cssd(4328)]CRS-1612:Network communication with node 1618db01 (1) missing for 50% of timeout interval.  Removal of this node from cluster in 14.190 
seconds2018-11-07 15:01:09.297
[cssd(4328)]CRS-1612:Network communication with node 1618db03 (3) missing for

当MySQL集群中的一个节点丢失时,您可以采取以下步骤来解决这个问题: 1. 检查丢失节点的状态:使用以下命令检查集群中的节点状态: ```bash mysql> SHOW GLOBAL STATUS LIKE 'wsrep_cluster_size'; ``` 如果丢失的节点没有从集群中成功删除,将会显示一个较高的集群大小。这可能是因为节点只是暂时不可用,而不是永久丢失。 2. 恢复丢失节点:如果丢失的节点确实永久丢失,您可以尝试将其恢复。首先,确保该节点处于停止状态。然后,根据您的集群配置和需求,使用适当的方法来恢复节点。这可能包括重新加入节点、重新配置节点等。您可以参考MySQL官方文档或特定的集群管理工具的文档以获取更详细的指导。 3. 重新平衡集群:一旦丢失的节点被恢复或从集群中删除,您需要重新平衡集群以确保数据在所有节点之间正确分布。根据您使用的集群管理工具,可以有不同的方法和命令来执行此操作。 如果您使用的是Percona XtraDB Cluster,您可以使用`pxc_recover_node`工具来帮助重新平衡集群。例如: ```bash pxc_recover_node --node=<missing_node> --join=<existing_node> ``` 其中,`<missing_node>`是丢失的节点名称,`<existing_node>`是一个现有节点的主机名或IP地址。 如果您使用的是Galera Cluster,您可以使用`galera_recovery`工具来重新平衡集群。具体用法取决于您的集群配置,请参考该工具的文档以获取更多信息。 请注意,节点丢失可能会导致数据不一致或数据丢失的情况。在执行任何操作之前,请确保对数据进行适当的备份,并在必要时与数据库管理员或专业人士进行进一步的咨询和支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值