构建高可用 Linux 集群:Heartbeat 与 DRBD 实战指南
1. 集群故障测试与日志记录
在网络环境中,我们可以通过在 ping IP 的同时拔掉 eth0 接口来测试故障转移功能。当特定接口断开时,内核会将相关信息记录到 dmesg 和 /var/log/syslog 中。例如,拔掉 eth0 时会出现如下日志:
Feb 14 16:43:28 kickseed kernel: [ 2901.700054] eth0: link down
Feb 14 16:43:29 kickseed kernel: [ 2901.731190] bonding: bond0:
link status definitely down for interface eth0, disabling it
Feb 14 16:43:29 kickseed kernel: [ 2901.731300] bonding: bond0:
making interface eth1 the new active one.
2. 集群基础概念
即使主机采用了 RAID 和以太网绑定技术,仍有许多组件可能出现故障,如 CPU 或主机上的软件。若要确保服务在主机故障时仍能正常运行,就需要构建集群。以下是一些集群管理的基本概念:
- 浮动 IP(Floating IPs) :在标准的主动/被动 Heartbeat 集群中,每个节点(服务器)都有自己的主 IP,此外还有一个共享的浮
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



