集群管理器:原理、功能与应用详解
1. 代理(Agents)
代理可以编写为 shell 脚本或编译程序。集群管理器通过一组参数(参数)调用代理。例如,调用文件系统挂载代理时使用以下参数:
start share1/vol01 /mnt/fs01
代理会调用以下命令:
mount -F vxfs -o suid,log /dev/vx/dsk/share1/vol01 /mnt/fs01
可以注意到,代理为挂载命令添加了额外信息。代理在特定节点上被调用,并且预期具有局部而非集群范围的效果。对于故障转移应用程序来说,这一点很明显,因为它将在一个节点上启动,并且只有在该节点上失败(或关闭)后才会在另一个节点上启动。对于并行应用程序,代理将在要控制并行应用程序实例的每个节点上被调用。
2. 故障模式(Failure Modes)
2.1 应用程序故障(Application Failure)
如果应用程序代理的指示器开始闪烁 ↓,则假定该应用程序已失败。当然,集群管理器必须首先通过其代理成功启动该应用程序。代理的探测方法起着至关重要的作用,它必须报告应用程序的正确状态,并避免两种错误:
1. 当应用程序正在运行时报告其已关闭。
2. 当应用程序已关闭时报告其正在运行。
集群管理器可以在同一节点上或集群中的其他节点上重启失败的应用程序。
超级会员免费看
订阅专栏 解锁全文
176万+

被折叠的 条评论
为什么被折叠?



