集群管理器与SAN管理器:功能、挑战与解决方案
1. 集群管理器概述
集群管理器在集群环境中扮演着至关重要的角色,它能够自动化应用程序的启动、停止和故障转移过程。其主要组成部分包括集群管理器引擎、代理、事件监控和日志服务以及集群服务。
1.1 集群管理器的工作模式
集群管理器的引擎在不同的情况下有不同的工作方式,例如加入正在运行的集群、作为首个启动的节点或者加入尚未运行的集群。当引擎成为正在运行的集群的一部分时,它会从其他节点获取当前配置数据库的副本,若其他节点未加载该数据库,则从本地存储读取。这个数据库定义了资源、代理、服务组以及各种实体之间的依赖关系,每个资源和服务组都有一系列相关属性,这些属性控制着集群管理器的行为。例如,服务组的自动启动属性会使集群管理器在有合适节点可用时立即将该服务组上线。
1.2 资源启动状态转换
当要启动一个资源时,引擎会经历一系列状态转换:
1. 调用启动代理
2. 探测报告资源处于关闭状态
3. 探测报告资源处于开启状态
4. 资源启动成功
如果资源自行启动后又关闭,状态将变为资源故障。若资源具有自动重启属性,启动代理将再次被调用。
1.3 负载均衡
严格来说,集群的负载均衡是一个性能和调优问题,而集群管理器的主要目标是提供高可用性。在应用程序未出现故障时,通常无需进行负载均衡操作。然而,当出现故障时,集群管理器会自动将服务从一个节点迁移到另一个节点。若在计算过程中不考虑负载因素,可能会导致负载不均衡,部分节点负载过重,而其他节点负载过轻。
为了解决这个问题,可以对集群管理器进
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



