AWS 网络与监控:DNS、负载均衡及监控服务详解
1. DNS 故障转移测试
在创建好 DNS 记录并准备好提升脚本后,就可以测试故障转移过程了。具体步骤如下:
1. 停止主实例上的 PostgreSQL 服务,并查看 repmgr 日志文件。
2. 当 repmgr 守护进程检测到主实例故障时,会调用脚本将从实例提升为主实例。
3. 完成上述过程后,检查 Route 53 管理控制台,会发现 master.example.com 记录现在指向之前的从实例,而相应的 slave.example.com 记录已被删除。
4. 主实例上的 PostgreSQL 服务停止时,尝试连接它的客户端会开始生成错误消息。随着 DNS 更改传播到客户端,它们将开始连接到新的主实例并正常工作。
2. 流量逐步增加
在前面的过程中,通过更改主机名将流量突然从一个实例转移到另一个实例。新实例可能会因未预热缓存而不堪重负。为解决这个问题,可以使用加权资源记录集(WRRS)逐步增加流量。例如:
- 开始时将 10% 的流量发送到新的 PostgreSQL 实例,每五分钟增加 5%。
- 创建 WRRS 条目时,需要提供权重值,用于计算该记录响应客户端查询的频率。如果所有记录权重相同,流量将以轮询方式分配。
这种方法还可用于软件更新的分阶段推出,先将少量流量发送到运行新版本软件的实例,确认新版本正常工作后,再将其余流量转移过去。
3. 应对 ELB 和应用程序故障
Elastic Load Balancers 虽然可靠,但也可能出现故障。为了应对这种情况,可以使用 Route 5
超级会员免费看
订阅专栏 解锁全文
2935

被折叠的 条评论
为什么被折叠?



