基于 AWS 的监控与告警体系构建
1. 通知系统搭建
- 订阅确认 :首次进行相关操作时,会收到 SMS 来确认订阅。
- 集成其他服务 :若仅使用 SNS 发送重要问题的 SMS 通知,这是一个最小可行方案。若想使用功能更丰富的服务,如 PagerDuty、Opsgenie 或 VictoOps 等,只需在最后一个命令中更改订阅类型,将 SMS 替换为 HTTPS 协议,并提供服务提供商的 webhook url。
2. 应用中高错误率警报创建
- 应用设计回顾 :以 helloworld 应用为例,所有用户流量通过 ELB 实例,利用 HTTP 通信,便于识别异常情况。
- 关键指标监控 :查看负载均衡器实例的监控选项卡(http://amzn.to/2rsEaLY),可看到一些重要的顶级指标,如延迟增加或 HTTP 5XX 增多通常是需要关注服务的信号。
- 添加监控指标到模板 :
- 重新打开 troposphere 脚本
helloworld - ecs - alb - cf - template.py。 - 添加新导入:
- 重新打开 troposphere 脚本
from troposphere.cloudwatch import
超级会员免费看
订阅专栏 解锁全文

175

被折叠的 条评论
为什么被折叠?



