AWS 监控与告警全攻略
1. 监控 EC2 实例
EC2 实例基于 AWS 控制的管理程序创建,借助管理程序,AWS 能提取多种指标并将其输入到 CloudWatch 指标中,包括 CPU 利用率、网络利用率(NetworkIn 和 NetworkOut)以及磁盘性能(DiskReadOps、DiskWriteOps、DiskReadBytes、DiskWriteBytes)。这些指标可在 EC2 控制台选择实例时查看,也能在 CloudWatch 指标菜单中找到。
默认情况下,这些指标的分辨率为 5 分钟,即每 5 分钟收集一次 EC2 实例的新数据点。若需要更高分辨率,可针对每个实例启用详细监控功能,将指标收集频率提高到 1 分钟。
然而,仅依赖管理程序指标是不够的,例如 CloudWatch 虽有磁盘性能信息,但没有剩余磁盘空间信息,因为管理程序无法访问操作系统。为获取这些信息,需在 EC2 实例上安装代理来收集额外指标。
2. 向 CloudWatch 提供自定义指标
我们将用特定于操作系统的信息来补充现有指标,包括 CPU、磁盘使用和内存的更详细信息。在浏览 EC2 指标时,可按自动扩展组查询这些指标。为使自定义指标也具备此功能,需对 CloudFormation 模板进行更改,让 EC2 实例获取自动扩展组信息。
更新 CloudFormation 模板步骤如下 :
1. 打开 nodeserver-cf-template.py 脚本。
2. 在第一个 IAM 策略后添加以下 MonitoringPol
超级会员免费看
订阅专栏 解锁全文
601

被折叠的 条评论
为什么被折叠?



