应用监控与自动伸缩:CloudWatch与OpsWorks实战指南
1. 创建CloudWatch警报
在为警报创建了SNS主题后,就可以开始创建第一个CloudWatch警报了。这里以CloudFront的指标为例来创建警报,因为所有通过Web对应用程序的请求都会经过CloudFront分发。
操作步骤如下:
1. 使用服务菜单返回CloudWatch仪表板。
2. 查看左侧导航栏,在“Metrics”标题下,点击“CloudFront”,主视图将显示CloudFront分发的指标。
部分指标非常有用,例如:
| 指标 | 含义 |
| ---- | ---- |
| 4xxErrorRate | 跟踪响应状态码为400 - 499的HTTP请求百分比,通常与404(资源未找到)错误相关。少量404响应可能是用户输入错误URL或客户端请求格式不正确导致的,但如果4xx错误占比过大,就值得调查。一般认为,4xx错误率达到25%可视为一个事件。 |
| 5xxErrorRate | 代表内部服务器错误。用户不应能引发500错误,所以对500错误码的容忍阈值应远低于400错误。若为该指标创建警报,错误率大于0%时就可触发。 |
| TotalErrorRate | 接收非200 HTTP响应的请求百分比,是前两个指标的综合百分比。 |
| Requests | 统计对CloudFront分发的原始请求数量,理论上可用于识别分布式拒绝服务攻击或跟踪流量激增,但不是检测非恶意流量激增的最佳方式,因为不同请求对系统的影响不同,且很多到达CloudFront的请求(如图像请求)可能不会影响应用程序性能。 | </