持续交付中的监控:工具与策略
1. 监控的重要性
在当今的软件开发和运维中,监控是保障系统稳定运行的关键环节。它就像是系统的“守护者”,能够在问题出现的第一时间发出警报,帮助我们及时解决问题。过去,我们花费大量资源来预防问题,但实际上,20%的时间就能创造80%的功能,而剩下的20%功能却要花费80%的时间。通过有效的监控,我们可以快速识别问题,从而更好地应对这20%的未知情况。
2. 监控的类型
在监控领域,主要有两种类型的监控:黑盒监控和白盒监控。
2.1 黑盒监控
黑盒监控是从系统外部观察系统,无需了解系统的内部构建。它关注的是那些直接影响用户体验的指标,是系统出现问题的外部症状。常见的黑盒监控指标有:
- 延迟(Latency) :指系统响应请求所需的时间。对于HTTP服务器来说,从发送请求到服务器响应的时间就是延迟。延迟越大,用户体验越差。
- 吞吐量(Throughput) :即系统在单位时间(通常是每秒)内能够处理的请求数量。吞吐量对于容量规划至关重要,但不建议在运行的系统中实时测量,因为这会给系统带来很大负载,影响用户响应时间。一般在性能测试阶段测量吞吐量,不过这需要测试硬件与生产环境匹配,数据库数据集也与生产环境相似。由于性能测试成本较高,很多公司会使用预生产环境进行容量测试。如今,借助云基础设施的自动扩展组,这个问题得到了一定缓解。
黑盒监控指标虽然简单易懂,在错误响应时间方面起着关键作用,但可能不是问题的首要指示器。
2.2 白盒监控
白盒监控需要了解系
超级会员免费看
订阅专栏 解锁全文
1122

被折叠的 条评论
为什么被折叠?



