作者:禅与计算机程序设计艺术
随着云计算、微服务等新技术的发展,服务端的架构也在发生变化。传统单体架构已无法满足需求,新的服务架构要求复杂的系统架构,包括服务发现,负载均衡,熔断机制,限流保护,隔离故障等一系列组件的结合来确保服务的高可用,降低故障率。因此,自动化运维工具的引入势必会成为趋势。 而监控和日志记录对于服务可用性和可观察性是至关重要的。这里说的可用性不仅指正常运行状态下的可用性,还包括服务中断或异常时用户的体验质量、系统的响应速度,以及降低IT总部的压力。为了达到这样的目的,企业级监控系统要具备多维度的数据采集能力,从多个维度进行数据汇聚分析,以获取足够的信息用于定位问题。同时,系统还需要对所有业务关键路径上的事件产生实时的日志记录,将信息落地存储,并通过高效的方式检索和查询。
2.基本概念术语说明
2.1 概念
监控系统(Monitoring System):由一个或多个监视器模块组成,它对某些事物或系统的状态进行检测、跟踪和报警。监控系统可以对各种性能指标(例如CPU使用率、内存使用率、网络利用率)、系统资源(如磁盘空间、网络带宽)、业务指标(如订单量、营收额)、甚至组织结构(如服务器数量、部门拓扑)进行监控和报警。
日志记录:是一种记录服务运行过程中发生的事件,包括系统错误、操作消息、配置更改、安全事件、应用启动/关闭、登录信息、请求及响应等,通过统一的日志收集和管理机制,可以帮助开发人员、管理员、维护人员快速定位、解决问题。日志记录可以有效降低系统故障时间,提升系统可靠性和稳定性。
2.2 术语
- 指标 (