cat是点评开源的监控
常用监控手段:
- 按监控层次分:业务监控、应用监控和系统监控等;
- 按监控日志来源分:基于日志文件监控、基于数据库监控和基于网络监控等;
- 按监控领域分:前端监控、后端监控、全链路监控、业务间监控等;
- 按监控目标分:系统故障监控、业务指标监控、应用性能监控、用户行为监控、安全合规监控等。
按层次介绍:
业务监控:通过几个核心指标来确认业务正常
应用监控:通过监控应用运行指标来确定应用健康状况(URL\CALL\Cache\SQL等)
系统监控:监控系统的运行指标,CPU,Memory,IO
监控作用:
1:减少线上故障发现时间
2:减少线上故障定位时间
3:帮助应用程序进行优化
CAT
监控API定义往往取决于对监控或者性能分析这个领域的理解,监控和性能分析所针对的场景有如下几种:
- 一段代码的执行时间,一段代码可以是URL执行耗时,也可以是SQL的执行耗时。
- 一段代码的执行次数,比如Java抛出异常记录次数,或者一段逻辑的执行次数。
- 定期执行某段代码,比如定期上报一些核心指标:JVM内存、GC等指标。
- 关键的业务监控指标,比如监控订单数、交易额、支付成功率等。
核心监控对象:
Transaction:⼀段代码运⾏时间、次数,比如URL、Cache、SQL执⾏次数和响应时间
Problem:系统可能出现的异常,包括访问较慢的程序等
Heartbeat:JVM内部⼀些状态信息,Memory,Thread等
Dependency:系统之间实时调用数据信息,包括远程服务、数据库、缓存等
Metric:业务监控报表
Matrix:⼀个请求调用链路统计