降低监控与诊断成本的框架
1. 监测基础概念
在系统监控中,为了表示可被监测的实体以及定义与收集数据的关系,引入了服务、实例和属性的概念。
- 实例 :任何连接到网络的事物,特别是系统的一个模块。实例由属性组成,这些属性可以被监测。
- 服务 :一组实例的集合。
以云计算为例,租赁的服务器中包含不同的软件程序,如数据库、Web服务器、ssh等,每个软件程序就是一个实例。而属性则代表可以应用关键绩效指标(KPI)的任何事物,例如打开会话的数量、空闲查询的数量、用户数量等。
为了定义收集数据之间的关系,引入了监测规则的概念。监测规则的公式总是可以评估为真或假。当评估为真时,表示公式没有被违反,以下两种情况会返回真:
1. 没有足够的资源来计算公式。
2. 有足够的资源来计算公式,并且使用这些参数对公式的评估为真。
监测规则的定义采用扩展巴科斯 - 诺尔范式(EBNF):
prop ::= service.(inst).op
op ::= ∼n | = n | ≤n | ≤n | ≥n | ≥n
inst ::= i.a | i.a, inst
其中, service 表示系统的任何服务, (i.a) 是一个实例及其属性 a , n ∈ IR 是一个值。
以下是监测规则的示例:
-
超级会员免费看
订阅专栏 解锁全文
1014

被折叠的 条评论
为什么被折叠?



