三、AIOps赋能——SLO和智能化结合
在SLO健康度体系建设中,存在众多基于经验或者规则的设置。例如对应用或系统的月度成功率SLO约定,设置多少认为是合理呢,99%还是99.9%?又如,利用错误预算和燃烧速率设置SLO预警的前提假设是可以把错误量均匀地分摊在时间维度上,然而对于朝夕错误量存在显著差异的场景下,该方案是否依旧有效?SLO预警方面是否可以进一步提效?如何将故障定位和SLO告警结合在一起?SLO预警的设置需要相对专业的知识,如何利用算法降低使用门槛等等。另外,我们希望借助AIOps的能力,在故障应急方面,将SLO健康度体系打造成完整的一站式应急解决方案,赋能到基础设施域内众多的运维场景。

AIOps
AIOps(Artificial Intelligence for IT Operations,智能运维)将人工智能的能力与运维相结合,通过机器学习的方法提升运维效率。AIOps属于跨领域结合的能力,需要能够理解运维场景、运用机器学习算法、构建一定的工程能力对运维数据进行分析、处理和加工,以此解决或优化传统运维中存在的难题。
经过多年不断地实践总结,我们更愿意把AIOps实践称之为一种范式,即通过结合运维场景和算法能力产出可以支撑运维决策和驱动架构演进的智能。

最低0.47元/天 解锁文章
3007

被折叠的 条评论
为什么被折叠?



